难怪美国AI的天塌了!美国上上下下当初一直以为中国只有华为团队在孤独求败,屡屡从北坡登顶珠峰,其它绝大多数公司都没啥追求,结果#中国公司DeepSeek在硅谷“出圈”#的时候却发现,中国产业界竟然又冒出了像梁文锋之类的新一代技术原教主义者!
深度求索爆红之后,各种解读都有,但被普遍肯定的是,仅用2000个GPU训练出的大模型DeepSeek,竟然将open AI、Anthropic、微软、谷歌、Meta动用2万到10万个GPU训练出的竞品大模型碾压到一夜破防。
这说明的是,深度求索即便不曾歪打正着屯了1万个英伟达GPU A100,但DeepSeek今天该爆红的照样爆红。为啥?在中国,别说求购等效2000个英伟达GPU A100,就算求购到等效10万个英伟达GPU A100,同样也没什么困难。
所以,DeepSeek碾压open AI、Anthropic、微软、谷歌、Meta竞品大模型的必然性是什么?毫无疑问,那就是深度求索别有洞天的大模型训练算法尤其是神秘莫测的工程实践。
问题来了,为什么百度、阿里、腾讯不曾想到也不曾做到的,深度求索却做到了?为什么open AI、Anthropic、微软、谷歌、Meta想都不敢想象的事,深度求索却也做到了?
好吧,不是深度求索足够幸运,而是说几乎所有的中美大厂都在做梦的时候,深度求索创始人梁文锋从一开始就不做梦了!
梁文锋称,过去三十多年IT浪潮里,我们已经习惯摩尔定律从天而降,躺在家里18个月就会出来更好的硬件和软件。如果中国人不去做技术的贡献者,那么中美之间的技术差距就永远是原创和模仿的区别。但中国不可能永远做搭便车的跟随者,需要有人站到技术的前沿。
不出所料,梁文锋领导下的深度求索,正是那个站到AI技术前沿、也拒绝搭便车的硬碰硬探索者。换句话说,深度求索的不落俗套到了不食人间烟火的地步,那么除了中午,DeepSeek早晚都得震惊世界。
显而易见,中国缺工程师团队么?不缺,中国有的是全球最庞大的工程师团队;中国缺全产业链实践么,更不缺,中国更有的是全球最完整的全产业链生态。中国唯一缺的是,重新俯瞰世界的原始自信,尤其是不追随美国技术的断然决然。毕竟,中国产业界拿来主义习惯了,拧开水龙头就出水的赚快钱模式更习惯了……
所以,DeepSeek让美国上上下下破防的时候,其真正的稀缺性,恐怕不在于一举颠覆了美国大模型技术路线,但一定在于继华为之后唤醒了中国产业界的技术自信尤其是技术自觉:原来,中国人也不只是擅长做从1到10的快速扩张和商业实践,做从0到1的硬核突破竟然也很擅长。这,大概就是美国上上下下真正恐慌的地方!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.