网易首页 > 网易号 > 正文 申请入驻

DeepSeek催人老:他们有了“炮灰”的觉悟 | 海斌访谈

0
分享至

“所有0和1我这辈子都没做,我做的全是看到美国人做了0和1,我做1×10、10×100的事。”开源中国董事长马越对第一财经表示。他认为国内的一些知名企业家做的也是类似的工作。

马越是一位在科技领域闯荡多年的老兵。DeepSeek以及人工智能的进展,让他感慨新一代的科技创业者,更可能做出从无到有的创新性工作。

人工智能正在开启大航海的时代,没有人手里有明确的航海图,但年轻创业者们更有冒险精神。“我们看现在的大模型公司,谁家的研发团队大量聘用年轻的研究员,并给予充分的授权,它的发展一定很好。如果一个厂家有太多的学界、权威、层级很多,它的研发效率多半比较慢的。”MiniMax副总裁刘华也说。

炮灰的觉悟

马越生于中国改革开放之前,既经历过中国的贫困时期,也见证过中国的经济腾飞。

尽管他是一位连续的创业者,而且在科技企业里有所成就。但他回头看自己的过往,他这一辈人从小受的教育的经历等,塑造了他的工作方式。马越自我调侃“也就这么点出息,没有想象能力”。

在科技领域,想象力与创造力紧密相关。那些科技发展历程中颠覆性的创新,比如半导体、计算机图形界面、智能手机以及大模型等,都是从美国市场上走出来的。

马越认为,一些国内知名的企业家,做出的也不是开创性的工作,而是摸着石头过河。过去二十年间,中国市场上风生水起的搜索、电商、云计算等概莫能外。

这一轮的大模型浪潮,OpenAI珠玉在前,但DeepSeek是中国创业者带来的惊奇。

DeepSeek一夜之间给美国股市造成万亿美元的蒸发。它以史上最快的速度触达了上亿用户,B端的企业投入开源模型的怀抱。它也改变了很多大模型企业的发展道路。

OpenAI在考虑某种形式的开源,百度也摒弃闭源道路,转而选择开源其最新的大模型产品。

一些初创型科技企业,此前融资数亿,购买算力卡,训练自己的模型,在尚未成功之际发现DeepSeek以一种更具性价比的方式实现了更优的模型性能。关键是,DeepSeek开源,任何企业都可以学习模仿,并在此基础上二次开发。

大模型公司的估值和融资机会,因此受到DeepSeek的压制。

“过去的估值都建立在做这件事必须投大钱的基础上,因为起手的目标融资10亿美金,你不给我100亿美金估值都不行。”一家投资机构的合伙人认为,现在融资会变得更难了,“大家觉得你不需要几十亿美金,10亿美金是不是就行了,几亿美金是不是也能干得不错。”

科技创新的代价一直很高。一些大模型企业此前为研发、预训练而做的巨大投资,面临迅速贬值。

“中国本身这种沉没成本就是巨高。”马越说:“今天的积累都是给年轻人做土壤,我们变成炮灰。产业烧了几百亿,可能最终成就的是DeepSeek这样的公司。没有一点问题,我乐见其成。”

OpenAI没有出现在谷歌,也不是诞生于亚马逊。DeepSeek并非产生于腾讯或者阿里巴巴。

马越认为,颠覆式的创新,大厂很难。国内大厂习惯了拿来主义的路径依赖,内部是职业经理人的思维,“我完成 KPI还不简单,写PPT就完了,我跟自己较什么劲?彻底的创新这件事儿,大厂员工背着免责盾牌搞创新,拳头根本挥不开。”

新一代的科技创业者,更可能做出0-1的、从无到有的创新性工作。

“至少比我们这代人靠谱得多了。”马越表示:“因为我们穷,没想象力。年轻人现在不应该这样了。”

大模型创新靠谁

中国大模型向前发展,推动力是什么?

“我们认为依赖于高度组织化精细化的研发团队,它绝对不仅仅依赖于学界权威、院士、教授、博导。”刘华说。

MiniMax是大模型六小虎之一,它的产品已经开始落地海外20多个国家,是中国地域覆盖范围最广的大模型开放平台。

2017年,谷歌几位员工提出Transformer架构。大模型刚出现的时候,是以Transformer为底层架构的稠密模型。但是经过八年发展,企业界认为Transformer碰到了它的瓶颈。现在企业在探索非Transformer架构,稠密模型已经被逐渐放弃,MoE(混合专家模型)成了共同的选择。

“Transformer处理任务的长度跟它的算力消耗程度是成平方的关系。比如我现在处理100Token任务的算力消耗是一个恒定值。如果处理10000Token的任务,处理的任务增加100倍,算力消耗要增加100的平方,一万倍。”刘华说。

随着多模态的发展,大模型处理Token的规模远不止百倍增长,将来可能是万倍。大模型解决超长文本处理能力,需要研发新的模型底层架构,MiniMax选择的是线性注意力机制,其新一代的MiniMax-01模型,可以做到基本性能和GPT4o、Claude3.5齐平,但是能够处理400万Token的长文本,是4o和Claude3.5的20倍、30倍。

MiniMax在2023年拥抱MoE架构。大模型研发的底层框架迭代,MiniMax的经验是,要去聘用年轻的研究员,给予充分的授权,让他们敢于尝试新的思路,让他们用充沛的算力做大量的实验,才可以敏锐地捕捉到大模型迭代的方向。

刘华表示:“现在的大模型公司,如果谁家的研发团队是大量聘用年轻的研究员,并给予充分的授权,它的发展一定很好。如果一个厂家有太多的学界权威、层级很多,它的研发效率多半是比较慢的。”

马越认为,中国传统文化里缺少对年轻人的尊敬,更不必提敬畏了。老一辈的人都是基于功利主义,而年轻人的价值观跟过去不一样了。

“DeepSeek是一个年轻的团队打造的,少年强则中国强。我们这种年过半百的封建残余,满脑子的旧认知,一天到晚吹牛也好,抱大腿也好。”马越说,“你得有觉悟,我们这一辈子到今天是给年轻人当梯子的。”

人工智能拉开了一个大航海的时代,年轻人是更好的冒险者。

“新大陆在哪儿,我们不知道,每条海岸线都是迷雾。所有的旧认知都没价值,我们没有罗盘,也不知道自己的方向在哪里,也不知道终点在哪里,所以它才有意思。”马越表示。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
滴滴把“判责后台”搬到台前,网约车真的要打价值战了!

滴滴把“判责后台”搬到台前,网约车真的要打价值战了!

牲产队
2026-06-02 16:54:44
新能源车市回暖 特斯拉销量接近8.6万

新能源车市回暖 特斯拉销量接近8.6万

财闻
2026-06-02 19:21:11
九号上架两款72V铅酸,定价950元起

九号上架两款72V铅酸,定价950元起

碳基打工人
2026-06-02 16:50:18
扎心的现象:很多中国男人已经养不起家了,无数普通顶梁柱被压垮

扎心的现象:很多中国男人已经养不起家了,无数普通顶梁柱被压垮

捣蛋窝
2026-04-28 11:29:00
杉杉股份经营陷困境回购后又减持赚40%差价 大股东和高管大比例质押和减持

杉杉股份经营陷困境回购后又减持赚40%差价 大股东和高管大比例质押和减持

新浪财经
2026-06-03 18:09:10
尾灯开裂,小米SU7车主陷入维权僵局

尾灯开裂,小米SU7车主陷入维权僵局

ZAKER新闻
2026-06-01 14:46:40
不给弟弟吃你等着!全网最不吃压力姐姐,淡定反击母亲,太解气了

不给弟弟吃你等着!全网最不吃压力姐姐,淡定反击母亲,太解气了

林林先生
2026-06-02 09:30:07
132亿砸出深圳最大高铁站!4年后竣工,北站“老大”地位不保?

132亿砸出深圳最大高铁站!4年后竣工,北站“老大”地位不保?

科学发掘
2026-06-02 16:28:25
魏宗万女儿透露父亲去世细节:常年疾病积累,走时最放心不下老伴

魏宗万女儿透露父亲去世细节:常年疾病积累,走时最放心不下老伴

乡野小珥
2026-06-03 12:00:31
你划你的海域分界线,中国不承认,就是废纸一张!

你划你的海域分界线,中国不承认,就是废纸一张!

阿龙聊军事
2026-05-31 11:05:49
我定居日本20年,娶过3个妻子,发现日本的女人都有一个共同特点

我定居日本20年,娶过3个妻子,发现日本的女人都有一个共同特点

千秋文化
2026-05-20 20:33:05
中国运-15再曝试飞图!灰色涂装加新发动机,这次真快了

中国运-15再曝试飞图!灰色涂装加新发动机,这次真快了

瞩望云霄
2026-06-03 18:35:24
​中美俄石油储量比较:俄800亿桶,美国超700亿桶,中国有多少?

​中美俄石油储量比较:俄800亿桶,美国超700亿桶,中国有多少?

锅锅爱历史
2026-06-03 04:58:42
他达拉非立大功!研究发现:中老年吃他达拉非,改善5类难言之隐

他达拉非立大功!研究发现:中老年吃他达拉非,改善5类难言之隐

医学科普汇
2026-06-03 17:10:16
白酒最怕的解药,不是茶水,而是常见的它,三分钟快速解酒!

白酒最怕的解药,不是茶水,而是常见的它,三分钟快速解酒!

展望云霄
2026-05-18 22:30:18
中国海警巡航台岛时,两岸军机激烈对峙!大陆对“台独”称呼变了

中国海警巡航台岛时,两岸军机激烈对峙!大陆对“台独”称呼变了

小小科普员
2026-06-03 13:34:15
奚梦瑶法国大婚刷屏,赵丽颖提前离场!如果豪门有HR,谁会被留任

奚梦瑶法国大婚刷屏,赵丽颖提前离场!如果豪门有HR,谁会被留任

阿废冷眼观察所
2026-06-03 08:21:44
中方驱逐美记者后,美吊销新华社记者许可

中方驱逐美记者后,美吊销新华社记者许可

风雨与阳光
2026-06-03 13:17:23
毛主席接见忽必烈后裔,对方临别赠一言,毛主席:我一定记在心里

毛主席接见忽必烈后裔,对方临别赠一言,毛主席:我一定记在心里

芊芊子吟
2026-06-03 07:15:06
上海为何把最贵的空间,留给了普通人?

上海为何把最贵的空间,留给了普通人?

城市研究室
2026-06-02 15:37:16
2026-06-03 19:16:49
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
255095文章数 622604关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

网友花120万在直播间买原石 警方:30人拼单29个是托

头条要闻

网友花120万在直播间买原石 警方:30人拼单29个是托

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

家居
房产
手机
数码
艺术

家居要闻

江畔轻奢 观云大宅

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

手机要闻

世界杯观赛神器 vivo Y600 Turbo看球无压力

数码要闻

618淘宝百亿补贴上线手机家电加补专场 空调价格降到千元大关

艺术要闻

二十年前割麦的场景

无障碍浏览 进入关怀版