网易首页 > 网易号 > 正文 申请入驻

DeepSeek催人老:他们有了“炮灰”的觉悟 | 海斌访谈

0
分享至

“所有0和1我这辈子都没做,我做的全是看到美国人做了0和1,我做1×10、10×100的事。”开源中国董事长马越对第一财经表示。他认为国内的一些知名企业家做的也是类似的工作。

马越是一位在科技领域闯荡多年的老兵。DeepSeek以及人工智能的进展,让他感慨新一代的科技创业者,更可能做出从无到有的创新性工作。

人工智能正在开启大航海的时代,没有人手里有明确的航海图,但年轻创业者们更有冒险精神。“我们看现在的大模型公司,谁家的研发团队大量聘用年轻的研究员,并给予充分的授权,它的发展一定很好。如果一个厂家有太多的学界、权威、层级很多,它的研发效率多半比较慢的。”MiniMax副总裁刘华也说。

炮灰的觉悟

马越生于中国改革开放之前,既经历过中国的贫困时期,也见证过中国的经济腾飞。

尽管他是一位连续的创业者,而且在科技企业里有所成就。但他回头看自己的过往,他这一辈人从小受的教育的经历等,塑造了他的工作方式。马越自我调侃“也就这么点出息,没有想象能力”。

在科技领域,想象力与创造力紧密相关。那些科技发展历程中颠覆性的创新,比如半导体、计算机图形界面、智能手机以及大模型等,都是从美国市场上走出来的。

马越认为,一些国内知名的企业家,做出的也不是开创性的工作,而是摸着石头过河。过去二十年间,中国市场上风生水起的搜索、电商、云计算等概莫能外。

这一轮的大模型浪潮,OpenAI珠玉在前,但DeepSeek是中国创业者带来的惊奇。

DeepSeek一夜之间给美国股市造成万亿美元的蒸发。它以史上最快的速度触达了上亿用户,B端的企业投入开源模型的怀抱。它也改变了很多大模型企业的发展道路。

OpenAI在考虑某种形式的开源,百度也摒弃闭源道路,转而选择开源其最新的大模型产品。

一些初创型科技企业,此前融资数亿,购买算力卡,训练自己的模型,在尚未成功之际发现DeepSeek以一种更具性价比的方式实现了更优的模型性能。关键是,DeepSeek开源,任何企业都可以学习模仿,并在此基础上二次开发。

大模型公司的估值和融资机会,因此受到DeepSeek的压制。

“过去的估值都建立在做这件事必须投大钱的基础上,因为起手的目标融资10亿美金,你不给我100亿美金估值都不行。”一家投资机构的合伙人认为,现在融资会变得更难了,“大家觉得你不需要几十亿美金,10亿美金是不是就行了,几亿美金是不是也能干得不错。”

科技创新的代价一直很高。一些大模型企业此前为研发、预训练而做的巨大投资,面临迅速贬值。

“中国本身这种沉没成本就是巨高。”马越说:“今天的积累都是给年轻人做土壤,我们变成炮灰。产业烧了几百亿,可能最终成就的是DeepSeek这样的公司。没有一点问题,我乐见其成。”

OpenAI没有出现在谷歌,也不是诞生于亚马逊。DeepSeek并非产生于腾讯或者阿里巴巴。

马越认为,颠覆式的创新,大厂很难。国内大厂习惯了拿来主义的路径依赖,内部是职业经理人的思维,“我完成 KPI还不简单,写PPT就完了,我跟自己较什么劲?彻底的创新这件事儿,大厂员工背着免责盾牌搞创新,拳头根本挥不开。”

新一代的科技创业者,更可能做出0-1的、从无到有的创新性工作。

“至少比我们这代人靠谱得多了。”马越表示:“因为我们穷,没想象力。年轻人现在不应该这样了。”

大模型创新靠谁

中国大模型向前发展,推动力是什么?

“我们认为依赖于高度组织化精细化的研发团队,它绝对不仅仅依赖于学界权威、院士、教授、博导。”刘华说。

MiniMax是大模型六小虎之一,它的产品已经开始落地海外20多个国家,是中国地域覆盖范围最广的大模型开放平台。

2017年,谷歌几位员工提出Transformer架构。大模型刚出现的时候,是以Transformer为底层架构的稠密模型。但是经过八年发展,企业界认为Transformer碰到了它的瓶颈。现在企业在探索非Transformer架构,稠密模型已经被逐渐放弃,MoE(混合专家模型)成了共同的选择。

“Transformer处理任务的长度跟它的算力消耗程度是成平方的关系。比如我现在处理100Token任务的算力消耗是一个恒定值。如果处理10000Token的任务,处理的任务增加100倍,算力消耗要增加100的平方,一万倍。”刘华说。

随着多模态的发展,大模型处理Token的规模远不止百倍增长,将来可能是万倍。大模型解决超长文本处理能力,需要研发新的模型底层架构,MiniMax选择的是线性注意力机制,其新一代的MiniMax-01模型,可以做到基本性能和GPT4o、Claude3.5齐平,但是能够处理400万Token的长文本,是4o和Claude3.5的20倍、30倍。

MiniMax在2023年拥抱MoE架构。大模型研发的底层框架迭代,MiniMax的经验是,要去聘用年轻的研究员,给予充分的授权,让他们敢于尝试新的思路,让他们用充沛的算力做大量的实验,才可以敏锐地捕捉到大模型迭代的方向。

刘华表示:“现在的大模型公司,如果谁家的研发团队是大量聘用年轻的研究员,并给予充分的授权,它的发展一定很好。如果一个厂家有太多的学界权威、层级很多,它的研发效率多半是比较慢的。”

马越认为,中国传统文化里缺少对年轻人的尊敬,更不必提敬畏了。老一辈的人都是基于功利主义,而年轻人的价值观跟过去不一样了。

“DeepSeek是一个年轻的团队打造的,少年强则中国强。我们这种年过半百的封建残余,满脑子的旧认知,一天到晚吹牛也好,抱大腿也好。”马越说,“你得有觉悟,我们这一辈子到今天是给年轻人当梯子的。”

人工智能拉开了一个大航海的时代,年轻人是更好的冒险者。

“新大陆在哪儿,我们不知道,每条海岸线都是迷雾。所有的旧认知都没价值,我们没有罗盘,也不知道自己的方向在哪里,也不知道终点在哪里,所以它才有意思。”马越表示。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
毛主席问卫立煌:驴是先迈左脚还是右脚?卫起先不懂,后猛然醒悟

毛主席问卫立煌:驴是先迈左脚还是右脚?卫起先不懂,后猛然醒悟

南书房
2026-02-19 13:15:03
周星驰、陈思诚、贾玲和《澎湖海战》,为什么都退出了春节档?

周星驰、陈思诚、贾玲和《澎湖海战》,为什么都退出了春节档?

阿废冷眼观察所
2026-02-17 18:39:21
再见成龙,再见了李连杰,再见了甄子丹,中国武侠电影迎来新时代

再见成龙,再见了李连杰,再见了甄子丹,中国武侠电影迎来新时代

漫婷侃娱乐
2026-02-20 09:48:42
邓超春晚结束后,立马邀请迟蓬到家中做客,迟蓬的回复让人笑翻

邓超春晚结束后,立马邀请迟蓬到家中做客,迟蓬的回复让人笑翻

老吴教育课堂
2026-02-20 07:47:23
继续涨涨涨!2026年2月17日 - 飞天茅台和生肖酒每日行情价格

继续涨涨涨!2026年2月17日 - 飞天茅台和生肖酒每日行情价格

时尚的弄潮
2026-02-18 15:13:28
春晚小品《血压计》让我脊背发凉,为什么拿医生职业操守调侃?

春晚小品《血压计》让我脊背发凉,为什么拿医生职业操守调侃?

可乐谈情感
2026-02-19 20:54:38
陈丽君调侃谢霆锋:能不能送几张演唱会门票?谢霆锋回复超好笑

陈丽君调侃谢霆锋:能不能送几张演唱会门票?谢霆锋回复超好笑

娱最资讯
2026-02-20 07:12:31
1980年,纪登奎为何要主动请辞?陈云:他留任对党的形象不利

1980年,纪登奎为何要主动请辞?陈云:他留任对党的形象不利

阿校谈史
2026-02-19 23:12:07
高市挑衅再敲警钟!中国史上最大误判之一就是:总习惯性低估日本

高市挑衅再敲警钟!中国史上最大误判之一就是:总习惯性低估日本

不似少年游
2026-02-20 07:22:48
亚马逊成全球营收最高企业,终结沃尔玛13年《财富》500强霸榜

亚马逊成全球营收最高企业,终结沃尔玛13年《财富》500强霸榜

IT之家
2026-02-19 21:20:45
东海航空那事五周年了:到底是什么导致了“不予起诉”

东海航空那事五周年了:到底是什么导致了“不予起诉”

民航大脑壳
2026-02-20 08:05:03
李在明手段果然狠辣,当着5000万韩国人的面,宣告尹锡悦最终结局

李在明手段果然狠辣,当着5000万韩国人的面,宣告尹锡悦最终结局

我心纵横天地间
2026-02-19 23:00:23
“中国人滚出蒙古!”为何外蒙古对中国人充满敌意

“中国人滚出蒙古!”为何外蒙古对中国人充满敌意

南权先生
2025-09-16 10:02:18
华为外网“闯大祸”!全网吵翻了1

华为外网“闯大祸”!全网吵翻了1

李东阳朋友圈
2026-02-20 08:23:36
38岁杨玏搬回爹家,800万别墅落灰,想靠岸的年纪遇上了扬帆的她

38岁杨玏搬回爹家,800万别墅落灰,想靠岸的年纪遇上了扬帆的她

娱乐的硬糖吖
2026-02-19 18:01:49
易梦玲一双金灿灿的大灯,明艳晃眼

易梦玲一双金灿灿的大灯,明艳晃眼

吃瓜党二号头目
2026-02-13 08:13:30
女生主动起来有多黏人?网友:这些女的太开放了

女生主动起来有多黏人?网友:这些女的太开放了

带你感受人间冷暖
2026-01-27 00:20:06
固态电池商业化落地!北汽首批固态电池出租车北京城区投运

固态电池商业化落地!北汽首批固态电池出租车北京城区投运

沙雕小琳琳
2026-02-20 07:03:12
“延迟满足”更易成功?那是骗你的

“延迟满足”更易成功?那是骗你的

老端的观点
2026-02-19 21:50:56
宁波一男子除夕夜报警,称开车时不小心撞到花坛和指示牌,结果因涉嫌危险驾驶罪被拘!

宁波一男子除夕夜报警,称开车时不小心撞到花坛和指示牌,结果因涉嫌危险驾驶罪被拘!

环球网资讯
2026-02-19 15:09:15
2026-02-20 10:43:00
第一财经资讯 incentive-icons
第一财经资讯
第一财经官方账号
244594文章数 621538关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

法国:欧委会派员参加所谓"和平委员会"会议未获授权

头条要闻

法国:欧委会派员参加所谓"和平委员会"会议未获授权

体育要闻

宁忠岩4年从第7到摘金,刷新奥运纪录

娱乐要闻

霍启山恋情再添实锤 和娜然同游意大利

财经要闻

太疯狂!“顾客不问价直接出手”

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

本地
家居
旅游
手机
公开课

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

家居要闻

本真栖居 爱暖伴流年

旅游要闻

河北唐山:灯火璀璨耀老街 民俗欢腾迎八方客

手机要闻

苹果手机壳专利让iPhone/iPad直连卫星群:能救命,还能刷网页

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版