网易首页 > 网易号 > 正文 申请入驻

小米语音首席科学家:AI发展的本质像生物进化,不开源要慢1000倍

0
分享至

来源:市场资讯

(来源:量子位)

从生物进化的漫长历程到AI技术的疯狂迭代,两者遵循着惊人相似的底层逻辑。

在探寻下一代AI架构的关键时刻,著名的“Kaldi之父”、小米集团首席语音科学家、IEEE FellowDaniel Povey提出:

在本次量子位MEET2026智能未来大会上,他也将开源视为AI进化的核心加速器——

若没有开源,行业的进化速度恐怕要慢上一千倍;正是因为有了开源,技术才能像生物适应新环境一样,经历“长期停滞+瞬间爆发”的非线性跃迁。


至于如何在未来的竞争中生存,在他看来,大公司最明智的策略是“两条腿走路”——

一边利用Transformer赋能当下的产品,一边保留资源探索未知,赌中下一个颠覆世界的机会。

为了完整体现Daniel Povey的思考,在不改变原意的基础上,量子位对演讲内容进行了翻译和编辑整理,希望能给你带来更多启发。

MEET2026智能未来大会是由量子位主办的行业峰会,近30位产业代表与会讨论。线下参会观众近1500人,线上直播观众350万+,获得了主流媒体的广泛关注与报道。


以下为Daniel Povey演讲原文中译本

大家好,今天我想和大家分享一些关于“进化”和“AI”的思考,以及我们如何从生物演化中汲取关于AI未来的启示。我将主要从科研和模型本身的角度解读这个问题。

人们设计AI“配方”的过程,本质上主要还是一个不断试错的过程。

当人们有了新的理解,就会发表许多富含公式的论文,但其中99%的内容都没什么真正可操作的价值,最后能落地的通常只是“配方”本身。

所以设计AI“配方”的基本流程就是尝试不同变体,然后筛选出有效的进行发布,别人再照着做。


这其实和生物进化非常相似。

在生物进化中,进化过程也会和外部环境相互影响,例如地球上的进化会受到太阳辐射变化、大气成分变化的影响,而生命本身也会反过来影响这些环境因素,比如改变大气成分。

AI的进化也是如此,可能会受到硬件、数据等资源的限制;同时,AI也会通过商业效应、群体行为效应反作用于这些外部条件。

在历史上,生物进化甚至曾经多次“破坏”自身的生存环境,例如“大氧化事件”(Great Oxygenation Event),不过最终生命又从中恢复了过来。

(注:大氧化事件是指约26亿年前,大气中的游离氧含量突然增加的事件,其具体原因不明。该事件使地球上矿物的成分发生了变化,也使得日后动物的出现成为了可能。)


生物学中“世代间隔”(Generation time)类比到AI,就是复制一个新想法所需的时间,通常这个时间会持续数个月。

因为当你有了新的发现,往往要先写论文,而且一般是写完才对外公开,有些期刊甚至规定发表前不能先上传arXiv之类的预印本。

过去这样的周期可能需要大概两年,但现在可能缩短到了六个月

现在,有了PyTorch这样的工具,人们可以近乎完美地复现他人发布的“配方”。

当然,有时人们可能只给出了描述(而没有代码),这会使得复现过程稍慢一些,但整体上,代际周期的长短决定了进化的快慢。

就像世代间隔漫长的大型生物,往往进化缓慢;而那些能够快速繁衍的小型生物,进化速度则要快得多。


在自然界的进化中,往往存在一种“停停走走”的节奏,很长一段时间里几乎没有什么动静,随后突然发生剧变。

对于自然界的物种来说,这种变化通常是由迁移到新环境所导致的;但偶尔,它也源于生命“解锁”了某种新事物,比如光合作用演化出来时,整个进化的节奏便迅速发生了改变。

我从事AI领域大概有30年了,特别是在语音领域,也经历过长时间没有太大进展的阶段,当时我们甚至以为“这就是终点”。

当年我们做高斯混合模型、判别式训练时,以为语音识别的最终形态就是那样了,没人能想象未来的改变。所以也许十年后,也会出现今天谁都无法想象的全新模型。

AI的发展中,不同任务之间的相互作用非常重要,比如视觉领域的新方法,后来可能会用于语音、语言等任务。


最近一个典型例子就是Transformers,它最初是专门为语言模型设计的,后来却在各种任务中大放异彩。

在进化中也是如此,海豚绝无可能仅在海洋里就进化成型,因为它那些呼吸空气的机能,原本是为了适应陆地生活才演化出来的。但当它重返海洋后,却成了最成功的顶级捕食者。

这说明,有时候你确实需要暂时去做一些截然不同的事情,最终才能在原本的目标上取得成功

当然,拿生物进化做类比也有局限性。毕竟我们可以主动去理解事物,可以利用数学推导,或者改进可视化和调试工具,从而加速技术的发展。


此外,提速也非常关键。实验跑得越快,进化的迭代就越快,这对研究价值巨大。

而在这一点上,开源起到了至关重要的作用。

如果每家公司都得自己从头重复造轮子,研究速度恐怕要慢上一千倍。

我们可以设想一个平行世界,如果大公司决定不开源PyTorch,我也没有开源Kaldi项目,那AI研发的局面会很不相同。

不过,不开源在某些行业确实是常态,尤其是涉及实体工程的领域,因为开发一款工具往往极其昂贵,可能要砸出数百万美元,所以没人会把他们的模型开源出来。

其实,2012年我之所以离开工业界,就是因为这个问题。当时的大公司普遍对开源都不怎么感冒,所以我转去学术界待了一段时间。

但如今很多公司都开始拥抱开源了,像小米就非常支持我的工作,也支持开源,所以我又回到了工业界。

回到关于进化的比喻,我刚才吐槽过论文中的那些数学理论往往不够具体,没法落地。那么,我们到底能从中能学到什么实实在在的东西呢?

有一点很关键,那就是我们需要在各种不同的任务上不断探索新思路。

因为在进化这件事上,很难预判哪种生物最终会胜出。就像啮齿类动物,起初可能只是为了吃竹子种子这种极具体的目的而进化的。

但结果谁曾想,这反而让它们演化出了一种极强的“通才”式生存能力,最终遍布全球、无所不能。

可在当时,谁能想到吃竹子种子这事儿能带来这么大的突破呢?这种事真的太难预测了。

所以说,关键就在于要多尝试不同的任务,因为我们为了突破某个任务特有限制研发出的解决方案,可能最后会被证明具有极高的通用价值。


我们需要关注进化过程中“通才”与“专才”之间的权衡,我并非要分出孰优孰劣,但是从长远来看,不同的进化策略能够适应不同的环境——

如果环境长期稳定,自然界往往会涌现出大量像熊猫这样的“专才”,它们虽然只吃一种食物,却能做到极致适应;

可一旦环境变得动荡多变,像老鼠这种适应力极强的“通才”往往更具生存优势。

所以,这两种生存策略很可能是缺一不可的。

对于AI而言,我们应该让模型在多个不同的生态位里同时演进,这就像自然界在不同环境中进行的进化一样。毕竟,每个物种通常都有其最适应的特定生存空间。

如果我们能同时保留多种不同的技术路线,说不定其中某一条在经过进一步打磨后,就能带来巨大的回报。但这事儿很难提前预判,没人知道眼下哪个模型会在未来称王。

出于同样的理由,我们也应该维持模型架构的多样性。这就像大自然保留了丰富多样的物种一样,因为我们根本无法确定,到底哪一种架构会孕育出下一轮的重大突破。

在我看来,大多数大型机构采取两头并重的策略是比较明智的——既要沿用像Transformer等当前最顶尖的成熟模型,同时也得投入一些资源去做探索性研究,去寻找下一个技术突破口。

在我看来,Transformer这种技术领域的竞争现状,就像是“抢椅子”——只要音乐还在响,你就得跟着一直跳。

毕竟在Transformer和LLM依然称霸的当下,任何一家公司都绝无可能把身家性命都押在别的路线上。

但大家心里也都清楚,音乐迟早有停下来的那一天。

所以,小米在LLM上的研究主线很明确,那就是利用SOTA级别的AI和大模型技术,去全方位赋能我们的“人车家全生态”。

我个人其实并没有深度参与这些工作,因为我和团队主要负责的是探索性研究。我们尝试了大量不同的方向,就是希望能找到能产生巨大影响的成果,但这事的成功率向来极低。

回首我的整个研究生涯,尝试过的点子恐怕得有上万个。现在回头看,其中有一两个如果当时我能推广得再好一点,说不定真能成为颠覆性的技术。

比如,早在大家连BatchNorm都还没开始用的时候,我们组其实就已经设计出了一种类似于LayerNorm的归一化模块。

但我也不想像Jürgen Schmidhuber那样说“我在所有人之前发明了一切”。

(注:Jurgen Schmidhuber是著名计算机科学家、LSTM之父,喜欢在AI领域出现新成果时发表文章或评论,列举自己上世纪的论文,表示“这个东西我几十年前就发明过了”。)

因为作为一名研究人员,有责任去判断哪些是有价值的想法,并对其进行妥善推广。如果你没做到,那就得承认是自己的失误。

言归正传,我的团队目前正在研发一种针对语音的新模型架构,叫Zapformer,是一个通用声音基座。

相较于我们去年推出的Zipformer而言,Zapformer实现了三大跨越:

我不想把话说太满,说它就是“下一个大热门”,但它确实包含了不少有意思的想法。

当然,我们希望能押中下一个“大杀器”,但这事儿谁也没法打包票。

所有这些成果全都是开源的,因为我是开源的坚定信徒。除了我的项目,小米还有很多其他的开源项目。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北京男篮赛季首败,赵睿22+9孤掌难鸣,3外援全哑火 替补缺得分手

北京男篮赛季首败,赵睿22+9孤掌难鸣,3外援全哑火 替补缺得分手

替补席看球
2025-12-30 21:41:04
广东最低-4°C!较强冷空气,要来了

广东最低-4°C!较强冷空气,要来了

南方都市报
2025-12-30 18:23:16
8小时鏖战,阿根廷46票赞成1票弃权,官员集体倒戈,米莱闯关成功

8小时鏖战,阿根廷46票赞成1票弃权,官员集体倒戈,米莱闯关成功

顾史
2025-12-30 16:18:19
流浪狗每天假装有家,饭店老板识破伪装后,给了它一个真正的家

流浪狗每天假装有家,饭店老板识破伪装后,给了它一个真正的家

Magic宠物社
2025-12-27 15:35:03
江西省南昌市委原常委、市政府原常务副市长胡晓海被“双开”

江西省南昌市委原常委、市政府原常务副市长胡晓海被“双开”

界面新闻
2025-12-30 19:03:31
45岁富哥“北京肖哥”去世,前一天还晒老婆,死因曝光仇人都惋惜

45岁富哥“北京肖哥”去世,前一天还晒老婆,死因曝光仇人都惋惜

丹妮观
2025-12-30 14:35:18
马筱梅直播爆大瓜:大S竟然为了学习韩国,让保姆和孩子睡地上!

马筱梅直播爆大瓜:大S竟然为了学习韩国,让保姆和孩子睡地上!

乐悠悠娱乐
2025-12-30 10:13:15
穆雷谈约基奇受伤:永远不愿看到这种事发生 他是球队的一切

穆雷谈约基奇受伤:永远不愿看到这种事发生 他是球队的一切

北青网-北京青年报
2025-12-30 16:55:20
重磅!波兰空军正式下场协助乌军防空,迎战俄来袭目标

重磅!波兰空军正式下场协助乌军防空,迎战俄来袭目标

史政先锋
2025-12-29 20:59:02
雪瑞姑姑终于不忍:回应人设崩塌, 直言确实有团队 儿子身份不一般

雪瑞姑姑终于不忍:回应人设崩塌, 直言确实有团队 儿子身份不一般

小椰的奶奶
2025-12-30 11:08:30
家长我劝你别太离谱!笑死了,盘点学生家长群的那些搞笑事

家长我劝你别太离谱!笑死了,盘点学生家长群的那些搞笑事

另子维爱读史
2025-12-29 18:11:27
明年汽车“国补”调整为按比例补贴:购新能源车最高补12%

明年汽车“国补”调整为按比例补贴:购新能源车最高补12%

澎湃新闻
2025-12-30 20:54:30
韩媒:中国即将创下全球汽车工业历史上未曾有过的纪录!

韩媒:中国即将创下全球汽车工业历史上未曾有过的纪录!

达文西看世界
2025-12-30 19:28:54
王艳与儿子布置家居迎接新,球球长相随妈妈秀气,不像是体育生

王艳与儿子布置家居迎接新,球球长相随妈妈秀气,不像是体育生

笑饮孤鸿非
2025-12-30 07:37:54
12月30日俄乌:精心包装的谎言,远比不上泽连斯基的睿智

12月30日俄乌:精心包装的谎言,远比不上泽连斯基的睿智

山河路口
2025-12-30 17:48:08
36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

36年前陈宝国主演的盗墓恐怖片!尺度大到少儿不宜

释凡电影
2025-08-14 09:33:19
伊朗兑美元汇率暴跌至145万!持续爆发大规模抗议

伊朗兑美元汇率暴跌至145万!持续爆发大规模抗议

项鹏飞
2025-12-30 19:36:00
如果已经写不出打动人的新年献词,就不必再勉强写下去

如果已经写不出打动人的新年献词,就不必再勉强写下去

呦呦鹿鸣
2025-12-29 22:57:28
记者:蒙哥马利将出任国安新帅,预计协议将在48小时内敲定

记者:蒙哥马利将出任国安新帅,预计协议将在48小时内敲定

懂球帝
2025-12-30 21:00:12
一顿饭11个菜,客厅大得能打球,哭穷的闫学晶害惨“啃老”的儿子

一顿饭11个菜,客厅大得能打球,哭穷的闫学晶害惨“啃老”的儿子

翰飞观事
2025-12-30 11:56:38
2025-12-30 22:56:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1867719文章数 5110关注度
往期回顾 全部

科技要闻

估值150亿的智元,开始批量"制造"小独角兽

头条要闻

男子结识年长十岁已婚女友 为和她约会欠下20万网贷

头条要闻

男子结识年长十岁已婚女友 为和她约会欠下20万网贷

体育要闻

联盟第一人倒下了!掘金还有底牌吗?

娱乐要闻

林俊杰女友被扒 父亲涉经济案卷款13亿?

财经要闻

朱光耀:美关税政策正使WTO名存实亡

汽车要闻

标配华为乾崑ADS 4 Pro 华境S明年上半年上市

态度原创

亲子
房产
艺术
本地
公开课

亲子要闻

小朋友马年祝福语简短

房产要闻

疯了!2025海南拿地榜巨变:榜首狂砸80亿,民企火力全开!

艺术要闻

谢稚柳雪景山水20图

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版