网易首页 > 网易号 > 正文 申请入驻

李开复回应放弃预训练:训一次大模型三四百万美元,头部公司都付得起|最前线

0
分享至

文|周鑫雨

编辑|苏建勋

“零一万物绝不放弃预训练。”

2024年10月16日,AI独角兽零一万物创始人兼CEO李开复,公开立了军令状。也在同一天,零一万物发布了最新的MoE(混合专家)架构的旗舰大模型:Yi-Lightning。

这也是时隔5个月后,零一万物再次更新模型的新动态。

李开复表示,Yi-Lightning的训练只用了2000张GPU,训练周期仅一个半月,成本只有300多万美元,是埃隆·马斯克的xAI成本的1%、2%。

训练成本虽然低,但Yi-Lightning的性能并没有打折扣。在加州大学伯克利分校LMSYS团队的Chatbot Arena(聊天机器人竞技场)总榜单上,Yi-Lightning的性能与xAI的Grok-2-08-13模型并列第6,并且超越了OpenAI的GPT-4o-2024-05-13

LMSYS团队的Chatbot Arena(聊天机器人竞技场)大语言模型综合能力总榜单。图源:零一万物

值得注意的是,在中文能力上,Yi-Lightning与OpenAI的最新模型o1-mini版本并列取得了第二;在数学能力上,Yi-Lightning和Gemini-1.5-Pro-002并列第3,仅次于在数学、逻辑推理见长的o1。

在定价上,Yi-Lightning也创了零一万物模型的最低定价:0.99元/百万Token。

零一万物模型定价。图源:零一万物官网

当然,榜单排名并不意味着模型在任务场景下的能力。在发布会上,零一万物着重在实用性上,让Yi-Lightining秀了一把肌肉。

比如,Yi-Lightining相比2024年5月发布的Yi-Large,首包时间(从接收到任务请求到系统开始输出响应结果之间的时间)缩短了一半,最高生成速度提升了近四倍。

具体到翻译场景,Yi-Lightining比豆包、DeepSeek、通义千问最新旗舰模型的翻译速度更快,且翻译结果更加信达雅。

四个模型在相同翻译任务上的表现。图源:零一万物

发布会上,李开复也揭秘了Yi-Lightning的训练策略:

  • 独特的混合注意力机制(Hybrid Attention):在处理长序列数据的过程中,能够提高性能的同时,还能降低推理成本;

  • 动态Top-P路由机制:根据任务难度自动选择最合适的专家网络组合;

  • 多阶段训练(Multi-stage Training):让模型在不同阶段吸收不同的知识,方便mixing团队进行数据配比的调试工作,并能保证不同阶段的训练速度和稳定性。

在2024年5月份的发布会上,零一万物在国内发布了C端的生产力产品“万知”。时隔五个月,零一万物的B端商业化版图也有了新的进展——聚焦零售和电商等场景的AI 2.0数字人。

AI 2.0数字人的背后,是电商话术大模型、角色大模型、直播声音大模型的多模态协同训练。目前,AI 2.0数字人还接入了Yi-Lightning。用户只需要输入出售的商品、声音的性别和语调,就能生成相应的数字人。

零一万物AI 2.0数字人接入Yi-Lightning前后对比。图源:零一万物

如今,大模型发展也来到了技术探索的深水区。即便立下了“绝不放弃预训练”的军令状,李开复也承认:“但不是每家公司都可以做这件事情,做这件事情的成本也比较高,以后有可能会越来越少的大模型公司训练做预训练。”

不过,对如今六家大模型独角兽,李开复依然抱有乐观的态度:

“据我所知,这六家公司融资额度都是够的,我们做预训练的production run,训练一次三四百万美金,这个钱也是头部公司都付得起,我觉得中国的六家大模型公司只要有够好的人才,想做预训练的决心,融资额跟芯片都不会是问题的。”

欢迎交流!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1977年,李敏见到失散多年的亲姐杨月花,杨月花却向李敏提一要求

1977年,李敏见到失散多年的亲姐杨月花,杨月花却向李敏提一要求

磊子讲史
2025-12-23 20:04:20
郑丽文受邀访问大陆,蒋万安再发声,坚持反对统一,要求对等尊严

郑丽文受邀访问大陆,蒋万安再发声,坚持反对统一,要求对等尊严

阿天爱旅行
2026-04-05 18:33:48
陪玩陪睡根本不够!继要求结扎后,王晶再爆潜规则,单依纯被牵连

陪玩陪睡根本不够!继要求结扎后,王晶再爆潜规则,单依纯被牵连

秋姐居
2026-04-04 22:48:00
快讯!前民进党立委李文忠公开发表声明了!

快讯!前民进党立委李文忠公开发表声明了!

达文西看世界
2026-04-06 09:57:11
英国遭到拒绝后发出警告,中国若不合作,中企海外资产将被没收!

英国遭到拒绝后发出警告,中国若不合作,中企海外资产将被没收!

共工之锚
2026-04-06 00:14:47
伊朗公开回应特朗普威胁

伊朗公开回应特朗普威胁

新浪财经
2026-04-06 10:21:03
湖人双核伤退,17号秀坐穿板凳?雷迪克死不用他,今夏恐白送!

湖人双核伤退,17号秀坐穿板凳?雷迪克死不用他,今夏恐白送!

阿晞体育
2026-04-06 09:33:44
退赛风波两个月后,央媒接连“点名”郑钦文,李娜的话终于应验

退赛风波两个月后,央媒接连“点名”郑钦文,李娜的话终于应验

小熊侃史
2026-04-06 10:02:26
库里上次担任替补为2022年季后赛,上次在常规赛替补为2012年

库里上次担任替补为2022年季后赛,上次在常规赛替补为2012年

懂球帝
2026-04-06 10:27:10
伊朗发出最后通牒!俄通告全球将参战,法国上将:中估计也要到了

伊朗发出最后通牒!俄通告全球将参战,法国上将:中估计也要到了

黑翼天使
2026-04-05 02:01:32
起内讧了?伊朗总统反对再这样打下去,要求革命卫队交出战时大权

起内讧了?伊朗总统反对再这样打下去,要求革命卫队交出战时大权

知法而形
2026-04-01 18:49:55
内塔尼亚胡向法撒气后,不到24小时,卡尼表态,10国联手“施压”

内塔尼亚胡向法撒气后,不到24小时,卡尼表态,10国联手“施压”

泠泠说史
2026-04-02 14:24:09
上海长寿路一人行道中央设吸烟区引争议,最新:已撤走,不符合“远离行人必经通道”要求

上海长寿路一人行道中央设吸烟区引争议,最新:已撤走,不符合“远离行人必经通道”要求

纵相新闻
2026-04-05 22:40:02
不靠脸混了,落落大方、干净干练,才是最好的名片

不靠脸混了,落落大方、干净干练,才是最好的名片

飛娱日记
2026-04-06 09:02:04
一觉醒来,特朗普躺进医院?48小时最后通牒,沦为国际大笑话

一觉醒来,特朗普躺进医院?48小时最后通牒,沦为国际大笑话

点燃好奇心
2026-04-06 10:18:25
沉默11天后,特朗普突然放话:中国要买4000万吨大豆!

沉默11天后,特朗普突然放话:中国要买4000万吨大豆!

财经保探长
2026-04-05 21:00:32
贾乃亮带甜馨回东北看爷爷奶奶,祖孙三人逛菜市,甜馨身高惊人

贾乃亮带甜馨回东北看爷爷奶奶,祖孙三人逛菜市,甜馨身高惊人

大鱼娱乐观
2026-04-05 21:33:11
什么是性成瘾?患者自述:比烟瘾、酒瘾厉害多了,比戒毒还难

什么是性成瘾?患者自述:比烟瘾、酒瘾厉害多了,比戒毒还难

泠泠说史
2025-10-30 15:20:45
沉默3天,北京迎来一位贵客,见面先握紧中方手,特朗普又赌输了

沉默3天,北京迎来一位贵客,见面先握紧中方手,特朗普又赌输了

青烟小先生
2026-04-06 10:11:07
澳门世界杯收官,3人满分,2人落寞,1人超常发挥,唯他被骂惨

澳门世界杯收官,3人满分,2人落寞,1人超常发挥,唯他被骂惨

做一个合格的吃瓜群众
2026-04-06 08:38:19
2026-04-06 11:08:49
36氪 incentive-icons
36氪
让一部分人先看到未来
151075文章数 2848699关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

牛弹琴:特朗普两个举动很反常 美国上下都很震惊

头条要闻

牛弹琴:特朗普两个举动很反常 美国上下都很震惊

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

118吨!这家央行,大幅抛售黄金!

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

手机
健康
教育
时尚
家居

手机要闻

iPhone18Pro模具偷跑,深红配色测试中

干细胞抗衰4大误区,90%的人都中招

教育要闻

新工科专业开始洗牌,报考的新思路决定孩子未来就业出路!

伊姐清明热推:电视剧《暴锋雨》;电影《我,许可》......

家居要闻

温馨多元 爱的具象化

无障碍浏览 进入关怀版