网易首页 > 网易科技 > 网易科技 > 正文

零一万物Yi-Large登顶全球盲测榜单 李开复:中美差距已缩短至6个月

0
分享至

上周,一个名为“im-also-a-good-gpt2-chatbot”的神秘模型突然现身大模型竞技场Chatbot Arena,排名直接超过GPT-4-Turbo、Gemini 1 .5 Pro、Claude 3 0pus、Llama-3-70b等各家国际大厂的当家基座模型。随后OpenAI揭开“im-also-a-good-gpt2-chatbot”神秘面纱——正是GPT-4o的测试版本,OpenAI CEO Sam Altman也在Gpt-4o发布后转帖引用 LMSYS arena 盲测擂台的测试结果。

资料显示,由开放研究组织 LMSYS Org (Large Model Systems Organization)发布的Chatbot Arena已经成为OpenAI、Anthropic、Google、Meta等国际大厂“龙争虎斗”的当红擂台。

时隔一周,在最新更新的排名中,这次排名飞速上涨的模型是由中国大模型公司零一万物提交的“Yi-Large” 千亿参数闭源大模型。

据悉,在 LMSYS 盲测竞技场最新排名中,零一万物的最新千亿参数模型 Yi-Large 总榜排名世界模型第7,中国大模型中第一,已经超过Llama-3-70B、Claude 3 Sonnet;其中文分榜更是与GPT4o 并列世界第一。

值得一提的是,Yi-Large的中文语言分榜上拔得头筹,与 OpenAI 官宣才一周的地表最强 GPT4o 并列第一,Qwen-Max 和 GLM-4在中文榜上也都表现不凡。


与此同时,在编程能力(Coding)排行榜上,Yi-Large 的Elo分数超过Anthropic 当家旗舰模型 Claude 3 Opus,仅低于GPT-4o,与GPT-4-Turbo、GPT-4并列第二。长提问(Longer Query)榜单上,Yi-Large同样位列全球第二。


在今天的访谈中,零一万物CEO 李开复向网易科技等媒体表示,LMSYS提供了一个第三方的、公正的平台,其他竞争对手也都非常认可。而零一万物的团队规模、参数规模、GPU算力都比排名更靠前的模型“小”。

关于小模型相关规划,李开复谈到,我们的计划是从最小到最大的模型都能够做到中国最好,在6B、9B、34B等等,未来可能有更小的模型发布,它们都是同样尺寸达到业界最佳,不敢说第一,但是总体来说是第一梯队或者是最好的一两名,而且在很多方面,在代码方面、中文方面、英文方面表现都非常好。

谈及国产大模型的价格战,李开复回应,国内常看到ofo式的疯狂降价,这是双输的打法。我觉得大模型公司不会这么不理智,因为技术还是最重要的,如果是技术不行?就纯粹靠贴钱赔钱去做生意?我们绝对不会跟这样的一个定价来做对标,我们对自己的模型表现是非常自豪的。

他举例,就像你如果有一台特斯拉,它不会因为别的牌子的车比它卖的很便宜它就觉得它要降价,我们就是特斯拉,我们的价钱是合适、值得的。

谈及中美差距,李开复自信的谈到,在一年前,我们(中国)落后OpenAI、Google 7-10年,现在,“我觉得差距也就是在6个月左右”,大大降低了。(定西)

本文系网易科技报道,更多新闻资讯和深度解析,关注我们。

延伸阅读
相关推荐
热点推荐
雷军尴尬了?开放现车购买10天,还有大量小米YU7现车无人买

雷军尴尬了?开放现车购买10天,还有大量小米YU7现车无人买

互联网.乱侃秀
2025-12-13 12:11:29
东部战区发布重磅主题海报《大刀·祭》

东部战区发布重磅主题海报《大刀·祭》

环球网资讯
2025-12-13 10:02:09
阵亡百人,洪森父子鱼死网破,柬军敢死队冲锋,泰国军队不战而败

阵亡百人,洪森父子鱼死网破,柬军敢死队冲锋,泰国军队不战而败

梦史
2025-12-13 12:00:54
你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

你听过最劲爆的瓜是啥?网友:被大八岁的补习班老师表白了

带你感受人间冷暖
2025-11-26 00:10:06
《大生意人》:剧中几个历史原型,想到他们的悲怆结局,怅然叹息

《大生意人》:剧中几个历史原型,想到他们的悲怆结局,怅然叹息

生性洒脱
2025-12-13 15:27:10
重庆九龙坡区一大桥发生沉降?谣言

重庆九龙坡区一大桥发生沉降?谣言

极目新闻
2025-12-13 15:25:49
马斯克怒批短视频:这玩意越看越降智,会毁了所有人……

马斯克怒批短视频:这玩意越看越降智,会毁了所有人……

柴狗夫斯基
2025-12-11 21:54:53
插刀门13年后,印小天一举动实现口碑逆转

插刀门13年后,印小天一举动实现口碑逆转

大眼睛看看
2025-12-13 15:07:19
10年跟拍北京中产95后:考进了北大,还是归于平凡

10年跟拍北京中产95后:考进了北大,还是归于平凡

麦子熟了
2025-12-12 22:17:36
一场3-2让榜首易主,欧洲豪强登顶,恩里克创造队史神纪录

一场3-2让榜首易主,欧洲豪强登顶,恩里克创造队史神纪录

足球狗说
2025-12-14 06:27:06
汤镇业青岛生活20年,坦言:香港根本比不了!现在一家人很幸福

汤镇业青岛生活20年,坦言:香港根本比不了!现在一家人很幸福

古木之草记
2025-12-13 18:08:09
难了,库明加太难了!曝勇士考虑1换1大交易

难了,库明加太难了!曝勇士考虑1换1大交易

篮球实战宝典
2025-12-13 23:30:19
iOS 26.2更新太狠了!5个隐藏功能你肯定没想到

iOS 26.2更新太狠了!5个隐藏功能你肯定没想到

时尚的弄潮
2025-12-13 01:46:47
直冲22℃!湖北,即将升温

直冲22℃!湖北,即将升温

极目新闻
2025-12-13 22:21:07
下周A股重要看点:中央财办放出大消息!利好两类股将强势领涨!

下周A股重要看点:中央财办放出大消息!利好两类股将强势领涨!

云鹏叙事
2025-12-13 20:14:40
冬天,使劲吃这菜,一护肝,二排毒,三助眠,三强免疫,别不懂吃

冬天,使劲吃这菜,一护肝,二排毒,三助眠,三强免疫,别不懂吃

阿龙美食记
2025-12-11 12:22:21
出嫁前3天彩礼涨到28.8万后续:男方坚持退婚,女子曝光已社死

出嫁前3天彩礼涨到28.8万后续:男方坚持退婚,女子曝光已社死

千言娱乐记
2025-12-13 18:34:13
悲催!网传在火葬场工作的一对年轻人结婚,亲友只发红包未到场…

悲催!网传在火葬场工作的一对年轻人结婚,亲友只发红包未到场…

火山詩话
2025-12-13 05:29:53
2-0!带刀侍卫传射建功 11.4亿豪门终结5场不胜 重返英超前四

2-0!带刀侍卫传射建功 11.4亿豪门终结5场不胜 重返英超前四

狍子歪解体坛
2025-12-14 00:53:39
交警提醒:年检又出新变化了?6~15年以内的车主需要注意了!

交警提醒:年检又出新变化了?6~15年以内的车主需要注意了!

老特有话说
2025-12-12 17:44:14
2025-12-14 07:36:49

科技要闻

比亚迪、小鹏、北汽,集体表态

头条要闻

"小米公司不让卖小米"涉事村庄村民:冯书记直播不收钱

头条要闻

"小米公司不让卖小米"涉事村庄村民:冯书记直播不收钱

体育要闻

有了风骚白人秃头,忘掉谈了10年的前任

娱乐要闻

插刀门后,印小天一举动实现口碑逆转

财经要闻

镁信健康闯关港交所:被指窃取商业秘密

汽车要闻

表面风平浪静 内里翻天覆地!试驾银河星舰7 EM-i

态度原创

健康
游戏
本地
旅游
公开课

甲状腺结节到这个程度,该穿刺了!

神途得道飞升,魔道夺魄炼狱!是你,你会选哪条路?

本地新闻

云游安徽|阜阳三朝风骨,传承千年墨香

旅游要闻

江西上饶通报:望仙谷景区明火已被扑灭,无人员伤亡

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×