网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

「纳米香蕉」LMArena两周500万投票，引爆10倍流量！谷歌、OpenAI扎堆打擂台

2025-09-04 17:38:36　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：元宇

【新智元导读】8月，nano‑banana登顶LMArena文生图像榜单，带动LMArena社区流量暴增10倍，月活用户300万+。nano‑banana在LMArena启动盲测后，短短两周便吸引了超过500万次总投票，并单独赢得了250万+直接投票，创下历史最高参与度。自2023年推出以来，LMArena已成为谷歌、OpenAI等AI大厂扎堆厮杀的竞技场。

今年8月，一款名为「纳米香蕉」的神秘AI图像编辑器轻松登顶Image Edit Arena榜首，直接把LMArena8月份的平台流量拉爆：

流量暴增10倍，月活300万+。

该模型自在LMArena启动盲测以来，短短两周便吸引了超过500万次总投票，并单独赢得了250万+直接投票，创下历史最高参与度。

nano‑banana的神秘身份，也在LMArena社区引发广泛猜测。

在谷歌认领「纳米香蕉」，将其正式定名为Gemini 2.5 Flash Image之前，已不少网友猜到谷歌是Nano Banana的真正主人。

还有网友贴出了在LMArena上使用正版「纳米香蕉」的方法，该方法不仅免费，而且不需要登录。

不仅能让用户「近距离」接触各种最新模型，LMArena还为大模型比拼，提供了一个真实的「罗马竞技场」，它让谷歌、OpenAI等公司的最新模型，在这里真刀真枪对决，接受成千上万用户的检阅。

用户的投票和反馈，决定了这些大模型的排名，也为大模型厂商迭代模型，提供了真实的用例数据，使他们能够更加有的放矢地改进模型。

nano‑banana爆红，让LMArena流量狂涨10倍，据LMArena首席技术官Wei-Lin Chiang证实，该站月活跃用户已超过300万。

无论谷歌，还是LMArena都成为这场流量盛宴中的最大赢家。

从Chatbot Arena到LMArena

LMArena联合创始人Wei-Lin Chiang和Anastasios Angelopoulos

LMArena前身叫Chatbot Arena，最初起源于2023年伯克利的一项研究项目，后来更名为LMArena。

Chatbot Arena像一个用户社区评测中心，它改变了通过学科测试来评测AI技术的传统方式，将评价权交给了社区用户，并且采用匿名、众包的成对比较，来评估大模型。

用户还可以选择模型进行自我测试。

ChatGPT、Llama 1等大模型的发布，为Chatbot Arena的出现提供了一个契机。

因为，当时人们还没有一个评测大模型的有效方法，于是Chiang就与伯克利研究人员Anastasios Angelopoulos，以及Ion Stoica共同创办了Chatbot Arena，也就是后来的LMArena。

他们的想法，是做一个以社区为中心的公开的、基于网络的平台，邀请所有人来参与评测。

很快，Chatbot Arena就引起了许多关注，成千上万的人前来投票，他们就利用这些用户投票数据，整理出了第一版排行榜。

最初上榜的，多是一些开源模型，唯一商用模型只有Claude和GPT。

随着更多模型的不断加入，Chatbot Arena的关注度也越来越高。各AI大厂纷纷请求将自己产品排名，并试图登上这个排行榜的榜首。

Chatbot Arena的走红，也让众多科技公司将之视为AI技术的风向标，他们像华尔街交易员盯盘一样，密切关注着Chatbot Arena榜单的变化。

这一切都让Meta AI产品管理总监Joseph Spisak感到十分惊讶，他惊叹于几个学生竟能产生如此重大的影响力。

Chiang希望LMArena能够成为一个对所有人都开放可及的平台，希望更多的用户来测试这些模型，表达他们的看法和偏好，以此帮助社区以及模型提供方，能够更好地基于这些真实用例来评估AI。

正如Chiang所言，在LMArena社区中，最受欢迎、增长最快的模型，往往来自于真实场景中的用例。「纳米香蕉」就是最成功的例子之一。

匿名登场和盲测机制，让nano-banana在LMArena自然爆红，当时普通用户无法手动挑选nano-banana，只有在 Battle里随机遇到它，社区里大量帖子讨论「刷很多局才等到香蕉」的体验。

目前，Gemini 2.5 Flash Image成为LMArena的「双料冠军」，获得了Image Edit Arena、Text-to-Image两个榜单的第一名。

从LMArena排名上，还可以看出各个领域表现最佳的模型。

比如，在编码领域，Claude排名最佳。在创意领域，Gemini位居前列。

也许是Meta内部AI团队调整的缘故，Chiang并没有听到太多Llama 4的消息。但他认为Meta正在构建的「全模型」，也许代表着未来行业的一大趋势。

大模型厂商为何钟情「屠榜」？

OpenAI、谷歌、Anthorpic等大模型厂商，为什么都喜欢将它们的模型放到LMArena等排行榜上？

是为了建立品牌曝光度，还是获得用户反馈来改进他们的模型？

显然，曝光与背书，是一个最直观的短期效应。

LMArena是业内关注度最高的公开榜之一，累计投票已达数百万次。而且科技媒体也喜欢频繁引用LMArena的数据，这些都可以为大模型品牌带来显著的口碑与流量红利。

其次，是更贴近「真实使用」的用户反馈。

LMArena采用匿名、随机配对的投票方式，并用Elo计分，这样做减少了「品牌光环」「位置偏置」等主观影响，能真实反映用户对模型回答质量的评价。

Elo系统最初用于国际象棋计分，也是LMArena排行榜背后的核心机制。在该规则下，每个选手（或模型）都有一个实力分数（Elo 分），每场对战后，会根据结果和预期，更新双方的Elo分。

这让每次用户投票都成为一场对战，模型Elo分经过成千上万次对战收敛，排名就可以更真实地反映用户偏好。

此外，LMArena提供了一个跨厂商、跨开源/闭源的同台竞技舞台，这天然就会带来更高流量的曝光，也为用户提供了更丰富的选型信息。

正如Chiang所言，希望将LMArena打造成一个人人都能参与、都能表达自己观点的开放空间。

这里的一切都是社区机制来驱动，鼓励大家提问和投票，表达自己对不同模型的评价。

对于大模型厂商来说，LMArena提供了一个很好的「照镜子」的机会。

大模型厂商可以看清自己在所在领域的排行情况，以及获得LMArena根据社区反馈提供的报告和分析，详细评估自己模型的表现，对症下药提升模型能力。

需要新的LLM基准测试吗？

当所有模型，都非常接近基准测试了，还需要新的基准测试吗？

Chiang认为这一点是非常必要的。但是其中一个核心原则，是这些基准要扎根于真实世界用例。

比如，能够超越传统的基准测试，转向更贴近真实用户场景的基准测试，尤其是善于使用AI工具完成任务的专业人士所驱动的基准。

以LMArena最新推出的WebDev基准测试为例，用户可以用提示词让一个模型搭建网站。这种基准测试，可以更好地将AI技术与真实世界用例紧密相连，使其更快在实际应用场景落地。

针对MIT关于「大多数投资AI的公司都没有看到投资回报」的报告，Chiang认为这是一项很有意思的研究。

他认为该研究反映了「将AI与真实世界用例紧密相连尤为重要」，这也正是他要将LMArena平台扩展到更多行业的原因。

希望通过更多扎根于真实用例的基准测试，去弥合技术与实用场景的鸿沟，并为之提供可衡量的标准。

Chiang表示，LMArena的目标是利用平台数据来理解模型的局限性，保持数据研究流程的透明，并将数据发布出来，以此推动社区平台的持续建设。

对于大模型厂商和「用户观众」来说，这里是一个永不落幕的竞技场。

参考资料：

https://www.businessinsider.com/lmarena-cto-compare-ai-models-google-nano-banana-2025-9

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

推特上线加密聊天功能，马斯克对标微信的超级应用迈出关键一步

DeepTech深科技 2025-11-19 20:39:10
3 跟贴 3
Gemini 3深夜来袭：力压GPT 5.1，大模型谷歌时代来了

机器之心Pro 2025-11-19 10:37:26
2 跟贴 2

Gemini 3 终于来了！登顶LMArena，碾压所有基准

DeepTech深科技 2025-11-19 11:10:12
5 跟贴 5

美股反弹，纳指领涨！谷歌重磅官宣，股价一度大涨近7%！美联储最新发布

每日经济新闻 2025-11-20 06:33:14
0 跟贴 0
Gemini 3获盛赞谷歌股价一度涨近7% 创历史新高

财联社 2025-11-20 03:16:04
1 跟贴 1

就是个模型，有啥大惊小怪的

沙雕动画 2025-11-15 15:50:41
0 跟贴 0

谷歌Gemini 3炸裂发布！全球最强多模态模型，AGI大门开了？

新智元 2025-11-19 19:06:44
0 跟贴 0
黑红？翻车？这份“综艺神人”，流量密码下的全员困局

来不急哇娱 2025-11-18 19:00:00
0 跟贴 0

何小鹏和雷军真正的塑料兄弟

雷科技 2025-06-06 21:23:05
0 跟贴 0
AI投资热潮有无泡沫？谷歌CEO：有非理性因素，若泡沫破裂没有公司能幸免

界面新闻 2025-11-19 11:56:32
0 跟贴 0
纳指收涨0.6%，谷歌、英伟达涨超2%

界面新闻 2025-11-20 06:59:28
0 跟贴 0
谷歌广告技术整改提案获初步认可：欧盟竞争事务主管称提议“更严肃”

界面新闻 2025-11-19 07:10:03
0 跟贴 0
开流量小神器，简单实用

拳击格斗大放送 2025-11-19 09:50:30
4 跟贴 4
黄仁勋：中国的AI市场无论有没有英伟达都会进步与华为是竞争对手不是敌人

财联社 2025-07-21 10:22:14
7 跟贴 7
现在的顶级流量出席活动，看起来一点不大方，内娱真的没落了

趣笑联盟 2025-11-19 11:20:31
1 跟贴 1
登顶开源SOTA!上交大&小红书LoopTool实现工具调用任务的数据进化

机器之心Pro 2025-11-19 14:17:07
0 跟贴 0
流量很贵吗

二舅剪辑 2025-11-17 16:27:58
1 跟贴 1
段永平谈苹果为何放弃造车：汽车给用户提供不了足够的价值

极果酷玩 2025-11-16 02:04:58
0 跟贴 0
大漂亮基地坐镇琉球又解禁战机编码锁联合协防剑指何方？

华尔街九哥 2025-11-18 18:00:04
0 跟贴 0
真机RL！最强VLA模型π*0.6来了，机器人在办公室开起咖啡厅

机器之心Pro 2025-11-18 11:51:54
0 跟贴 0
深夜！全线跳水，谷歌逆势大涨，巴菲特罕见买入

每日经济新闻 2025-11-18 13:12:55
0 跟贴 0
轻量高效，即插即用：Video-RAG为长视频理解带来新范式

机器之心Pro 2025-10-20 18:23:17
0 跟贴 0
于东来卸任胖东来总经理，多名高管退出

极目新闻 2025-11-19 09:23:08
576 跟贴 576
流量太可怕了！“冷美人”在病房开启首次直播，在线人数超10万

火山诗话 2025-11-19 20:50:35
65 跟贴 65
「不仅会想，还能准确去做」VLA-R1把「推理+行动」带进真实世界

机器之心Pro 2025-10-27 19:12:41
0 跟贴 0
流量堆料vs务实好车！年底买车马自达值得看看！

天天汽车 2025-11-17 11:33:20
0 跟贴 0
在星巴克和瑞幸店里“枯坐”一整天，我们发现了咖啡的资本密码

饭统戴老板 2025-09-10 19:37:27
0 跟贴 0
成本0.3美元，耗时26分钟！CudaForge：颠覆性低成本CUDA优化框架

机器之心Pro 2025-11-17 18:45:03
0 跟贴 0
景不动人动，OST-Bench揭示多模态大模型在线时空理解短板

机器之心Pro 2025-10-14 16:42:00
0 跟贴 0
中国公民赴俄将免签，飞莫斯科、圣彼得堡搜索量激增3倍以上

纵相新闻 2025-11-19 15:05:03
15635 跟贴 15635
金发美女穿睡衣上街，下秒操作路人惊讶，流量密码瞬间拿捏！

搞怪幽默家 2025-11-16 09:47:02
1 跟贴 1
推理新范式：动态效能算法让算力资源实现最大化

智东西 2025-11-12 19:58:10
0 跟贴 0
人口不到16万的库拉索首进世界杯！

扬子晚报 2025-11-19 17:47:44
7580 跟贴 7580
永别了，Tokenizer！何恺明师徒新作，颠覆AI生图技术

新智元 2025-11-19 20:31:28
0 跟贴 0
长视频AI数字人来了！字节×浙大(1)

机器之心Pro 2025-09-04 17:27:37
0 跟贴 0
比亚迪王传福：做大产业，做出中国制造业应有的位置

每日经济新闻 2025-07-22 17:51:59
0 跟贴 0
原腾讯Robotics X算法研究员创业，4个月获3轮融资，要在3-5年将人形机器人送进家庭

36氪 2025-11-20 07:39:06
0 跟贴 0
上海多个小区已出现，大量市民反感：没经过我同意！“深夜回家，电梯里突然传出声音，吓了一跳”

上观新闻 2025-11-19 15:07:13
1504 跟贴 1504
余承东：我有一个梦想马路上的所有车里都有华为的技术

每日经济新闻 2025-07-23 17:06:16
186 跟贴 186
波士顿机器狗练成“轻功”！连续七个后空翻

量子位 2025-09-07 01:03:18
0 跟贴 0

大公开！独行侠内斗升级，老板越权介入啊，再见了，浓眉

大公开！独行侠内斗升级，老板越权介入啊，再见了，浓眉

球童无忌

2025-11-19 23:37:27

短短5年，罗志祥面相都变了，患微笑忧郁症，曾经帅脸如今僵又肿

短短5年，罗志祥面相都变了，患微笑忧郁症，曾经帅脸如今僵又肿

素衣读史

2025-11-19 16:03:43

日本股市直接崩盘,单日大跌1620点，美国再次传来坏消息,撑不住了

日本股市直接崩盘,单日大跌1620点，美国再次传来坏消息,撑不住了

回京历史梦

2025-11-19 21:05:03

“宇宙第一大医院“缩减规模，公立医院的苦日子开始了

“宇宙第一大医院“缩减规模，公立医院的苦日子开始了

健识局

2025-11-17 20:17:22

人老了，只剩一个人的时候，请记住：1、不再找老伴儿；2、不去养老院；3、不雇保姆，干不动了，就请钟点工

人老了，只剩一个人的时候，请记住：1、不再找老伴儿；2、不去养老院；3、不雇保姆，干不动了，就请钟点工

二胡的岁月如歌

2025-11-18 19:30:26

琉球之后，轮到苏禄国复国了，否则，何以告慰为反殖民牺牲的先辈

琉球之后，轮到苏禄国复国了，否则，何以告慰为反殖民牺牲的先辈

历来纵横

2025-11-17 16:46:53

41分+20板+18助！联盟第1！字母哥伤停，总冠军和MVP都没戏了

41分+20板+18助！联盟第1！字母哥伤停，总冠军和MVP都没戏了

世界体育圈

2025-11-19 10:25:11

吴石夫人被审讯后崩溃，供出关键名单，谷正文搜查毛人凤看后失声

吴石夫人被审讯后崩溃，供出关键名单，谷正文搜查毛人凤看后失声

不易一字

2025-11-13 17:21:38

15号模特广东冠军续：身份被扒，曾参加多个国际比赛，主办方辟谣

15号模特广东冠军续：身份被扒，曾参加多个国际比赛，主办方辟谣

花心电影

2025-11-19 10:18:40

江苏女排夺冠！吴梦洁37中23，福建拼到季军，天津引发争议

江苏女排夺冠！吴梦洁37中23，福建拼到季军，天津引发争议

跑者排球视角

2025-11-19 21:23:20

中日军方隔空叫阵，日本亮电磁炮示威，中方落弹区扩大，美军懂事

中日军方隔空叫阵，日本亮电磁炮示威，中方落弹区扩大，美军懂事

梁讯

2025-11-19 14:24:13

高血脂有救了？科学家发现“降脂密码”：甘油三酯下降46.7%

高血脂有救了？科学家发现“降脂密码”：甘油三酯下降46.7%

白宸侃片

2025-11-20 05:04:34

领取巴萨队史最受喜爱球员奖，梅西：巴塞罗那是我的家

领取巴萨队史最受喜爱球员奖，梅西：巴塞罗那是我的家

懂球帝

2025-11-20 04:53:15

亡国146年：琉球人忘了汉语，却把 “我是中国人” 刻进骨子里

亡国146年：琉球人忘了汉语，却把 “我是中国人” 刻进骨子里

通文知史

2025-11-18 21:15:03

弟弟打电话说父亲住院，要10万手术费，我刚要转钱，父亲发来消息

弟弟打电话说父亲住院，要10万手术费，我刚要转钱，父亲发来消息

船长与船1

2025-11-17 10:05:09

上海一研究生上门教人骑自行车，800元包会，学员大部分二三十岁

上海一研究生上门教人骑自行车，800元包会，学员大部分二三十岁

闪电新闻

2025-11-19 18:47:41

知名平台将赴美上市，创始人是3位85后驴友！近4年净亏超35亿元，已融资超70亿元，红杉、软银都投了

知名平台将赴美上市，创始人是3位85后驴友！近4年净亏超35亿元，已融资超70亿元，红杉、软银都投了

每日经济新闻

2025-11-19 22:07:14

英伟达Q3财报全面超预期盘后股价再冲高

英伟达Q3财报全面超预期盘后股价再冲高

财联社

2025-11-20 06:15:50

日本首度公布电磁炮照片扬言要“击沉福建舰” 王炳忠：就是引火烧身玩火自焚

日本首度公布电磁炮照片扬言要“击沉福建舰” 王炳忠：就是引火烧身玩火自焚

闪电新闻

2025-11-19 10:21:17

人类“最惨”的一年是哪一年？公元536年称第二，没人敢称第一！

人类“最惨”的一年是哪一年？公元536年称第二，没人敢称第一！

辉辉历史记

2025-11-05 08:51:15

AI产业主平台领航智能+时代

13908文章数 66279关注度

往期回顾全部

科技要闻

一夜封神，Gemini 3让谷歌找回“碾压感”

头条要闻

日本首次出口具有杀伤力武器专家：危险信号

头条要闻

日本首次出口具有杀伤力武器专家：危险信号

体育要闻

世界杯最小参赛国诞生！15万人岛国的奇迹

娱乐要闻

史林子出轨对方前妻放锤！

财经要闻

重磅！中金公司拟收购东兴与信达证券

汽车要闻

此刻价格不重要第5代帝豪本身就是价值

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

房产

数码

手机

本地

公开课

房产要闻

29.4亿！海南“地王”片区，要卖超级宅地！

数码要闻

猫头鹰黑化版散热器风扇来袭

手机要闻

OPPO Find X9系列海外卖爆！销量接近上代2倍

本地新闻

第十二届影展携手重庆来福士丨两江交汇，光影共生

公开课

李玫瑾：为什么性格比能力更重要？

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版