网易首页 > 网易号 > 正文 申请入驻

给AI大模型做排名的LMArena最新估值17亿美元,半年翻三倍

0
分享至

在人工智能竞争日益白热化的背景下,一家专注于大模型性能评估与排名的初创公司LMArena正迅速崛起,成为行业内的关键基础设施。

根据公司最新披露,LMArena已完成新一轮1.5亿美元融资,投后估值达到17亿美元。这一数字较其2025年5月宣布种子轮融资时的估值增长了近三倍,凸显了市场对独立第三方AI评估平台的强烈需求。

本轮融资由现有投资者Felicis和加州大学投资部门共同领投。所筹资金将主要用于支付算力成本,以支持其为OpenAI、Google、xAI和Microsoft等客户评估AI模型,同时用于扩充技术团队。作为行业内被广泛引用的基准,LMArena通过“背靠背”比较的方式,利用数百万用户的反馈生成模型排名,直接影响着各大科技巨头在AI领域的声誉与竞争格局。

LMArena CEO兼联合创始人Anastasios Angelopoulos指出,领先的实验室正在使用该平台,因为它们面临着难以客观评估自身模型优劣的挑战。这种评估机制不仅帮助开发者在公开发布前获得早期反馈,也成为AI模型开发商对外宣传其技术实力的核心依据。随着AI模型间的性能差异日益缩小,LMArena的排行榜已成为衡量行业技术进步的重要标尺。

尽管LMArena依靠无偿互联网用户反馈的模式引发了部分关于数据准确性和专业性的争议,但这并未阻碍其商业化进程的加速。公司披露,上个月其“年化消费运行率”已达到3000万美元,表明其基于客户使用量的收入潜力正在快速释放。

独特的评估机制与行业影响力

LMArena的核心竞争力在于其独特的众包评估模式。该公司网站邀请全球互联网用户提问或使用模型进行图像等内容创作。用户在不知晓模型具体名称的情况下,从两个选项中挑选出最佳答案,随后系统才会揭晓生成该输出的模型身份。LMArena将这些结果汇总成不同类别的排行榜,涵盖AI编程、图像及视频生成等多个领域。

这种机制使得LMArena成为了AI行业的“竞技场”。甚至在模型正式向公众发布前,该初创公司有时也会托管这些模型,为开发公司提供早期的市场反馈渠道。随着各家AI模型的性能差距逐渐缩小,开发商们越来越依赖LMArena的排名来证明其技术优势。Anastasios Angelopoulos强调,对于那些试图在激烈的市场竞争中确立地位的实验室而言,这种外部验证至关重要。

商业化进展与用户规模

在财务表现方面,LMArena展现出强劲的增长势头。尽管公司未透露最近具体的营收增速,但在去年9月,其年化收入规模已达数百万美元。而根据其对上个月客户使用量的推算,目前的年化消费运行率已激增至3000万美元。

用户基础方面,LMArena表示目前在150个国家拥有超过500万月度用户。这一数字既包括访问网站查看排名的访客,也可能包括实际参与模型评分的用户。这一庞大的用户群构成了LMArena数据护城河的基础,为其排名的广泛性和实时性提供了支撑。

面临的争议与竞争挑战

尽管增长迅速,LMArena的模式并非没有争议。

一些模型制造商批评称,依靠无偿的互联网用户进行反馈存在缺陷,可能面临被刷榜的风险,且无法反映专家的深度意见。

这一批评指出了大众评审与专业评审之间的张力。相比之下,Scale AI等竞争对手采取了截然不同的路径,通过聘请律师或教授等专家为模型提供付费反馈,以强调评估的专业性和严谨性。LMArena未来如何在保持规模效应的同时提升评估的权威性,将是其持续获得市场信任的关键。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“最全布达拉宫内部照片”惊艳世界,一般人不给看!

“最全布达拉宫内部照片”惊艳世界,一般人不给看!

谭老师地理大课堂
2026-01-20 22:18:01
又撞了!西班牙一列火车行驶中撞上起重机,四天发生四起铁路事故

又撞了!西班牙一列火车行驶中撞上起重机,四天发生四起铁路事故

伴君终老
2026-01-24 16:16:30
中国联通推出“果粉・王卡”SIM卡套餐:80G流量+AppleCare

中国联通推出“果粉・王卡”SIM卡套餐:80G流量+AppleCare

IT之家
2026-01-23 18:21:28
青木率99%,高市早苗乐得连喊3声“万岁”, 麻生:中方不足惧

青木率99%,高市早苗乐得连喊3声“万岁”, 麻生:中方不足惧

爱看剧的阿峰
2026-01-24 15:58:18
央视曝光!真别再吃了!头皮发麻!市监局通报40批食品抽检不合格

央视曝光!真别再吃了!头皮发麻!市监局通报40批食品抽检不合格

来科点谱
2026-01-24 08:52:28
破案了!辽篮战绩严重下滑原因揭晓,杨鸣带不动越演越烈的病号队

破案了!辽篮战绩严重下滑原因揭晓,杨鸣带不动越演越烈的病号队

吴蛛旅行ing
2026-01-24 16:29:13
王励勤出手了!国乒大洗牌重点培养5位选手 孙颖莎王楚钦陷入两难

王励勤出手了!国乒大洗牌重点培养5位选手 孙颖莎王楚钦陷入两难

做一个合格的吃瓜群众
2026-01-17 16:38:59
原来是他娶了谭维维!被誉为“不老男神”,曾在海拔5600米上求婚

原来是他娶了谭维维!被誉为“不老男神”,曾在海拔5600米上求婚

胡一舸南游y
2026-01-24 16:38:18
被拐30年儿子认亲14小时就走,全程冷脸,网友:穷家标签太刺眼

被拐30年儿子认亲14小时就走,全程冷脸,网友:穷家标签太刺眼

老特有话说
2025-12-06 17:31:27
英媒大胆预测:美国输掉和中国的竞争,会比当年英国都痛苦好几倍

英媒大胆预测:美国输掉和中国的竞争,会比当年英国都痛苦好几倍

铁锤简科
2026-01-23 18:22:00
对 “台独” 绝不手软!解放军首次确认,抓捕赖清德不惜一切手段

对 “台独” 绝不手软!解放军首次确认,抓捕赖清德不惜一切手段

荷兰豆爱健康
2026-01-24 15:43:46
轰20或已试飞,美专家察觉不对,怀疑中国保密,美国搞不好要输

轰20或已试飞,美专家察觉不对,怀疑中国保密,美国搞不好要输

东方点兵
2026-01-24 16:32:55
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
高市早苗宣布提前大选,日本发现新问题:中国不同意派遣外交官

高市早苗宣布提前大选,日本发现新问题:中国不同意派遣外交官

爱看剧的阿峰
2026-01-24 16:05:09
叶剑英询问许世友:南京军区还听你调遣吗?许世友直言:军区司令就是我的贴身保镖

叶剑英询问许世友:南京军区还听你调遣吗?许世友直言:军区司令就是我的贴身保镖

清风鉴史
2025-12-24 15:02:13
网传上海74所幼儿园和小学停办,新生儿锐减,学校关停潮仍在继续

网传上海74所幼儿园和小学停办,新生儿锐减,学校关停潮仍在继续

爆角追踪
2026-01-24 12:20:35
女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

女护士处理男患者隐私部位,会感觉难为情吗?美女护士说出大实话

第7情感
2025-09-17 12:12:15
公公催我去银行签字,我:签什么?丈夫:我表哥要你做共同还款人

公公催我去银行签字,我:签什么?丈夫:我表哥要你做共同还款人

朝暮书屋
2026-01-21 17:07:25
670亿美金的“碎钞机”?越南高铁的死线将至,中企不能去接盘

670亿美金的“碎钞机”?越南高铁的死线将至,中企不能去接盘

允华说
2026-01-23 10:33:06
没有阳刚之气就别演“大侠”,《镖人》中谢霆锋,给内娱上了一课

没有阳刚之气就别演“大侠”,《镖人》中谢霆锋,给内娱上了一课

糊咖娱乐
2026-01-22 11:48:48
2026-01-24 17:23:00
华尔街见闻官方 incentive-icons
华尔街见闻官方
中国领先的金融商业信息提供商
140636文章数 2652266关注度
往期回顾 全部

科技要闻

特斯拉Cybercrab即将落地 每公里不到1块钱

头条要闻

国防部通报:张又侠、刘振立被立案审查调查

头条要闻

国防部通报:张又侠、刘振立被立案审查调查

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

李微漪更新:狼王格林去世,3字泪目

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

亲子
教育
时尚
游戏
公开课

亲子要闻

“这就是照书养孩子的后果!”宝妈分享吃饭视频,给网友急的挠墙

教育要闻

2026年寒假读好书活动开始啦!速来参与!

不一定能掀桌男主,但一定是个好演员!

化身超级小陶!Xbox第一方游戏《kiln》开启报名测试

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版