同一个赛道,一家平台年入1亿美元,另一家半年前宣布关闭。AI模型评测市场正在上演一场关于商业化时机的现实课。
Arena日前公布数据,其企业级模型评测服务AI Evaluations年度经常性收入已突破1亿美元,该产品上线仅8个月。收入口径采用年度经常性收入计算,指每年通过客户订阅合同产生的可预测、重复性收入。
![]()
Arena的前身是加州大学伯克利分校2023年启动的AI模型评测研究项目,最初名为LMArena,以免费策略让普通用户测试AI模型、比较输出结果优劣,据此快速积累用户基数和构建AI模型排行榜。这张排行榜逐渐成为业内观察大模型能力的重要风向标之一。2025年4月,Arena完成公司化运作,同年9月正式推出面向企业的商业产品AI Evaluations,核心是利用真人反馈数据帮助客户评估模型在真实业务环境中的表现。
该服务号称能直观展示各大模型的优势与短板,提供可追溯的测试样本及服务等级协议,帮助客户更高效地进行模型选型、优化和迭代。
对比之下,成立于2024年的AI模型评测平台Yupp已于今年3月31日宣布停止运营。Yupp曾希望打造一个AI评测双边市场,让普通用户免费体验多个模型,再利用真实使用数据向AI实验室出售评测服务。平台累计吸引了超过130万用户,也曾成功获得部分AI实验室付费合作,但始终没能找到足够强的产品市场契合点,最终关闭服务。
Arena方面表示,年度经常性收入突破1亿美元标志着公司已初步验证了可持续商业模式,后续将继续加大对平台的投入,扩展更多评测工具和AI协作功能。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.