在AI技术发展史上,Anthropic公司的Claude 3 Opus在Chatbot Arena排行榜上首次超越OpenAI的GPT-4,打破了其长期以来的霸主地位。这一成就标志着AI聊天机器人领域的竞争进入了新阶段。
Anthropic 公司的 Claude 3 Opus 聊天机器人模型首次在 Chatbot Arena 排行榜上超越了 OpenAI 的 GPT-4,成为新的领头羊。这一变化标志着在真实用户评价的基础上,GPT-4 首次失去了其在聊天机器人领域的霸主地位。
Chatbot Arena 作为 Large Model System Organization (LMSYS) 创立的基准测试平台,通过让用户在不知道模型身份的情况下对不同大型语言模型的表现进行评分和选择,从而提供了一个实用的性能比较方式。
这是近一年来,自 GPT-4 发布以来,其他语言模型首次在聊天机器人竞技场中战胜 GPT-4。更值得注意的是,价格更为亲民的 Anthropic Haiku 模型的表现也紧追 GPT-4 之后。
自 GPT-4 于 2023 年 5 月被纳入 Chatbot Arena 以来,其各个版本一直稳居榜首,而此次的失利象征着一个时代的结束。软件工程师 Nick Dobos 在社交媒体上发表推文,用“国王已死,安息吧 GPT-4”来形容这一变化。
Haiku 模型在文本生成方面表现出色,尤其是在提供了大量示例之后,其成本仅为 GPT-4 的十分之一,并且据 LMSys 社区的评价,其性能可与 2023 年 3 月发布的首个 GPT-4 版本 0314 媲美。Anthropic 的中端模型 Sonnet 同样超越了最初的 GPT-4。
随着 Claude 3 Opus 的崛起,OpenAI 的市场领先地位开始受到挑战,这一点在近几个月并不明显,尤其是在 Google 发布了反响平平的 Gemini 之后。尽管如此,OpenAI 仍然通过其模型,尤其是面向普通用户的 ChatGPT,持续占领市场份额。
Anthropic 有望在 API 使用方面迅速迎头赶上。OpenAI 最近的领导层变动间接地推动了 Anthropic 的发展,因为这表明企业不愿仅依赖单一的 AI 公司。
独立 AI 研究者 Simon Willison 指出:“首次有非 OpenAI 的供应商提供的最先进模型——Opus 用于高级任务,Haiku 用于成本和效率——这对我们所有人都是一个好消息。但 GPT-4 已经推出超过一年,其他公司花了一年时间才迎头赶上。”这表明,尽管 Claude 3 的崛起可能会让 OpenAI 停下脚步,但 GPT-4 系列本身已经超过一年,这代表了 LLM 的增量更新。
OpenAI 可能会很快进行反击。有消息称,该公司可能最早在今年夏天推出一个 "更智能" 的模型,可能是 GPT-4.5 或 GPT-5。OpenAI 首席执行官 Sam Altman 已确认,公司计划在今年推出一款 "了不起" 的 AI 模型。
CLICK TO SEE YOU LOOK THE BEST
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.