网易首页 > 网易号 > 正文 申请入驻

AI实力榜大洗牌!OpenAI谷歌强势领跑,Anthropic节节败退

0
分享至

新智元报道

编辑:英智

【新智元导读】AI市场风起云涌!Poe最新报告揭晓:OpenAI的GPT-4o称霸文本生成,谷歌的Gemini 2.5 Pro领跑推理,Kling在视频领域异军突起,企业如何在这场AI竞赛中抢占先机?

最近,Poe发布了最新的使用报告,报告显示,OpenAI和谷歌的地位越来越稳,势头很猛。

Anthropic就没那么好运,有点掉队了。

AI模型的推理能力,已经成为了各大公司竞争的关键战场。

根据Poe发布的数据,2025年1月到5月这段时间,AI各个主要领域,市场份额都重新洗牌了。

主要结果如下:

  • 文本生成:GPT-4o以35.8%稳居榜首,Claude和Gemini紧随其后。

  • 推理:Gemini-2.5.Pro以31.5%登顶,Claude、DeepSeek-R1、最近推出的o3和o4-mini榜上有名。

  • 图像生成:Imagen3、GPT-Image-1和Flux系列三分天下。

  • 视频生成:Runway暂列第一,Kling-2.0-Master来势汹汹,Veo-2排名第三。

  • 智能体:o3拔得头筹,战胜了Anthropic的Claude和谷歌的Gemini。


截至2025年5月不同类别的AI模型排名

o3驱动的智能体拔得头筹,Claude和Gemini紧随其后。

文本:

GPT-4o稳坐头把交椅,新模型来势汹汹

在文本生成这个领域,OpenAI的GPT-4o是稳稳的第一,用户占比达到35.8%,占据主导地位。

OpenAI新出的GPT-4.1系列也不容小觑,发布没几周,就拿下了9.4%的份额。

谷歌的Gemini 2.5 Pro表现也不错,刚上线不久,就有大约5%的用户选择它。

不过,Anthropic的Claude可就有点惨了,这段时间它的市场份额下降了10%,被OpenAI和谷歌抢走了不少用户。

虽说现在Claude 3.7 Sonnet更受大家欢迎,取代了Claude 3.5 Sonnet,但老版本也还有12%的人在用。

还有DeepSeek,今年年初一炮而红。后来其他公司也推出了不少价格实惠、功能又强的推理模型。

DeepSeek R1的用户占比从2月中旬7%的最高点,下跌到4月底,只剩3%了。

推理:

会解难题成了「制胜法宝」

专门用来推理的模型越来越受欢迎了。

2025年年初开始,推理模型的比例从2%一下子涨到了10%。

Nick Huber表示,这些推理模型别看还在发展初期,但解决复杂问题的能力特别强,给出的答案也更准确。那些喜欢尝鲜的用户发现了它的好处,就算用的时候成本高一点、花的时间长一点,他们也愿意,就为了能得到更好的结果。

在推理模型这个热门领域,谷歌的Gemini 2.5 Pro一骑绝尘。

上线才六周,就占了31%的市场份额,把Claude那些专门做推理的模型都比下去了。

OpenAI在推理模型方面一直在创新。2025年前4个月,就推出了好多款新的推理模型,像o1-pro、o3-mini。

Poe的用户特别愿意尝试OpenAI的新模型,很快就从老版本换成新版本了。

还出现了一些新的混合推理模型,像Gemini 2.5 Flash Preview和Qwen 3,它们能在聊天的时候根据情况调整推理的深度。

不过目前用这些新模型的用户还不多,只占推理模型用户总数的1%左右。

有行业分析师就说了,现在大家都在卷推理能力,这说明AI市场在慢慢成熟。

基础的文本生成功能已经没什么差异化了,想脱颖而出,就得靠这种更高级的能力。

图像:

谷歌Imagen 3「搅局」

图像生成这个领域现在也是竞争白热化。

谷歌的Imagen 3系列模型一路逆袭,2025年市场份额从10%左右涨到了30%,已经能和黑森林实验室的FLUX系列模型「掰掰手腕」了。

到4月下旬,FLUX系列模型的市场份额也就35%左右。

OpenAI的GPT-Image-1也不甘示弱,4月下旬刚接入API,才过了两周,就有17%的用户用它来生成图像了,和它之前在ChatGPT里爆火的情况差不多。

虽然FLUX系列模型在Poe的图像生成领域还是用的人最多,但从数据上也能看出,它的市场份额从45%掉到35%了,被谷歌和OpenAI抢了不少用户。

以前图像生成是Midjourney和Stable Diffusion的天下,现在谷歌、OpenAI和黑森林实验室三足鼎立,竞争特别激烈。

现在图像生成的质量越来越好,对用户给的提示理解得更准,生成速度也更快,已经成为竞争最激烈的战场之一了。

从行业数据能看出,最近这半年,企业对图像生成技术的需求暴增。好多公司的营销部门还有创意机构,都开始用这些技术做设计了。

视频:黑马Kling搅局

在视频生成领域,中国快手实验室新出的Kling系列模型就像一匹黑马,直接拿下了30%左右的市场份额。

其中Kling-2.0-Master最厉害,4月底发布,才过了三周,在Poe上的使用占比就达到21%了。

谷歌的Veo2自从2月发布以来,一直保持着20%左右的份额,表现挺稳定。

但这个领域最早的开拓者Runway就没那么幸运了,在报告期里,它的市场份额从60%大幅下降到20%。

Kling系列能这么快打开市场,说明在新兴的AI领域,就算是一开始领先的公司,如果不持续进步,很快就会被新公司超越。

视频生成特别耗性能,哪怕生成一小段视频,也得需要很强的处理能力。所以和文本、图像生成比起来,用视频生成模型的人相对少一些。

不过现在技术发展快,成本在下降,视频质量在提高,估计2025年用的人会越来越多。

现在已经有不少广告公司、社交媒体博主还有教育平台开始用AI生成视频了,虽然这项技术还有些不足,但大家都看到了它的潜力。

语音:

ElevenLabs称霸,新公司另辟蹊径

在语音领域,ElevenLabs还是稳稳的王者,报告期内,差不多80%的用户都用它来做文本转语音。

不过,Cartesia、Unreal Speech 这些新公司也来分蛋糕了,它们提供了很多不一样的语音选择,还有各种音效,价格也各有优势。

和其他领域的竞争很分散不同,语音AI基本被ElevenLabs垄断了。

专家分析,这是因为它进入市场早,语音库特别丰富,而且一直都在优化,技术比其他公司厉害。

新公司也有自己的办法,它们不跟ElevenLabs正面硬刚,而是找一些细分市场。

比如Unreal Speech就专门给播客和有声书制作方提供服务,能模拟各种专业配音演员的声音,还能表现出不同的情感。

Cartesia则主打多语言、带真实口音的语音,受到很多跨国企业和教育平台的欢迎。

随着文本转语音技术越来越成熟,越来越接近真人说话的水平,在客服、无障碍服务,还有内容创作这些场景用得越来越多。

语音AI对性能要求不高,用起来更方便,预计2025年这个市场还会继续扩大。

o3智能体拔得头筹

在一项针对AI智能体的联网研究测试中,ChatGPT最新的o3模型战胜了Anthropic的Claude和谷歌的Gemini。

不过话说回来,最牛的智能体和人类专家相比,还是有不小的差距。

FutureSearch让11个主流的大模型完成了总共89项实际研究任务,并对每个模型在查找原始资料来源、搜寻数据、收集证据、汇编数据以及验证主张等能力进行了评估。

最后打分结果出来,最高分才0.51,而满分预计是0.8。

也就是说,现在最牛的AI智能体,专业研究人员花点时间,也能轻松「碾压」它们。

这次测评的成绩单如下:

  • o3(OpenAI):0.51

  • Claude 3.7 Sonnet(Think):0.49

  • Claude 3.7 Sonnet(Std):0.48

  • Gemini 2.5 Pro:0.45

  • GPT-4.1L:0.42

  • DeepSeek-R1:0.31

  • Mistral Small:0.30

  • GPT-4 Turbo:0.27

  • Gemma 3:0.20

对比去年GPT-4 Turbo才0.27的分数,在一年时间里,优秀通才研究人员和前沿智能体之间的差距缩小了约45%。

此外,像DeepSeek这样价格便宜的智能体,与来自OpenAI的付费高端产品相比,差距并不大。

OpenAI的o3暂时领跑,Claude和Gemini紧跟其后。

目前看来,闭源模型在搞研究这块更有优势,但开源模型也在疯狂上分。

不过智能体的「短板」也很明显。

跟人类研究员相比,它们在战略规划、全面性、评估资料来源质量等方面更逊一筹,还特别容易忘事,任务做到一半就把之前查到的东西抛脑后了。

更要命的是,好多AI都有「摆烂」倾向,找到差不多能用的答案就收手,不愿意再深挖找更好的。

ChatGPT的o3能拿第一,就是因为它更较真,验证答案特别仔细,也不会轻易放过更好的解决方案。

照这趋势,说不定过不了几年AI就能反超人类研究员了。

不过最近,ChatGPT新版本还因为太过谄媚被吐槽过。AI要想稳定变强,还有很长的路要走。

现在AI智能体给出的结果,还是得自己再检查一遍,可别偷懒直接抄作业!

企业如何应对快速变化的AI市场?

AI市场变得这么快,对那些想用AI的企业来说,既是机会也是挑战。

已经在大规模用AI的企业,要建立一套靠谱的评估体系,别只盯着一家供应商。因为说不定这个月最好用的模型,下个月就不是了。

推理能力越来越重要,以前可能更看重速度和成本,现在大家更关注处理复杂任务时准不准、靠不靠谱。

现在前沿的AI公司不停地推出更厉害的模型,企业很纠结:到底是选定一个平台长期用,还是保持灵活性?

很多企业的AI负责人都选择两手抓,不同的任务用不同的模型,一旦有更好的技术出现,马上就能切换。

从报告里能看出,现在图像、视频、音频这些多媒体相关的AI能力竞争也很激烈。

以后可能得更注重发展一个全面、平衡的AI生态系统,图像、视频、音频生成和文本生成等都很重要。

对企业来说,如果想在AI浪潮里站稳脚跟,最好根据自己的实际需求去挑选AI模型,别盲目追新。

同时,企业也要搭建好技术框架,这样一旦有更好的技术出现,就能马上用起来。

那些只守着过去的AI明星产品的公司,说不定很快就会被市场淘汰。

参考资料:

https://www.forbes.com/sites/johnkoetsier/2025/05/13/chatgpt-beats-claude-googles-gemini-deepseek-in-test-of-ai-agents/?ss=ai

https://analyticsindiamag.com/ai-features/why-claude-is-losing-users/

https://poe.com/zh/blog/spring-2025-ai-model-usage-trends

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
价格雪崩!近300元跌至35元,曾经的网红“卖不动了”

价格雪崩!近300元跌至35元,曾经的网红“卖不动了”

深圳晚报
2026-01-16 23:18:24
周总理逝世21年后,中国银行核查账目时发现他名下存有巨额存款,一番调查后揭开了背后的真相

周总理逝世21年后,中国银行核查账目时发现他名下存有巨额存款,一番调查后揭开了背后的真相

寄史言志
2026-01-17 16:37:15
7国出兵不到48小时,特朗普通告全球:谁挡美国夺岛,就给谁加税

7国出兵不到48小时,特朗普通告全球:谁挡美国夺岛,就给谁加税

军机Talk
2026-01-17 15:06:12
央媒发文痛批,这代被“数字泔水”喂养的孩子,正集体得“脑雾”

央媒发文痛批,这代被“数字泔水”喂养的孩子,正集体得“脑雾”

新东方
2026-01-16 17:37:02
贾国龙大概率能赢,为什么?

贾国龙大概率能赢,为什么?

17谭
2026-01-17 12:59:26
“世界变了”,加拿大总理卡尼访华时的这番话耐人寻味

“世界变了”,加拿大总理卡尼访华时的这番话耐人寻味

上观新闻
2026-01-17 17:17:15
个税降了!2026年1月15日起执行!

个税降了!2026年1月15日起执行!

祥顺财税俱乐部
2026-01-17 09:08:07
瑞安航空CEO拒绝星链年增2.5亿美元油费,马斯克回怼蠢货并暗示收购

瑞安航空CEO拒绝星链年增2.5亿美元油费,马斯克回怼蠢货并暗示收购

三言科技
2026-01-17 14:09:03
若今晚战胜乌兹别克,U23国足将在亚洲杯半决赛中对阵越南

若今晚战胜乌兹别克,U23国足将在亚洲杯半决赛中对阵越南

懂球帝
2026-01-17 10:54:32
药师提醒:银杏叶片、血塞通、复方丹参片,心脑血管用药别再选错

药师提醒:银杏叶片、血塞通、复方丹参片,心脑血管用药别再选错

蜉蝣说
2026-01-17 18:36:03
十分罕见!我国一天出现两次火箭发射失利事件!都是什么原因?

十分罕见!我国一天出现两次火箭发射失利事件!都是什么原因?

科普大世界
2026-01-17 18:07:19
贾国龙接受采访:如果见到罗永浩 第一句话要说六个字

贾国龙接受采访:如果见到罗永浩 第一句话要说六个字

3DM游戏
2026-01-17 15:42:05
77岁向华强台北探孙女,亲家合照击碎不和传闻

77岁向华强台北探孙女,亲家合照击碎不和传闻

君笙的拂兮
2026-01-16 20:49:24
报应来得太快!终于知道李湘为啥被封了,这瓜不简单!

报应来得太快!终于知道李湘为啥被封了,这瓜不简单!

皮蛋儿电影
2026-01-16 22:51:50
确认了:即将影响上海!下周冷暖大逆转,大风+降温+雨雪来袭,最低又将零下,熟悉的湿冷回来了

确认了:即将影响上海!下周冷暖大逆转,大风+降温+雨雪来袭,最低又将零下,熟悉的湿冷回来了

鲁中晨报
2026-01-17 20:51:04
唐嫣离婚真相大白后沉默两月,给娱乐圈上深刻一课

唐嫣离婚真相大白后沉默两月,给娱乐圈上深刻一课

梦想总会变成真
2026-01-17 15:21:20
军事专家李莉清空账号作品,是频频被打脸到无脸见人了么?

军事专家李莉清空账号作品,是频频被打脸到无脸见人了么?

廖保平
2026-01-16 09:53:38
三战皆墨,U23国足此前在U23亚洲杯对阵乌兹别克斯坦均输球

三战皆墨,U23国足此前在U23亚洲杯对阵乌兹别克斯坦均输球

懂球帝
2026-01-17 16:13:04
果然被我说中!正在访问中国的加拿大总理突然宣布了一个大好消息

果然被我说中!正在访问中国的加拿大总理突然宣布了一个大好消息

达文西看世界
2026-01-17 19:02:00
日本政坛“内斗”开启!欲争取中间选民支持,“反高市联盟”来了

日本政坛“内斗”开启!欲争取中间选民支持,“反高市联盟”来了

第一财经资讯
2026-01-16 14:50:10
2026-01-17 22:12:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14352文章数 66508关注度
往期回顾 全部

科技要闻

8亿周活扛不住烧钱 ChatGPT终向广告"低头"

头条要闻

公司今年涨20元月薪给员工发致歉信 已连续37年涨薪

头条要闻

公司今年涨20元月薪给员工发致歉信 已连续37年涨薪

体育要闻

三巨头走了俩,联盟笑柄却起飞了

娱乐要闻

马年春晚首次联排场外细节!

财经要闻

保不准,人民币会闪击6.8!

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

旅游
数码
亲子
公开课
军事航空

旅游要闻

“龙江文旅景区消费新指南推介会暨百名达人游龙江进景区”活动在哈尔滨市启幕

数码要闻

银昕Hailstone 360高性能AIO水冷上市,1299元

亲子要闻

刘品言产女两个月「认日常节奏被打乱」 亲吐新手妈体悟

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

普京谈及当前国际局势:世界太危险了

无障碍浏览 进入关怀版