网易首页 > 网易号 > 正文 申请入驻

豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1

0
分享至

智东西4月17日报道,今天,火山引擎正式发布了豆包1.5·深度思考模型,采用MoE架构,总参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平。

在数学、编程、科学领域,豆包1.5·深度思考模型的测试表现超过DeepSeek-R1、QwQ-32B等国产推理模型,与OpenAI o1、o3-mini-high等模型能力相仿。在高难度通用人工智能测试ARC-AGI上,其得分更是超过了OpenAI o1和o3-mini-high。

豆包1.5·深度思考模型具有“边想边搜”、“视觉理解”等实用能力,即日起,企业用户可以在火山方舟平台使用豆包1.5·深度思考模型。火山引擎还升级了豆包·文生图模型3.0、豆包·视觉理解模型。

数据显示,截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC报告显示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。

一、高并发场景延迟仅20毫秒,可边想边搜、视觉理解

豆包1.5·深度思考模型较小的参数量和激活参数量,使其具备更低的训练和推理成本,可在高并发场景实现20毫秒低延迟

搜索能力是豆包1.5·深度思考模型的亮点之一。与其他推理模型“先搜索再思考”的模式不同,豆包App基于豆包1.5·深度思考模型进行了定向训练,可以“边想边搜”。

例如,在给用户推荐露营装备时,豆包1.5·深度思考模型可以拆解每个具体需求的注意事项,规划信息,自行判断信息是否完备,并补充搜索信息。在3轮搜索后,豆包1.5·深度思考模型给出了预算范围内、细致周到的推荐。

豆包1.5·深度思考模型还具备视觉理解能力,能基于文字、图像信息进行思考。在下方场景中,豆包1.5·深度思考模型就做到了理解菜单内容,分析每道菜的组成、照顾不同人的口味和过敏食物,给出预算内的点餐推荐。


据火山引擎介绍,为了提升豆包1.5·深度思考模型的通用能力,模型团队优化了数据处理策略,把可验证数据与创意性数据进行融合处理,满足各类任务的需求。

此外,大规模强化学习是训练推理模型的关键技术,通过采用创新的双轨奖励机制,兼顾“对错分明”和“见仁见智”的任务,有效实现了算法的可靠优化。

二、多项跑分打平OpenAI推理模型,AGI测试优势明显

火山引擎公布了豆包1.5·深度思考模型在多项权威基准测试上的跑分结果。

在AIME 2024、AIME 2025这类数学测试中,豆包1.5·深度思考模型的得分与OpenAI o3-mini-high基本打平,但在难度更高的Beyond AIME上仍与后者有明显差距。

在博士级推理难题测试集GPQA Diamond上,豆包1.5·深度思考模型的得分为77.3,与OpenAI o1、o3-mini-high仅有微小差距。

在编程基准测试Code Forces和SWE-bench上,豆包1.5·深度思考模型实现了接近或超越DeepSeek-R1的成绩。

在高难度通用人工智能测试ARC-AGI上,其得分更是大幅超过了OpenAI o1和o3-mini-high,达39.9分。

在创意写作等非推理任务中,豆包1.5·深度思考模型也展示出泛化能力,能够胜任更广泛和复杂的使用场景。

三、直出2K高清图片,还能搜索视频内容

全新升级的豆包·文生图模型3.0,能够实现更好的文字排版表现、实拍级的图像生成效果,以及2K的高清图片生成方式。

▲豆包·文生图模型3.0生成的2K人像(图源:火山引擎)

豆包·文生图模型3.0还可广泛应用于影视、海报、绘画、玩偶设计等营销、电商、设计场景,生成的文字准确无误,画面有设计感。

▲豆包·文生图模型3.0生成的海报(图源:火山引擎)

在最新的文生图领域权威榜单Artificial Analysis竞技场中,豆包·文生图3.0模型已超越业界诸多主流模型,排名全球第一梯队。

新版本的豆包·视觉理解模型则具备更强的视觉定位能力,支持多目标、小目标、通用目标的框定位和点定位,并支持定位计数、描述定位内容、3D定位。可应用于线下门店的巡检场景、GUI agent、机器人训练、自动驾驶训练等。

将一盒草莓的图片发送给豆包·视觉理解模型,它能迅速数出有多少草莓,并框定其位置。

同时,新版本在视频理解能力上也有大幅提升,比如记忆、总结理解、速度感知、长视频理解等。豆包·视觉理解模型结合向量搜索,可直接对视频进行语义搜索,广泛适用于安防、家庭看护等商业化场景。

结语:国产推理模型角逐激烈

推理模型已经成为国内各大模型厂商角逐的重要方向。本次豆包1.5·深度思考模型在推理成本、视觉理解等方面的新能力,或许将成为下一轮推理模型升级的重要方向。

同日,火山引擎还发布了OS Agent解决方案、GUI Agent大模型(豆包1.5·UI-TARS);面向大规模推理,发布AI云原生·ServingKit推理套件。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广东一男子家狗子生了四只小狗,顺口对狗子说:这太多了,送人吧

广东一男子家狗子生了四只小狗,顺口对狗子说:这太多了,送人吧

观察鉴娱
2026-03-04 10:48:07
农民把10头猪赶到无人岛,12年后再次登岛,眼前画面让他不敢信

农民把10头猪赶到无人岛,12年后再次登岛,眼前画面让他不敢信

白云故事
2026-01-22 17:30:05
退休后的同学聚会,撕开了“体制内”和“体制外”的那层遮羞布

退休后的同学聚会,撕开了“体制内”和“体制外”的那层遮羞布

朗威谈星座
2026-02-17 03:51:37
中国女篮74-69巴西!球员评分:3人满分,3人良好,1人不合格

中国女篮74-69巴西!球员评分:3人满分,3人良好,1人不合格

越岭寻踪
2026-03-05 03:51:42
伊朗称完全控制霍尔木兹海峡 十多艘油轮被炮弹击中

伊朗称完全控制霍尔木兹海峡 十多艘油轮被炮弹击中

新华社
2026-03-04 07:49:02
不要再叫喊击沉美航母了:击沉一艘航母有多难?你根本看不懂

不要再叫喊击沉美航母了:击沉一艘航母有多难?你根本看不懂

起喜电影
2026-03-02 07:35:37
B费单赛季英超14次助攻,曼联队史仅次于贝克汉姆

B费单赛季英超14次助攻,曼联队史仅次于贝克汉姆

懂球帝
2026-03-05 05:21:21
天啊!看到陈红1996年新婚的闺房照,才懂陈凯歌为啥说一见钟情

天啊!看到陈红1996年新婚的闺房照,才懂陈凯歌为啥说一见钟情

天天热点见闻
2026-03-03 05:31:03
香菇再次被关注!医生发现:癌症患者吃香菇,不用多久或有5改善

香菇再次被关注!医生发现:癌症患者吃香菇,不用多久或有5改善

读懂世界历史
2026-02-12 21:48:53
代表建议:特殊职责人员奸淫幼女,可判无期或死刑

代表建议:特殊职责人员奸淫幼女,可判无期或死刑

扬子晚报
2026-03-04 22:01:46
王占山同志逝世

王占山同志逝世

吉刻新闻
2026-03-03 10:16:44
媒体人抨击马竞:西蒙尼只知道龟缩,晋级简直是耻辱

媒体人抨击马竞:西蒙尼只知道龟缩,晋级简直是耻辱

懂球帝
2026-03-04 19:34:07
肖战没想到,夺冠才1天,王楚钦孙颖莎联手,给国乒新星上了一课

肖战没想到,夺冠才1天,王楚钦孙颖莎联手,给国乒新星上了一课

林雁飞
2026-03-04 17:15:31
亨德利:斯诺克世锦赛第一轮对赵心童很关键 闯过去就能够走更远

亨德利:斯诺克世锦赛第一轮对赵心童很关键 闯过去就能够走更远

罗克
2026-03-04 14:46:43
伊朗多地爆发抗议活动 哈梅内伊告别仪式被推迟

伊朗多地爆发抗议活动 哈梅内伊告别仪式被推迟

看看新闻Knews
2026-03-04 20:42:20
压力山大!已经大到让人患上拉屎焦虑了,一大厂网友哭诉工作窒息

压力山大!已经大到让人患上拉屎焦虑了,一大厂网友哭诉工作窒息

火山詩话
2026-03-04 06:50:58
威廉王子高调表达爱意,亲自发布凯特新照,全家祝她生日快乐!

威廉王子高调表达爱意,亲自发布凯特新照,全家祝她生日快乐!

趣味萌宠的日常
2026-03-04 20:25:11
今日惊蛰,使劲吃这菜,自带“青霉素”,一通便,二抗菌,三养肝

今日惊蛰,使劲吃这菜,自带“青霉素”,一通便,二抗菌,三养肝

小茉莉美食记
2026-03-05 00:20:03
郑钦文:里巴还是教练,手肘在24年就隐约作痛

郑钦文:里巴还是教练,手肘在24年就隐约作痛

全网球APP
2026-03-04 15:37:44
时隔多月,刘维伟前妻再度炮轰:不是放不下,他公开带小三太伤人

时隔多月,刘维伟前妻再度炮轰:不是放不下,他公开带小三太伤人

篮球扫地僧
2026-03-04 17:34:25
2026-03-05 05:40:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11299文章数 116986关注度
往期回顾 全部

科技要闻

多位核心离职,阿里亲手废掉最强AI天团?

头条要闻

外媒称伊朗封锁霍尔木兹海峡只让中俄船通行 中方回应

头条要闻

外媒称伊朗封锁霍尔木兹海峡只让中俄船通行 中方回应

体育要闻

2026年中超,为什么值得你多看一眼?

娱乐要闻

谢谢谢娜 贡献出26年内娱的第一个笑话

财经要闻

人大代表建议:将农民养老金提到500元

汽车要闻

鸿蒙智行首款猎装车 尚界Z7/Z7T首发

态度原创

本地
艺术
手机
教育
健康

本地新闻

食味印象|一口入魂!康乐烤肉串起千年丝路香

艺术要闻

香港书协会员——刘德华

手机要闻

一加15T 全面升级,官方剧透来了

教育要闻

31省市区高校数量排名,河南第一

转头就晕的耳石症,能开车上班吗?

无障碍浏览 进入关怀版