网易首页 > 网易号 > 正文 申请入驻

豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1

0
分享至

智东西4月17日报道,今天,火山引擎正式发布了豆包1.5·深度思考模型,采用MoE架构,总参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平。

在数学、编程、科学领域,豆包1.5·深度思考模型的测试表现超过DeepSeek-R1、QwQ-32B等国产推理模型,与OpenAI o1、o3-mini-high等模型能力相仿。在高难度通用人工智能测试ARC-AGI上,其得分更是超过了OpenAI o1和o3-mini-high。

豆包1.5·深度思考模型具有“边想边搜”、“视觉理解”等实用能力,即日起,企业用户可以在火山方舟平台使用豆包1.5·深度思考模型。火山引擎还升级了豆包·文生图模型3.0、豆包·视觉理解模型。

数据显示,截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC报告显示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。

一、高并发场景延迟仅20毫秒,可边想边搜、视觉理解

豆包1.5·深度思考模型较小的参数量和激活参数量,使其具备更低的训练和推理成本,可在高并发场景实现20毫秒低延迟

搜索能力是豆包1.5·深度思考模型的亮点之一。与其他推理模型“先搜索再思考”的模式不同,豆包App基于豆包1.5·深度思考模型进行了定向训练,可以“边想边搜”。

例如,在给用户推荐露营装备时,豆包1.5·深度思考模型可以拆解每个具体需求的注意事项,规划信息,自行判断信息是否完备,并补充搜索信息。在3轮搜索后,豆包1.5·深度思考模型给出了预算范围内、细致周到的推荐。

豆包1.5·深度思考模型还具备视觉理解能力,能基于文字、图像信息进行思考。在下方场景中,豆包1.5·深度思考模型就做到了理解菜单内容,分析每道菜的组成、照顾不同人的口味和过敏食物,给出预算内的点餐推荐。


据火山引擎介绍,为了提升豆包1.5·深度思考模型的通用能力,模型团队优化了数据处理策略,把可验证数据与创意性数据进行融合处理,满足各类任务的需求。

此外,大规模强化学习是训练推理模型的关键技术,通过采用创新的双轨奖励机制,兼顾“对错分明”和“见仁见智”的任务,有效实现了算法的可靠优化。

二、多项跑分打平OpenAI推理模型,AGI测试优势明显

火山引擎公布了豆包1.5·深度思考模型在多项权威基准测试上的跑分结果。

在AIME 2024、AIME 2025这类数学测试中,豆包1.5·深度思考模型的得分与OpenAI o3-mini-high基本打平,但在难度更高的Beyond AIME上仍与后者有明显差距。

在博士级推理难题测试集GPQA Diamond上,豆包1.5·深度思考模型的得分为77.3,与OpenAI o1、o3-mini-high仅有微小差距。

在编程基准测试Code Forces和SWE-bench上,豆包1.5·深度思考模型实现了接近或超越DeepSeek-R1的成绩。

在高难度通用人工智能测试ARC-AGI上,其得分更是大幅超过了OpenAI o1和o3-mini-high,达39.9分。

在创意写作等非推理任务中,豆包1.5·深度思考模型也展示出泛化能力,能够胜任更广泛和复杂的使用场景。

三、直出2K高清图片,还能搜索视频内容

全新升级的豆包·文生图模型3.0,能够实现更好的文字排版表现、实拍级的图像生成效果,以及2K的高清图片生成方式。

▲豆包·文生图模型3.0生成的2K人像(图源:火山引擎)

豆包·文生图模型3.0还可广泛应用于影视、海报、绘画、玩偶设计等营销、电商、设计场景,生成的文字准确无误,画面有设计感。

▲豆包·文生图模型3.0生成的海报(图源:火山引擎)

在最新的文生图领域权威榜单Artificial Analysis竞技场中,豆包·文生图3.0模型已超越业界诸多主流模型,排名全球第一梯队。

新版本的豆包·视觉理解模型则具备更强的视觉定位能力,支持多目标、小目标、通用目标的框定位和点定位,并支持定位计数、描述定位内容、3D定位。可应用于线下门店的巡检场景、GUI agent、机器人训练、自动驾驶训练等。

将一盒草莓的图片发送给豆包·视觉理解模型,它能迅速数出有多少草莓,并框定其位置。

同时,新版本在视频理解能力上也有大幅提升,比如记忆、总结理解、速度感知、长视频理解等。豆包·视觉理解模型结合向量搜索,可直接对视频进行语义搜索,广泛适用于安防、家庭看护等商业化场景。

结语:国产推理模型角逐激烈

推理模型已经成为国内各大模型厂商角逐的重要方向。本次豆包1.5·深度思考模型在推理成本、视觉理解等方面的新能力,或许将成为下一轮推理模型升级的重要方向。

同日,火山引擎还发布了OS Agent解决方案、GUI Agent大模型(豆包1.5·UI-TARS);面向大规模推理,发布AI云原生·ServingKit推理套件。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
康熙将鳌拜满门抄斩,问其女:可知罪?女孩反问他,当场脸色大变

康熙将鳌拜满门抄斩,问其女:可知罪?女孩反问他,当场脸色大变

千秋文化
2025-12-24 23:35:07
可以「追杀」徐莺,谁敢奈何「康生」?

可以「追杀」徐莺,谁敢奈何「康生」?

家传编辑部
2025-12-28 09:37:04
河南网红罗大美下葬,此前被害后遗体停放太平间近900天,妹妹发文:在一个小小的仪式里送了哥哥最后一程,让他安静入土,回归自然

河南网红罗大美下葬,此前被害后遗体停放太平间近900天,妹妹发文:在一个小小的仪式里送了哥哥最后一程,让他安静入土,回归自然

扬子晚报
2025-12-28 18:28:40
南通一轿车冲入河中,当地:车辆已被打捞上岸,车内一名38岁女子不幸身亡

南通一轿车冲入河中,当地:车辆已被打捞上岸,车内一名38岁女子不幸身亡

极目新闻
2025-12-28 18:37:39
财政部:明年财政将促进居民就业增收

财政部:明年财政将促进居民就业增收

极目新闻
2025-12-28 12:14:55
华人注意!中国“史上最严格”跨境汇款新规下周生效!单笔超人民币5000元就要查!

华人注意!中国“史上最严格”跨境汇款新规下周生效!单笔超人民币5000元就要查!

新西兰天维网
2025-12-28 08:06:32
天气预报丨新一轮降温即将到来 重庆高海拔地区有雪

天气预报丨新一轮降温即将到来 重庆高海拔地区有雪

上游新闻
2025-12-28 17:24:02
俄发动大规模打击,基辅供电供暖大范围中断,当地只有0℃,泽连斯基发声!普京穿上了军装:前线迅速推进,已无兴趣等乌方从占领区撤出

俄发动大规模打击,基辅供电供暖大范围中断,当地只有0℃,泽连斯基发声!普京穿上了军装:前线迅速推进,已无兴趣等乌方从占领区撤出

每日经济新闻
2025-12-28 09:52:49
贾国龙摊牌了:若西贝活不下来,绝不会再创业,和夫人回草原养羊

贾国龙摊牌了:若西贝活不下来,绝不会再创业,和夫人回草原养羊

削桐作琴
2025-12-26 23:57:15
这次,姜昆的"澄清"彻底沦为笑话,一份天气预报,把他们全出卖了

这次,姜昆的"澄清"彻底沦为笑话,一份天气预报,把他们全出卖了

千言娱乐记
2025-12-27 19:56:34
姜昆“美国唱红歌”事件再度升级,郭德纲和宁静的话,一针见血

姜昆“美国唱红歌”事件再度升级,郭德纲和宁静的话,一针见血

得得电影
2025-12-26 13:58:03
西部排名又乱了:掘金爆冷输球,火箭三喜临门,7队排名互换

西部排名又乱了:掘金爆冷输球,火箭三喜临门,7队排名互换

篮球大视野
2025-12-28 15:07:40
长得丑、演戏烂,爹妈“强捧不红”的4位星二代,注定走不远

长得丑、演戏烂,爹妈“强捧不红”的4位星二代,注定走不远

瓜汁橘长Dr
2025-12-27 14:52:48
杜兰特30+7火箭最多领先31分大胜骑士 申京缺席谢泼德18+8

杜兰特30+7火箭最多领先31分大胜骑士 申京缺席谢泼德18+8

醉卧浮生
2025-12-28 11:15:49
姜昆彻底不装了:此生无悔入华夏,家在加利福尼亚!咋啦?

姜昆彻底不装了:此生无悔入华夏,家在加利福尼亚!咋啦?

细雨中的呼喊
2025-12-26 17:22:45
北京一主题乐园游乐设施突发机械伤害事故!1人挤压身亡!附报告

北京一主题乐园游乐设施突发机械伤害事故!1人挤压身亡!附报告

特种设备安全科普
2025-12-28 09:23:35
泽连斯基告诉欧洲:乌克兰不会偿还900亿欧元贷款!

泽连斯基告诉欧洲:乌克兰不会偿还900亿欧元贷款!

阿龙聊军事
2025-12-27 21:17:22
中国的富人们,可以从庞莱臣身上学到什么?

中国的富人们,可以从庞莱臣身上学到什么?

呦呦鹿鸣
2025-12-27 16:51:56
最新!上海一区迎来新“80”后副区长

最新!上海一区迎来新“80”后副区长

新民晚报
2025-12-28 17:05:34
丧尽天良,火锅里的科技狠活正在成为健康“杀手”

丧尽天良,火锅里的科技狠活正在成为健康“杀手”

清哲木观察
2025-12-28 09:40:34
2025-12-28 18:59:00
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
10973文章数 116933关注度
往期回顾 全部

科技要闻

特斯拉将在华布局自动驾驶?记者求证→

头条要闻

杭州"兔子警官"哄孩子式执法火了 曾当过2年幼儿园老师

头条要闻

杭州"兔子警官"哄孩子式执法火了 曾当过2年幼儿园老师

体育要闻

83分钟绝杀!曼城2-1年度收官:英超6连胜狂飙

娱乐要闻

白敬亭现身冰雪大世界 拍视频还翻车了

财经要闻

英伟达的收购史

汽车要闻

理想的2026:L9不容有失,i9再战纯电?

态度原创

教育
旅游
健康
手机
公开课

教育要闻

于洁:教师怎样走出这10个认知误区

旅游要闻

【直播】元旦游上海,黄浦普陀专场:黄浦新年三重奏➕普陀“半马苏河”,灵!

这些新疗法,让化疗不再那么痛苦

手机要闻

苹果越战越勇,小米、vivo、OPPO呢?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版