网易首页 > 网易号 > 正文 申请入驻

豆包1.5深度思考模型发布:暴砍参数量,能看图思考,数学编程超DeepSeek-R1

0
分享至

智东西4月17日报道,今天,火山引擎正式发布了豆包1.5·深度思考模型,采用MoE架构,总参数量为200B,激活参数仅20B,在多项基准测试中达到或接近全球第一梯队水平。

在数学、编程、科学领域,豆包1.5·深度思考模型的测试表现超过DeepSeek-R1、QwQ-32B等国产推理模型,与OpenAI o1、o3-mini-high等模型能力相仿。在高难度通用人工智能测试ARC-AGI上,其得分更是超过了OpenAI o1和o3-mini-high。

豆包1.5·深度思考模型具有“边想边搜”、“视觉理解”等实用能力,即日起,企业用户可以在火山方舟平台使用豆包1.5·深度思考模型。火山引擎还升级了豆包·文生图模型3.0、豆包·视觉理解模型。

数据显示,截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC报告显示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。

一、高并发场景延迟仅20毫秒,可边想边搜、视觉理解

豆包1.5·深度思考模型较小的参数量和激活参数量,使其具备更低的训练和推理成本,可在高并发场景实现20毫秒低延迟

搜索能力是豆包1.5·深度思考模型的亮点之一。与其他推理模型“先搜索再思考”的模式不同,豆包App基于豆包1.5·深度思考模型进行了定向训练,可以“边想边搜”。

例如,在给用户推荐露营装备时,豆包1.5·深度思考模型可以拆解每个具体需求的注意事项,规划信息,自行判断信息是否完备,并补充搜索信息。在3轮搜索后,豆包1.5·深度思考模型给出了预算范围内、细致周到的推荐。

豆包1.5·深度思考模型还具备视觉理解能力,能基于文字、图像信息进行思考。在下方场景中,豆包1.5·深度思考模型就做到了理解菜单内容,分析每道菜的组成、照顾不同人的口味和过敏食物,给出预算内的点餐推荐。


据火山引擎介绍,为了提升豆包1.5·深度思考模型的通用能力,模型团队优化了数据处理策略,把可验证数据与创意性数据进行融合处理,满足各类任务的需求。

此外,大规模强化学习是训练推理模型的关键技术,通过采用创新的双轨奖励机制,兼顾“对错分明”和“见仁见智”的任务,有效实现了算法的可靠优化。

二、多项跑分打平OpenAI推理模型,AGI测试优势明显

火山引擎公布了豆包1.5·深度思考模型在多项权威基准测试上的跑分结果。

在AIME 2024、AIME 2025这类数学测试中,豆包1.5·深度思考模型的得分与OpenAI o3-mini-high基本打平,但在难度更高的Beyond AIME上仍与后者有明显差距。

在博士级推理难题测试集GPQA Diamond上,豆包1.5·深度思考模型的得分为77.3,与OpenAI o1、o3-mini-high仅有微小差距。

在编程基准测试Code Forces和SWE-bench上,豆包1.5·深度思考模型实现了接近或超越DeepSeek-R1的成绩。

在高难度通用人工智能测试ARC-AGI上,其得分更是大幅超过了OpenAI o1和o3-mini-high,达39.9分。

在创意写作等非推理任务中,豆包1.5·深度思考模型也展示出泛化能力,能够胜任更广泛和复杂的使用场景。

三、直出2K高清图片,还能搜索视频内容

全新升级的豆包·文生图模型3.0,能够实现更好的文字排版表现、实拍级的图像生成效果,以及2K的高清图片生成方式。

▲豆包·文生图模型3.0生成的2K人像(图源:火山引擎)

豆包·文生图模型3.0还可广泛应用于影视、海报、绘画、玩偶设计等营销、电商、设计场景,生成的文字准确无误,画面有设计感。

▲豆包·文生图模型3.0生成的海报(图源:火山引擎)

在最新的文生图领域权威榜单Artificial Analysis竞技场中,豆包·文生图3.0模型已超越业界诸多主流模型,排名全球第一梯队。

新版本的豆包·视觉理解模型则具备更强的视觉定位能力,支持多目标、小目标、通用目标的框定位和点定位,并支持定位计数、描述定位内容、3D定位。可应用于线下门店的巡检场景、GUI agent、机器人训练、自动驾驶训练等。

将一盒草莓的图片发送给豆包·视觉理解模型,它能迅速数出有多少草莓,并框定其位置。

同时,新版本在视频理解能力上也有大幅提升,比如记忆、总结理解、速度感知、长视频理解等。豆包·视觉理解模型结合向量搜索,可直接对视频进行语义搜索,广泛适用于安防、家庭看护等商业化场景。

结语:国产推理模型角逐激烈

推理模型已经成为国内各大模型厂商角逐的重要方向。本次豆包1.5·深度思考模型在推理成本、视觉理解等方面的新能力,或许将成为下一轮推理模型升级的重要方向。

同日,火山引擎还发布了OS Agent解决方案、GUI Agent大模型(豆包1.5·UI-TARS);面向大规模推理,发布AI云原生·ServingKit推理套件。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
14亿人集体买房,为什么最后买出了一个烂摊子?

14亿人集体买房,为什么最后买出了一个烂摊子?

流苏晚晴
2026-03-25 18:14:02
丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

冷紫葉
2026-03-24 19:12:36
曾经搭档,结局两重天!柯文哲面临重罪下午宣判,侯友宜访澳回台

曾经搭档,结局两重天!柯文哲面临重罪下午宣判,侯友宜访澳回台

蓝色海边
2026-03-27 01:54:10
上海一男子每天3包烟,持续几十年!医生:全身没一根血管是好的

上海一男子每天3包烟,持续几十年!医生:全身没一根血管是好的

上观新闻
2026-03-24 13:32:07
重大转折!俄罗斯,公开下场了!

重大转折!俄罗斯,公开下场了!

大嘴说天下
2026-03-26 22:17:57
钱学森的女儿钱永真:80年代赴美留学定居美国,育有一子是美国人

钱学森的女儿钱永真:80年代赴美留学定居美国,育有一子是美国人

浩渺青史
2026-03-09 16:48:52
2025年湖南省常住人口减少47万人,出生人口连续九年下降

2025年湖南省常住人口减少47万人,出生人口连续九年下降

何亚福
2026-03-26 18:42:00
美伊谈崩内幕:伊万卡是“肉票”,特朗普女婿是“以色列内线”?

美伊谈崩内幕:伊万卡是“肉票”,特朗普女婿是“以色列内线”?

瞩望云霄
2026-03-25 18:20:59
谁还敢充长期会员?男子视频VIP充到2028年,被一纸新规一夜返贫

谁还敢充长期会员?男子视频VIP充到2028年,被一纸新规一夜返贫

温读史
2026-03-26 10:41:06
于东来分享胖东来运营体制:管理层每年接受一次员工无记名投票,如果票数低,直接免职

于东来分享胖东来运营体制:管理层每年接受一次员工无记名投票,如果票数低,直接免职

潇湘晨报
2026-03-26 20:51:31
德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

德转列世预赛附加赛球队身价排行:意大利8.39亿欧居首

懂球帝
2026-03-26 15:59:41
风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

风向彻底变了!西方媒体集体改口:中国,无需再向世界证明什么

大卫聊科技
2026-03-25 12:22:18
手机放床头辐射伤身?央视实验给出答案:这样放手机,辐射降10倍

手机放床头辐射伤身?央视实验给出答案:这样放手机,辐射降10倍

天气观察站
2026-03-24 19:02:53
投资近7亿元,沈阳这家医院新址就要开工了!

投资近7亿元,沈阳这家医院新址就要开工了!

沈阳百姓一家亲
2026-03-27 00:08:33
多个省级党委组织部部长调整

多个省级党委组织部部长调整

上观新闻
2026-03-26 12:48:05
石油危机一旦爆发,房子、现金、股票、黄金谁最危险?

石油危机一旦爆发,房子、现金、股票、黄金谁最危险?

蜉蝣说
2026-03-26 16:52:10
重磅实锤!瓜帅即将告别曼城,下一站彻底跳出英超

重磅实锤!瓜帅即将告别曼城,下一站彻底跳出英超

澜归序
2026-03-26 06:02:38
CBA排名更新:吉林落后辽宁3分

CBA排名更新:吉林落后辽宁3分

格斗江湖人
2026-03-27 03:05:08
全线跳水,超9万人爆仓!

全线跳水,超9万人爆仓!

每日经济新闻
2026-03-26 20:29:17
长期静养与每天锻炼的人,谁更长寿?调查36383名老人,给出答案

长期静养与每天锻炼的人,谁更长寿?调查36383名老人,给出答案

39健康网
2026-03-11 20:11:03
2026-03-27 04:28:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11443文章数 117016关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

头条要闻

特朗普:伊朗允许10艘油轮通行霍尔木兹海峡

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
手机
亲子
本地
公开课

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

手机要闻

1499 iQOO Z11系列发布丨9020mAh电池 165Hz高刷

亲子要闻

试工育儿嫂被查出传染病,宝妈崩溃!家政服务“健康关”如何保障?

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版