网易首页 > 新闻中心 > 新闻 > 正文

豆包1.5·深度思考模型发布!效果好、低延迟、多模态

0
分享至

(原标题:豆包1.5·深度思考模型发布!效果好、低延迟、多模态)

随着 AI 技术的快速发展,AI 已从过去的感知 AI、生成式 AI,快速迈入 Agentic AI 时代。AI 正在进化出端到端的自主决策和执行能力,走向核心生产环节。

火山引擎总裁 谭待

今天,在 FORCE LINK AI 创新巡展·杭州站,火山引擎公布了模型、Agent工具、云基础设施的最新进展,旨在帮助企业更快、更省地构建和部署Agent应用:发布豆包1.5·深度思考模型,升级豆包·文生图模型3.0、豆包·视觉理解模型。同时,面向Agent服务,发布OS Agent解决方案、GUI Agent大模型——豆包1.5·UI-TARS模型;面向大规模推理,发布AI云原生·ServingKit推理套件。

截至2025年3月底,豆包大模型日均tokens调用量已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。IDC报告显示,2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一。

深度思考模型能够让 AI 模拟人类的思维过程,对复杂问题进行精准分析和逻辑推导。

全新发布的豆包1.5·深度思考模型,在数学、代码、科学等专业领域推理任务中表现出色,已经达到或接近全球第一梯队水平;在创意写作等非推理任务中,模型也展示出优秀的泛化能力,能够胜任更广泛和复杂的使用场景。

为了提升模型的通用能力,模型团队优化了数据处理策略,把可验证数据与创意性数据进行融合处理,满足各类任务的需求。此外,大规模强化学习是训练推理模型的关键技术,通过采用创新的双轨奖励机制,兼顾“对错分明”和“见仁见智”的任务,有效实现了算法的可靠优化。

豆包1.5·深度思考模型采用 MoE 架构,总参数为200B,激活参数仅20B,具备显著的训练和推理成本优势。基于高效算法,豆包1.5·深度思考模型在提供行业极高并发承载能力的同时,实现20毫秒极低延迟。

在解决生活生产中的具体问题时,大模型要能够查询互联网信息,进行多轮搜索和思考。与其他推理模型“先搜索再思考”的模式不同,豆包APP 基于豆包1.5·深度思考模型进行了定向训练,可以“边想边搜”。

例如,让豆包APP 推荐露营装备:一对夫妻带两个孩子去露营,温度低,有雨,希望把装备买齐,预算4,000元以内,还要兼顾便携性和安全性。豆包1.5·深度思考模型可以拆解每个具体需求的注意事项,规划信息,然后经过3轮搜索,给出了预算范围内、细致周到的推荐。

此外,豆包1.5·深度思考模型还具备视觉理解能力,可以像人类一样,不光基于文字思考,更能基于所见画面思考,思考更立体,让模型同时拥有“大脑”和“眼睛”。

更好的模型性能、更低的延迟、加上视觉推理能力,将为深度思考模型打开更广泛的应用空间、解决更复杂的问题。即日起,企业用户可以在火山方舟平台使用豆包1.5·深度思考模型。

   此次全新升级的豆包·文生图模型3.0,能够实现更好的文字排版表现、实拍级的图像生成效果,以及2K 的高清图片生成方式。可以广泛应用于影视、海报、绘画、玩偶设计等营销、电商、设计场景。

小字与长文本生成、 排版更美观

   在最新的文生图领域权威榜单 Artificial Analysis 竞技场中,豆包·文生图3.0模型已超越业界诸多主流模型,排名全球第一梯队。

    新版本的豆包·视觉理解模型具备更强的视觉定位能力,支持多目标、小目标、通用目标的框定位和点定位,并支持定位计数、描述定位内容、3D 定位。可应用于线下门店的巡检场景、GUI agent、机器人训练、自动驾驶训练等。

同时,新版本在视频理解能力上也有大幅提升,比如记忆、总结理解、速度感知、长视频理解等。豆包·视觉理解模型结合向量搜索,可直接对视频进行语义搜索,广泛适用于安防、家庭看护等商业化场景。

更强的模型为我们打开了更广阔的应用空间。未来,AI Agent 将同时在“应用Agent”和“OS Agent”两个方向上并行发展。

应用 Agent 具备更强的专业性,如客服 Agent、数据 Agent、代码 Agent等,可以专注于完成特定领域的任务。

比如在代码 Agent 领域,相比于传统的 AI 插件产品,国内首个 AI IDE(AI原生的集成开发环境工具)——Trae 可以让开发者和 AI 更智能的协作,实现软件开发的交付化(交付软件而不仅是代码)、智能化(意图理解-自主规划-调用工具-自主开发)、协作化(与用户在各个维度上进行协作)。

OS Agent 则拥有跨场景的通用性和灵活性,能够直接操作浏览器、电脑、手机或其他 Agent,完成复杂任务。今年 Manus 等通用 Agent 的火爆也点燃了市场对 OS Agent 的热情。

大会上,火山引擎正式发布 OS Agent 解决方案,未来两周将陆续上线火山引擎官网。

该解决方案通过火山引擎 veFaaS 平台对豆包大模型能力进行封装,可以让企业和开发者轻松构建轻量级的 Code use 和 Browser use。而针对任务相对复杂的 Computer Use 和 Mobile Use Agent,则可以通过 ECS 或云手机等调用豆包1.5·UI-TARS 模型,驱动图形用户界面交互,精准识别用户的任务需求,进行感知、自主推理并准确行动。

想做出好的 Agent 同样离不开好的大模型。针对复杂的 OS Agent,火山引擎正式发布 GUI Agent 大模型——豆包1.5·UI-TARS 模型。该模型将屏幕视觉理解、逻辑推理、界面元素定位和操作整合在单一模型中,突破了传统自动化工具依赖预设规则的局限。目前,豆包1.5·UI-TARS 模型已在火山方舟平台上线。

好的模型和工具能够加速 Agent 的落地,但 Agent 也会带来更大量的推理消耗,因此 AI 时代需要更好的云原生架构来支持。

为此,火山引擎推出 ServingKit 推理套件,帮助企业实现模型的快速部署、推理优化、运维可观测。

ServingKit 推理套件可在2分钟内完成671B DeepSeek R1下载和预热,13秒完成推理引擎的加载。

同时,为了降低推理过程中的时延、提高资源利用率,火山引擎 EIC 将 KV cache 命中率提高了10倍,在100% cache 命中场景下 TPS 吞吐量可提高至5倍以上;而通过对算子、AI 网关、VKE 编排调度的优化和升级,可以大幅度降低 GPU 消耗。

相关推荐
热点推荐
大乐透第25054期晒票!990元票提前冲击5亿巨奖,万元票追逐梦想

大乐透第25054期晒票!990元票提前冲击5亿巨奖,万元票追逐梦想

王晓爱体彩
2025-05-17 05:31:49
男子退租忘记带走女朋友,男房东笑得合不拢嘴:二手也能卖1000元

男子退租忘记带走女朋友,男房东笑得合不拢嘴:二手也能卖1000元

唐小糖说情感
2025-05-10 10:51:58
重要调整!5月17日央视体育直播节目时间表:CCTV5、CCTV5+节目单

重要调整!5月17日央视体育直播节目时间表:CCTV5、CCTV5+节目单

郝小小看体育
2025-05-16 23:24:18
A股:市场再次调整,下周A股王者归来!

A股:市场再次调整,下周A股王者归来!

风风顺
2025-05-17 06:46:34
山东泰山新一轮人员清理计划开始了?名记公开官宣确认,引发热议

山东泰山新一轮人员清理计划开始了?名记公开官宣确认,引发热议

懂个球
2025-05-16 23:46:38
浙江2-2河南,赛后评分:不是王钰栋第一,河南队40号排第一

浙江2-2河南,赛后评分:不是王钰栋第一,河南队40号排第一

侧身凌空斩
2025-05-16 21:36:18
赛场貌美如花,素颜买菜大妈!吴艳妮反差太大认不出来

赛场貌美如花,素颜买菜大妈!吴艳妮反差太大认不出来

白面书誏
2025-05-14 13:53:58
曼联若夺欧联杯转会预算翻倍,可两亿重建!阿莫林想截胡哲凯赖什

曼联若夺欧联杯转会预算翻倍,可两亿重建!阿莫林想截胡哲凯赖什

罗米的曼联博客
2025-05-16 07:10:42
赵维伦承诺加盟旧金山大学,将携手国青队友王俊杰共同征战NCAA

赵维伦承诺加盟旧金山大学,将携手国青队友王俊杰共同征战NCAA

懂球帝
2025-05-17 00:14:23
直到李湘女儿和梅婷女儿站一起,我才发现,什么叫铜臭味和书香味

直到李湘女儿和梅婷女儿站一起,我才发现,什么叫铜臭味和书香味

玫瑰讲娱
2025-04-13 16:22:34
投篮没开但防守强硬!阿努诺比半场10中2拿到9分6板2断2帽

投篮没开但防守强硬!阿努诺比半场10中2拿到9分6板2断2帽

直播吧
2025-05-17 09:30:06
背着中国,韩国偷偷把稀土倒卖给美国,结果美国收到后直接认怂了

背着中国,韩国偷偷把稀土倒卖给美国,结果美国收到后直接认怂了

阿芒娱乐说
2025-05-14 23:04:36
曼联不是看不上吗?巴萨买拉什福德,还不如买霍伊伦呢

曼联不是看不上吗?巴萨买拉什福德,还不如买霍伊伦呢

老乐说球
2025-05-17 09:19:36
莫言:晚年苦不苦,要看五十五,人到55岁,还没拥有这三样东西,晚年多半凄凉,别不当回事

莫言:晚年苦不苦,要看五十五,人到55岁,还没拥有这三样东西,晚年多半凄凉,别不当回事

不二大叔
2025-05-16 21:22:20
薇娅为女儿庆生照再度翻红:养出自信的孩子,全靠父母托举!

薇娅为女儿庆生照再度翻红:养出自信的孩子,全靠父母托举!

素衣读史
2025-05-15 09:59:57
80年代,邓朴方请朋友帮他找个老婆,但提出一个要求:不能有孩子

80年代,邓朴方请朋友帮他找个老婆,但提出一个要求:不能有孩子

帝哥说史
2025-05-15 06:35:02
勇士!大动作!再见库明加!终于还是来了...

勇士!大动作!再见库明加!终于还是来了...

晚雾空青
2025-05-17 03:09:19
葛斯齐晒大S豪宅“洗劫一空”照片惹争议,张兰律师分享示意图!

葛斯齐晒大S豪宅“洗劫一空”照片惹争议,张兰律师分享示意图!

柠檬有娱乐
2025-05-16 08:59:59
马筱梅妈妈已抵京,与张兰一起在寺庙为儿女祈福,亲家母碰面了

马筱梅妈妈已抵京,与张兰一起在寺庙为儿女祈福,亲家母碰面了

小咪侃娱圈
2025-05-17 09:06:53
平行世界四维空间真存在吗?网友:我去过阴间,在上五年级的时候

平行世界四维空间真存在吗?网友:我去过阴间,在上五年级的时候

解读热点事件
2025-05-06 00:07:14
2025-05-17 09:51:00

头条要闻

媒体:泽连斯基前往土耳其又离开 向全球宣介一种诚意

头条要闻

媒体:泽连斯基前往土耳其又离开 向全球宣介一种诚意

体育要闻

退役8个月后喜提3冠,人生的转折如此突然

娱乐要闻

嘉行回应黄杨钿甜风波翻车,引发众怒

财经要闻

关键时刻,央妈出手了

科技要闻

OpenAI最强写代码AI智能体来了:Codex上线

汽车要闻

吉利发布最强一季报后,继续整合、补短板是关键

态度原创

艺术
手机
房产
本地
公开课

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

手机要闻

边充电边玩手机到底伤不伤电池:何同学近200天测试终于有答案了

房产要闻

三年血亏468万!天河、黄埔网红盘,跌到底了吗?

本地新闻

2025年“5·19中国旅游日”活动启动仪式

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×