网易首页 > 网易号 > 正文 申请入驻

火山总裁谭待:很多Agent的能力还停留在类似自动驾驶的L1阶段

0
分享至

“目前很多Agent的能力仍停留在初级水平,真正实现具备更强反思、规划与自主决策能力的Agent,是行业发展的方向。”4月17日,在火山引擎2025 FORCE LINK AI创新巡展现场杭州站上,字节跳动旗下的火山总裁谭待在接受包括澎湃科技(www.thepaper.cn)在内的媒体采访时表示。

谭待认为,深度思考模型是构建Agent的基础,模型要有能力做好思考、计划和反思,并且一定要支持多模态,就像人类具备视觉和听觉一样,Agent才能更好地处理复杂任务。

豆包1.5深度思考模型发布 澎湃新闻记者 摄

当日,豆包1.5深度思考模型正式发布。据介绍,这款模型除了在数学、编程、科学推理、创意写作等通用任务表现突出之外,还上线了具备视觉推理能力的深度思考模型视觉版,能像人类一样对看到的事物进行联想和思考。

值得一提的是,就在今天凌晨,OpenAI也发布了能够进行视觉推理的推理模型o3。

在发布会现场,谭待展示了豆包1.5深度思考模型的视觉推理功能,不仅能够根据照片分析地貌,还能在帮助用户点餐,还可以根据家庭成员的需求推荐露营装备,甚至也能协助制定旅行计划。在企业场景中,该模型可辅助完成项目管理流程图,优化工作流程,推动企业实现智能化运营。

2025年被业界视为“AI Agent智能体元年”,全球科技巨头如微软、谷歌、OpenAI等纷纷加速布局,推出具备自主决策和多任务处理能力的AI Agent产品,如微软发布了企业级AI助手Microsoft 365 Copilot Chat,谷歌升级了Gemini 2.0模型,OpenAI则在17日凌晨突然推出最新的o系列模型,o3和o4-mini,同时表示这两款模型都可以自由调用 ChatGPT 里的各种工具,包括但不限于图像生成、图像分析、文件解释、网络搜索、Python。

国内继中国初创公司Monica推出号称全球首款AI智能体产品Manus后,行业内也在等待下一个科技圈的爆款产品出现。

现场展示豆包1.5深度思考模型 澎湃新闻记者 摄

面对行业内激烈的竞争,谭待在接受采访时直言,现在所谓的“Agent”,不能仅完成“写一首打油诗”或“写篇小学生作文”这样的简单任务。真正的Agent,需要能完成专业性较高、耗时较长、结构完整的任务,这是从定性角度来看。从技术实现的角度来看,如果没有运用深度思考模型,缺乏反思和规划能力,也很难称其为真正的Agent。

谈及市面上目前Agent的发展阶段,谭待以目前大家熟悉的自动驾驶领域来类比。自动驾驶技术根据自动化程度的不同分为L0到L5六个级别。其中,L0级、L1级、L2级都只能称为辅助驾驶系统。谭待指出,2025年行业内和大众可能会对Agent的定义会更加清晰,行业内或许会像自动驾驶分级一样,对Agent进行分级,如Agent L1、L2、L3、L4 这类。“那些开发三四千个 Agent的企业,(Agent能力)可能仅相当于自动驾驶中的 L1 级别;而真正实现落地应用,至少应具备 L2++ 能力(注:L2部分自动驾驶范畴,但在技术和体验上比普通的L2更先进,接近甚至部分具备L3能力)”谭待表示。

澎湃科技注意到,在此次AI创新巡展现场杭州站上,火山引擎还推出了OS Agent解决方案。据悉,OS Agent解决方案包含豆包UI-TARS模型,以及veFaaS函数服务、云服务器、云手机等产品,实现对代码、浏览器、电脑、手机以及其他Agent的操作。其中,豆包UI-TARS模型将屏幕视觉理解、逻辑推理、界面元素定位和操作整合了在一起,为Agent的智能交互提供了更接近人类操作的模型基础。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
英伟达薪资曝光:最贵的不是AI研究员,基本工资200万/年的扎堆

英伟达薪资曝光:最贵的不是AI研究员,基本工资200万/年的扎堆

量子位
2026-06-02 19:14:43
离谱!飞机落地滑行58分钟,乘客坐崩溃:飞2小时,滑1小时!

离谱!飞机落地滑行58分钟,乘客坐崩溃:飞2小时,滑1小时!

白浅娱乐聊
2026-06-02 18:26:05
万万没想到:李连杰主演的《少林寺》,绝大多数镜头居然都不是在“少林寺”拍的!

万万没想到:李连杰主演的《少林寺》,绝大多数镜头居然都不是在“少林寺”拍的!

良有方
2026-05-31 05:38:41
南方新一轮降雨来袭!广东“下开水”模式持续

南方新一轮降雨来袭!广东“下开水”模式持续

广东发布
2026-06-03 14:07:59
济南公安通报“山姆偷吃”

济南公安通报“山姆偷吃”

扬子晚报
2026-06-03 12:06:03
比赖清德还狂!若2028年她当台湾地区领导人,解放军出手武力统台

比赖清德还狂!若2028年她当台湾地区领导人,解放军出手武力统台

阿讯说天下
2026-05-26 13:40:22
美军证实先空袭后拦截 否认第五舰队总部遇袭

美军证实先空袭后拦截 否认第五舰队总部遇袭

新华社
2026-06-03 08:10:03
稻城亚丁景区致歉,停收观光车交通服务费!珠峰、纳木错、泸沽湖等均被曝拦路

稻城亚丁景区致歉,停收观光车交通服务费!珠峰、纳木错、泸沽湖等均被曝拦路

上观新闻
2026-05-29 14:54:19
李云龙“独立团”最后下落,全军覆没于金门战役,不是李云龙指挥

李云龙“独立团”最后下落,全军覆没于金门战役,不是李云龙指挥

兴趣知识
2026-06-01 05:34:12
深圳房价,重回6万了

深圳房价,重回6万了

城市财经
2026-06-03 11:40:35
央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

凡知
2026-06-03 05:12:25
12国联手:限制原矿出口,中企遭断粮式围堵,只剩一条路可以走

12国联手:限制原矿出口,中企遭断粮式围堵,只剩一条路可以走

卷史
2026-06-02 22:11:06
潜水员在加勒比海捞到谷歌原型表,泄露渠道比酒吧还魔幻

潜水员在加勒比海捞到谷歌原型表,泄露渠道比酒吧还魔幻

全栈遛狗员
2026-06-02 14:35:24
黎巴嫩总统办公室:真主党已承诺停止打击以色列

黎巴嫩总统办公室:真主党已承诺停止打击以色列

财联社
2026-06-02 03:37:16
中东大乱:美军机被打爆、以色列遭“斩首”!特朗普卷铺盖跑路?

中东大乱:美军机被打爆、以色列遭“斩首”!特朗普卷铺盖跑路?

史智文道
2026-06-03 11:40:52
嫁给谢苗14年,她专心在家相夫教女,如今42岁丈夫终于再度翻红

嫁给谢苗14年,她专心在家相夫教女,如今42岁丈夫终于再度翻红

阿废冷眼观察所
2026-06-01 18:15:21
中国国民党主席郑丽文正访问美国,外交部回应

中国国民党主席郑丽文正访问美国,外交部回应

澎湃新闻
2026-06-02 15:26:26
俄乌网被禁言,就想知道谁给了它挑衅甚至辱骂中国网民的底气?

俄乌网被禁言,就想知道谁给了它挑衅甚至辱骂中国网民的底气?

壹家言
2026-06-02 11:25:28
一位62岁大妈坦言:我退休金只有2000,却能把晚年过得舒心又自在

一位62岁大妈坦言:我退休金只有2000,却能把晚年过得舒心又自在

热心柚子姐姐
2026-06-02 10:37:46
4分钟涨停!600487,2连板

4分钟涨停!600487,2连板

证券时报
2026-06-03 10:26:40
2026-06-03 14:44:49
澎湃新闻 incentive-icons
澎湃新闻
专注时政与思想的新闻平台。
902414文章数 5091894关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

女子称凌晨入睡后银行卡多次被转账损失42万 银行回应

头条要闻

女子称凌晨入睡后银行卡多次被转账损失42万 银行回应

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

艺术
房产
本地
亲子
数码

艺术要闻

二十年前割麦的场景

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

本地新闻

用剪纸的方式,打开江苏扬州

亲子要闻

孩子长高选什么赖氨酸好?2026推荐度高的氨基丁品牌测评,科学激活发育潜能

数码要闻

搞内容创作需配多大内存?Puget实测16/32/64GB性能差异

无障碍浏览 进入关怀版