网易首页 > 网易号 > 正文 申请入驻

阿里国际副总裁张凯夫:人类跟AI交流,告诉它不要做什么特别重要

0
分享至

“虽然OpenAI的Deep Research能力很强,但其适合做广泛的搜索和很长的报告。对于出口商品HS Code这样一个具体要求精确答案的任务,正确率却只有5%。我们在垂直数据库上,做了工具的减法,以及上下文工程。这个垂直Deep Research范式的HS Code判定工具,准确率可以做到80%。”

在2025世界人工智能大会期间跟媒体交流的时候,阿里国际副总裁、阿里国际AI Business负责人张凯夫如是说。

近半年来,包括Deep Research和Manus在内的各类智能体产品纷纷涌现,AI Agent俨然已经成为人工智能赛道的“必争之地”。近期以来,面向跨境贸易、跨境电商等实际场景,阿里国际数字商业集团推出了多款智能体应用产品,如智能退款agent、海关编码HScode agent以及在线招商agent等,在行业里获得关注。

7月26日,2025世界人工智能大会卓越人工智能引领者SAIL奖公布,阿里国际跨境电商AI解决方案Marco斩获本届SAIL之星,成为该领域的首个获得者。在同观察者网等媒体交流时,张凯夫多次谈到了AI Agent的发展。张凯夫认为,在很多实际功能上,垂直Agent的机会可能比垂直模型的机会还要大。

为了服务更多出海贸易商家,阿里国际AI Business开始做中国商家自己的“Deep Research”和垂直AI Agent。

“海关编码HScode agent,商家自己去匹配的准确率比较低,我们自己的Agent的正确率能到80%。”谈到研发经验,张凯夫表示,“先做减法,把数据限制好。只让Agent去关注相关部门的数据,而不是去互联网上乱搜;在Agent的思考进程里(thinking process),我们也使用了较为领先的模型和优质的案例。”

“人跟AI交流,给它定好约束条件,告诉它不要干什么特别重要。”

人类跟AI交流,告诉它不要做什么特别重要

“通用”和“垂直”的路线之争,一直是人工智能领域的母命题。

2023年,国内业界、学界围绕“做基础大模型,还是做垂直/行业大模型”进行了不少讨论。有的从业者认为,要抓紧基础大模型的研究,在底座模型上奋力追赶,尤其是要摆脱对国外开源模型的依赖;也有从业者认为,中国市场巨大、数据丰富,应用场景多元,可以用应用发展来带动模型进步,走一条“农村包围城市”的路线。

从DeepSeek搅动全球风云,到各行各业的专业大模型集体涌现,事实上,中国在这两条路上走得其实都不错。

近年来,人工智能领域的竞争开始从类GPT式的问答对话,向具体场景的智能体Agent迁移。从OpenAI的Deep Research,到轰动一时的Manus,能够调用多种能力,解决具体问题的智能体,成为行业竞相追逐的焦点。这也让“通用”和“垂直”的路线差异,再一次显现。

此时此刻,恰如彼时彼刻。

谈到行业观察,阿里国际副总裁、阿里国际AI Business负责人张凯夫对观察者网等媒体表示,AI应用领域已经随着行业从AIGC(生成式人工智能)走向了Agent(智能体):以前的应用很多是AIGC,比如生成图、搞翻译、弄创意;今年更多是智能体,比如硅谷很火的BD agent,去找中小企业的联系方式;合规Agent,从厚厚的法律材料中寻找合规相关内容;比如营销Agent,根据客户需要去各种社交媒体发帖等等——这些过程都是自动的。

正如上文中所举的“海关编码案例”一样,在张凯夫看来,在Agent时代,很多专业领域的垂直Agent更有机会给人们带来的巨大收益;相反,通用型的AI Agent,表现反而没有那么好——OpenAI Deep Research不能搞定的专业工作,一个更加接近行业的垂直Agent可能就能处理得很好。

“最近硅谷很火的概念是context engineering(语境工程,或上下文工程),我们用一个模型,语境(context)非常重要。现在我们做智能体也是一样,语境的约束特别重要,有时候你喂给它(Agent)的东西越多越不好,你一定要非常有针对性地喂给它一些内容。”

张凯夫进一步表示,现在人类和AI交流,给它定好约束条件,告诉它不要干什么特别重要——包括AI coding(用AI写代码)。“想让AI干嘛,大家都可以表达,但真正地核心在于让AI明确,解决这个问题的时候不是要新建代码文件,而是找到对应的具体代码去修改。如果没有这个约束条件,代码库就会越来越大,到后面一塌糊涂。”

“我们做一个Agent也是一样的,语境缩减和精准选择是非常重要的一件事情。”

阿里国际AI Business算法负责人骆卫华补充道,Deep Research等通用性Agent,在解决很多通用性问答时是没问题的。甚至通过底座模型能力,可以通过prompt(关键提示词)调优来获得更好的结果。但是真正落地到非常专业、垂直的领域,通用型Agent是不够用的,比如在海关编码HScode上,它就是只有个位数的正确率。

“但是,如果我们通过引入更多的知识库——既包括我们收集的规则,也包括一些判例,甚至包括一些已有的case(案例)——有一些历史的、标注过的,正确的或者错误的case,用这些具体的专业知识去强化Agent。后面我们发现,他们对agent效果的提升是非常大的,是几十个点的提升。”

张凯夫认为,整体来看,垂直Agent的发展,对当前的国内外AI Agent生态是一个非常好的事情。在一些不需要那么精确的问题上,ChatBot或者Deep Research提供的能力,其实也够了;但在具体的问题上,在细分的领域上,实际上还有千千万的问题可以通过垂直Agent解决——这也是垂直Agent的机会。

日均10亿次调用,中国跨境电商成为第一个实现规模级AI应用的行业

相比于通用模型谈概念、讲参数,更贴近中国普通人经营实际的是,海关编码HScodeAgent等国产垂直Agent,正在增强中国中小企业的竞争力。数据显示,仅阿里国际旗下的AI Business团队,其提供的AI能力,可以帮中小企业解决60多个电商场景中遇到的问题,并在不同环节,带来1%-30%不等的显著提升。

正如我们之前访谈中所观察到的一样:越是中小企业,越能从AI的应用中获益。

公开资料显示,阿里国际的所有电商平台均已应用AI,已服务了超50万卖家,形成了以服务中小企业出海为核心,覆盖全球多元市场、多种电商模式的规模级AI应用。截至本月(2025年7月),阿里国际AI服务的调用量每两个月就会翻一番,平均日调用量已突破10亿次。这使得跨境电商成为第一个实现规模级AI应用的行业。

内部报告显示,过去一年,国内商家使用频次最高的AI功能分别是:图文翻译、图像识别并完善商品信息、营销文案生成。其中,翻译在去年底实现了全面从小模型向大模型的转换。在欧洲TOP语种中,因为翻译效果的提升,消费者满意度提升了30%;在SEO场景下,AI提供的SEO占到了整体SEO的近4成,未来有望达到一半甚至更高。

Agent时代,国产自研的AI产品,进一步完善了普通中国商家应对风险和变化的能力。

以海关编码HS code(Harmonized System Code)为例。HS Code是国际通用的商品分类编码体系,由世界海关组织(WCO)制定并维护。它通过统一的分类规则,将全球贸易商品分为5000多种品目,每个商品类别由6位数字编码表示,是国际贸易、海关清关、关税征收和贸易统计的基础工具。

HS Code在国际贸易中极其重要,关系到商家的合规和效率。但并非每个企业都能拥有自己的HS Code顾问。

AI Agent无疑为这个问题提供了更多解。例如阿里国际旗下的海关编码HS code agent,可以利用Reasoning模型(推理模型)的Planning(任务拆解&步骤规划)、Tool Use(工具调用)、Reflection(自我迭代)能力,通过多轮调用工具不断自主探索,从工作环境中获取更为精确的信息,并不断更新步骤,以得到导向正确答案的路径。

数据显示,在HS code agent的帮助下,跨境商家们对10位HS code填写准确率提升了23%。

不过,谈到AI Agent的“未来”,张凯夫表示,做“最通用的”和“最垂直的”,其实都是可以的——最重要的是研发者和使用者明确人类使用AI的场景。“做非常通用的智能体,类似OpenAI ChatBot,没有任何问题;或者做特别垂直的,把自己专业领域的知识弄得非常明白——比较让人害怕的是夹在中间,因为夹在中间没有壁垒。”

和大模型时代,很多从业者坚信“全球竞逐基础大模型的,最终只有个位数玩家”的研判类似;在对话的最后,张凯夫也关注理性竞争和投入的问题。“现在的行业格局,能做出特别通用的AI Agent的,全世界只有少数几家企业。庞大的机会依然在垂直领域。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
游客在瑞典小岛偶遇中国电动“三蹦子”:纳闷怎么运过去的,车主还是外国人

游客在瑞典小岛偶遇中国电动“三蹦子”:纳闷怎么运过去的,车主还是外国人

极目新闻
2026-01-01 19:24:34
游客在九寨沟住民宿遇停电商家主动免单,店方损失1万多元,老板:大家高高兴兴出来耍,损失就损失了

游客在九寨沟住民宿遇停电商家主动免单,店方损失1万多元,老板:大家高高兴兴出来耍,损失就损失了

极目新闻
2026-01-03 14:18:11
基本盘太稳,一月4000花不完上热搜,河北有人供暖都不敢开,奇怪

基本盘太稳,一月4000花不完上热搜,河北有人供暖都不敢开,奇怪

眼光很亮
2026-01-02 15:04:17
不是石油,不是稀土,中国白银管制锁死全球高科技命脉!

不是石油,不是稀土,中国白银管制锁死全球高科技命脉!

荆楚寰宇文枢
2026-01-03 14:57:15
货币崩盘、民生吃紧、街头失控,伊朗这场抗议究竟在撬动什么

货币崩盘、民生吃紧、街头失控,伊朗这场抗议究竟在撬动什么

前沿天地
2026-01-03 11:46:33
中方态度坚决,日本3个代表团访华全部被拒,外交部提出要求

中方态度坚决,日本3个代表团访华全部被拒,外交部提出要求

博览历史
2026-01-02 13:20:59
表姐一家旅游完,发来29万账单让我付钱,我果断发给妈妈

表姐一家旅游完,发来29万账单让我付钱,我果断发给妈妈

小秋情感说
2026-01-02 13:20:03
A股:下周一,1月5日,出现三个信号,股市尾声,如约而至?

A股:下周一,1月5日,出现三个信号,股市尾声,如约而至?

有范又有料
2026-01-03 09:19:20
全红婵回家太松弛了!骑上小电驴出来炸街,保镖一路隐身跟随

全红婵回家太松弛了!骑上小电驴出来炸街,保镖一路隐身跟随

林子说事
2026-01-03 07:01:53
元旦档对比太惨烈,高分电影目前仅一部,观众为何不买账?

元旦档对比太惨烈,高分电影目前仅一部,观众为何不买账?

娱乐圈笔娱君
2026-01-03 11:50:21
跟了自己十几年的贴身秘书,是美国间谍?仅一个眼神就发现不对劲

跟了自己十几年的贴身秘书,是美国间谍?仅一个眼神就发现不对劲

墨兰史书
2026-01-03 05:45:03
充满血性的家族:康熙与马齐的一场互殴,殴出了富察氏的满门忠烈

充满血性的家族:康熙与马齐的一场互殴,殴出了富察氏的满门忠烈

铭记历史呀
2025-12-26 19:28:42
2025车企成绩单:比亚迪、理想、蔚来、鸿蒙智行均未完成目标销量

2025车企成绩单:比亚迪、理想、蔚来、鸿蒙智行均未完成目标销量

鞭牛士
2026-01-01 20:55:07
婆婆打牌把5岁孙女关进狗笼,儿媳没哭闹,半月后婆婆遭了报应

婆婆打牌把5岁孙女关进狗笼,儿媳没哭闹,半月后婆婆遭了报应

小秋情感说
2026-01-02 13:25:03
东风导弹泄密案:间谍郭万钧一家三口,全部被处以死刑

东风导弹泄密案:间谍郭万钧一家三口,全部被处以死刑

冰点历史
2025-07-15 09:33:13
访华前夕,李在明表态台湾问题

访华前夕,李在明表态台湾问题

新京报政事儿
2026-01-02 22:54:51
为什么“阿拉伯兄弟”不帮伊朗?——披着穆斯林羊皮的波斯独狼

为什么“阿拉伯兄弟”不帮伊朗?——披着穆斯林羊皮的波斯独狼

Wilsonhe8
2025-06-19 02:11:33
李宗仁归国之后,希望能出任人大副委员长一职,毛主席却给出了三条关键理由,直言此事并不合适

李宗仁归国之后,希望能出任人大副委员长一职,毛主席却给出了三条关键理由,直言此事并不合适

史海孤雁
2025-12-25 16:48:16
因长得太漂亮,7次拒绝导演要求遭打压,如今43岁才等到掌声

因长得太漂亮,7次拒绝导演要求遭打压,如今43岁才等到掌声

黎兜兜
2025-12-25 21:57:32
一位普通北京市民的2025年消费记录

一位普通北京市民的2025年消费记录

叮当当科技
2026-01-02 16:46:26
2026-01-03 15:55:00
观察者网 incentive-icons
观察者网
全球视野,中国关怀
131468文章数 1849606关注度
往期回顾 全部

科技要闻

比亚迪销冠!特斯拉2025年交付量跌逾8%

头条要闻

男子花29万买了一辆智界R7展车 撞车后拆出麻花和饼干

头条要闻

男子花29万买了一辆智界R7展车 撞车后拆出麻花和饼干

体育要闻

快船似乎又行了

娱乐要闻

“国服嫂子”司晓迪,曝与多位男星私照

财经要闻

人工智能四问:投资泡沫出现了吗?

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

本地
家居
房产
数码
公开课

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

家居要闻

无形有行 自然与灵感诗意

房产要闻

海大誉府新年家年华暨2号楼耀世加推发布会圆满落幕

数码要闻

苹果首款低价MacBook即将发布:搭载A18 Pro芯片+12.9英寸屏幕

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版