网易首页 > 网易号 > 正文 申请入驻

还在纠结「本地 or 云端」?Perplexity 的「任务路由」彻底解决 AI 难题

0
分享至


不是问题的问题。


作者|桦林舞王

编辑|靖宇

当地时间 6 月 2 日,Perplexity 在 Computex 2026 的 Intel 主题演讲上,做了一个很多人没太在意、但可能改变整个 AI 应用行业走向的演示。

不是新模型,不是更快的搜索,而是一套「任务路由」系统。

简单来说,就是 AI 自己决定哪些事在你的电脑上做,哪些事扔给云端——而不是让用户去选。

CEO Aravind Srinivas 和 Intel CEO Lip-Bu Tan 站在台上,在一台跑着 Intel Core Ultra Series 3 芯片的设备上演示了全程。本地模型负责判断,云端模型负责执行复杂任务,两者之间的调度对用户完全透明。

这件事听起来像是一个工程细节,但背后藏着一个更大的问题:AI 应用的架构之战,已经从「谁的模型更强」,悄悄转向了「谁能把资源调度得更聪明」

01

本地 VS 云端

过去两年,AI 行业走了一条很直接的路:算力不够?加算力。模型不够大?加参数。隐私有顾虑?那就……先搁置。

但企业用户不会永远搁置隐私问题。

一个典型的场景是:你让 AI 助手帮你整理会议记录,里面可能有未公开的财务数据、客户信息、合同条款。这些东西传到云端,法务部门就会来敲门。但如果只用本地模型处理,算力撑不住,效果又打折扣。


Perplexity 在跑任务时关注到了数据隐私问题|图片来源:Perplexity

这就是 Perplexity 混合推理(Hybrid Agentic Inference)试图解开的死结。

它的核心逻辑不复杂——让本地模型先做「侦察员」,判断每一个子任务的敏感程度和复杂度,然后决定是留在本地处理,还是打包发给云端的前沿模型。用户不需要做任何选择,系统自动完成路由。

据技术分析,任务分类发生在 API 层。「这是 5 个 token 的问答,还是 500 个 token 的代码生成请求?」——本地模型用 4 位量化处理前者,内存占用减少约 75%;云端模型接管后者,但在传输前会做确定性哈希处理,防止原始数据泄漏。

理论上,边缘设备的往返延迟可以因此降低 60%

当然,「理论上」这三个字很重要。

02

从「AI 搜索」到任务路由

如果只看今天的演示,容易误以为这是 Perplexity 的一次突然发力。但把时间线拉长,会发现这家公司在过去半年里做的每一步,都在为这个方向铺路。

今年 3 月,Perplexity 与 CoreWeave 达成战略合作,用专属的 NVIDIA GB200 NVL72 集群跑推理工作负载,把云端算力基础设施夯实。5 月中旬,它推出了 Mac 应用,把 Personal Computer 功能开放给 Pro 和 Enterprise 用户——之前只有 Max 用户才能用。这一步很关键,相当于在正式推出混合推理之前,先把用户教育做了一遍,让大家习惯「AI 在本地跑」这件事。

Perplexity 任务路由的演示视频|图片来源:Perlexity

到今天的 Computex 演示,混合推理功能还没有正式上线,官方说会在 7 月推出。但选在这个时间点、这个舞台亮相,用意很清楚——英特尔需要一个真实的 AI PC 用例,Perplexity 需要一个比自家官网更大的曝光窗口,双方一拍即合。

与此同时,Perplexity 的商业版图也在加速扩张。从 18 亿美元估值融资 1 亿美元,到两个月后以 200 亿美元估值完成 2 亿美元融资,自成立三年来累计融资已达 15 亿美元。钱还在持续进来,说明投资人押注的不只是搜索,而是整个 AI 代理基础设施的叙事。

03

聪明的不是模型,是调度器

VentureBeat 的分析抓到了这件事的本质。它指出,Perplexity 这套系统的关键主张,不是「本地可以跑模型」——这件事已经有几十种工具能做到了。真正的差异化在于,Perplexity 的系统自己做路由决策,逐个任务,不需要用户提前配置

这是一个视角的根本转变。

以前,「本地 vs 云端」是一个用户层面的选择题。你要么信任云端,要么忍受本地模型的能力上限。Perplexity 想把这道选择题从用户面前拿走,变成系统内部的一个工程问题。

但这恰恰是挑战最大的地方。

要让编排器在生产环境中可靠运行,它需要同时做对几件事:准确评估每个子任务的复杂程度,理解涉及数据的敏感级别,了解用户本地硬件的实时性能状态,还要管理跨设备-云端的任务状态同步。任何一个环节判断失误,轻则输出质量下降,重则把不该上云的数据送出去了。

MacRumors 社区里有用户的担忧更直接——「这是让 AI 出现幻觉然后删文件的好办法。」这话听起来像段子,但触到了一个真实的焦虑:当 AI 代理获得了更多系统权限,并且还要自主做路由决策的时候,「可解释性」和「可审计性」变得比任何时候都更重要。


Perplexity 任务完成提示页面|图片来源:Perplexity

企业安全专家也提出了另一层风险——如果云端模型的调用链没有经过 SOC 2 等级的验证,混合架构本身可能反而引入新的供应链安全漏洞。隐私问题还没解决,安全问题已经跟上来了。

值得一提的是,Perplexity 还在另一个战场上承受压力。

截至今年 5 月底,已有包括 CNN、纽约时报、News Corp 在内的九家媒体机构对其提起有效诉讼,指控版权和商标侵权。这是一个悬在头顶、迟迟没有定论的法律风险。混合推理是产品层的创新,但版权纠纷是商业模式层的隐患,两者并行,并不互相抵消。

一家公司可以在技术架构上做出令人印象深刻的判断,同时在商业合规上依然面临真实的挑战。这两件事不矛盾,但放在一起,会让「Perplexity 的未来」这个命题变得更复杂一些。

说白了,混合推理是 Perplexity 押注的方向,但押注能不能兑现,取决于执行层面的每一个细节,以及它能否在法律压力下保持足够的专注度。

AI 应用正在经历一次安静的架构革命。不是哪个模型又刷新了 benchmark,而是「算力在哪里跑、数据往哪里走」这个底层问题,开始被认真对待。

Perplexity 今天在 Computex 台上演示的那几分钟,可能比任何一次模型发布都更值得被记住——因为它在讲的,是 AI 应用该怎么被构建,而不只是 AI 能做什么。

至于 7 月上线之后,这套系统在真实用户手里能交出什么成绩单,那才是这个故事真正开始的地方。

*头图来源:Perplexity

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

具身智能融资热度持续爆表,一个月估值涨 10 倍、大牛出来就是几十亿天使、三轮融资同时开……这波热潮理性吗?国内外路线有何差异?技术真实进展到哪了?

今晚 20:00,极客公园视频号直播间,我们请来了蓝驰创投合伙人曹巍、具身智能投资人笔盒、诺亦腾机器人 创始人/首席执行官戴若犁,和极客公园副主编郑玄、作者 Li Yuan,一起聊聊这个行业的真相与泡沫。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
辞去央视工作,嫁大18岁李铁为妻,如今52岁张泉灵已走上另一条路

辞去央视工作,嫁大18岁李铁为妻,如今52岁张泉灵已走上另一条路

不似少年游
2026-06-03 14:31:28
9死76伤,泽连斯基放弃反击,基辅改口求和后,普京一句话浇凉水

9死76伤,泽连斯基放弃反击,基辅改口求和后,普京一句话浇凉水

面包夹知识
2026-06-02 15:24:48
刚提 6 小时焕新 Model Y 被大货车撞全损,特斯拉车主:人没事、再买一辆!

刚提 6 小时焕新 Model Y 被大货车撞全损,特斯拉车主:人没事、再买一辆!

新浪财经
2026-06-01 15:29:48
美国公司心真大,想重返月球,发动机外包给印度,结果被炸回原形

美国公司心真大,想重返月球,发动机外包给印度,结果被炸回原形

王新喜
2026-06-02 13:23:55
荷兰没料到,闯中国领空这事没完,中方当各国面,让荷兰下不来台

荷兰没料到,闯中国领空这事没完,中方当各国面,让荷兰下不来台

共工之锚
2026-06-01 13:17:56
刘伯承手下有五大虎将:三个副国级,一个正国级,一个国防部长

刘伯承手下有五大虎将:三个副国级,一个正国级,一个国防部长

元哥说历史
2026-06-03 16:30:03
上海vs广厦总决赛G5时间已定!CCTV5直播,广厦队有望取胜?

上海vs广厦总决赛G5时间已定!CCTV5直播,广厦队有望取胜?

削桐作琴
2026-06-03 16:23:33
匈牙利暗示乌克兰和摩尔多瓦入盟谈判取得突破,拟放弃对乌否决权

匈牙利暗示乌克兰和摩尔多瓦入盟谈判取得突破,拟放弃对乌否决权

透视到底
2026-06-03 15:10:49
女生为秀恩爱,偷偷在男友博士论文里编造了第 52 条参考文献,网友:博士男友秒变硕士前男友

女生为秀恩爱,偷偷在男友博士论文里编造了第 52 条参考文献,网友:博士男友秒变硕士前男友

生物学霸
2026-06-02 17:13:59
4名顾客吃火锅写5000字差评:称食材腥,不愿买单,现场画面扒出

4名顾客吃火锅写5000字差评:称食材腥,不愿买单,现场画面扒出

李晚书
2026-06-01 10:53:54
为什么水运比陆运成本低那么多?看完网友的分享太涨知识了!

为什么水运比陆运成本低那么多?看完网友的分享太涨知识了!

另子维爱读史
2026-05-31 08:24:27
89岁TVB老戏骨钟景辉逝世,睡梦中安详离开,曾患肠癌一生未婚育

89岁TVB老戏骨钟景辉逝世,睡梦中安详离开,曾患肠癌一生未婚育

史料布籍
2026-06-03 14:32:39
阿隆索疯了!切尔西要回购自家水货,当年 6000 万买来被扫地出门

阿隆索疯了!切尔西要回购自家水货,当年 6000 万买来被扫地出门

奶盖熊本熊
2026-06-03 05:08:29
我在法国被半根面包干趴下那天,才明白中国人对法棍的误会太深了

我在法国被半根面包干趴下那天,才明白中国人对法棍的误会太深了

天下霸奇
2026-06-02 08:34:41
总决赛球员薪资排名!唐斯排第一,布伦森物超所值,文班未进前十

总决赛球员薪资排名!唐斯排第一,布伦森物超所值,文班未进前十

小禾的体育
2026-06-03 16:46:21
伊能静一年花掉120万保养,糖不碰冷饮不喝,结果现在上街得用伞和帽子把脸裹死

伊能静一年花掉120万保养,糖不碰冷饮不喝,结果现在上街得用伞和帽子把脸裹死

可乐谈情感
2026-06-03 00:41:29
形势到底有多严峻?国人心心念念的特斯拉竟会裁员,评论区炸锅…

形势到底有多严峻?国人心心念念的特斯拉竟会裁员,评论区炸锅…

慧翔百科
2026-06-02 08:27:57
24小时已过,普京政府准时断供,航油不卖中国,欧盟启动应急方案

24小时已过,普京政府准时断供,航油不卖中国,欧盟启动应急方案

面包夹知识
2026-06-03 16:05:38
《狼牙山五壮士》为何被移除课本?专家的解释,令人愤慨

《狼牙山五壮士》为何被移除课本?专家的解释,令人愤慨

明月清风阁
2026-06-02 17:15:09
四十位相声演员证明,相声演员参演影视剧,就是降维打击

四十位相声演员证明,相声演员参演影视剧,就是降维打击

我就是个码字的
2026-06-03 07:30:03
2026-06-03 17:07:00
极客公园
极客公园
让最棒的创新成为头条
12122文章数 78892关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

94版《三国演义》成观众心中"白月光" 多位扮演者离世

头条要闻

94版《三国演义》成观众心中"白月光" 多位扮演者离世

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

房产
手机
旅游
时尚
本地

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

手机要闻

荣耀确认Robot Phone手机初代抗跌落已经是旗舰水平

旅游要闻

海拔3666米的牛背山,凭啥承接“登超”?

休闲T恤舒适感极佳,夏天必不可少!轻轻松松拿捏日常的造型

本地新闻

用杨柳青年画的方式,打开天津

无障碍浏览 进入关怀版