网易首页 > 网易号 > 正文 申请入驻

明略端侧模型上线Thinking模式:从单点模型到能力矩阵,重新理解明略的端侧叙事

0
分享至

近日,明略科技为其端侧GUI模型Mano-CUA上线了Thinking模式,新版本Mano-CUA-4B-2.0已在Hugging Face与ModelScope上线。这次升级用一句话说清就是:让AI从"看一眼屏幕就动手",变成"先想清楚多步怎么走,再动手"。

别小看这一步。它直接抬高了一个对企业最关键的指标——成功率。据明略科技公布的实测,在100道真机macOS GUI任务中(MacBook Pro、Apple M5、16GB内存),Thinking模式让整体任务成功率较快速模式提升约9%;在更考验拆解与判断的中高难度任务上,提升达到约10%至13%。换句话说,那些过去端侧设备"做不稳"的复杂流程,现在开始能交给它了。

更值得关注的是这件事发生在哪里:全程在本地设备上完成,数据无需上云。这恰好同时跨过了企业用AI替人干活的两道坎——复杂任务的可靠性(敢不敢交给它),和数据能不能不出门(合规上能不能用)。当业界都在比模型参数和榜单分数时,真正决定AI能不能在企业里落地的,往往是这两件"榜单之外"的事。Mano-CUA-4B-2.0这次补的,正是这块。

这背后还藏着一个更大的命题:AI到底怎么才能"用得起、用得好"。下面分三层来看——它对企业、对资本市场、对整个行业,分别意味着什么。

对企业:端侧GUI Agent正跨过"生产可用"的门槛

过去一年,让AI直接看懂并操作电脑界面(业界称Computer Use或GUI Agent)成为智能体落地的热门方向。难点在于,真实业务往往是多步骤、跨界面、需要动态判断的流程,Agent点错一步,后续就可能全盘偏离——这正是它在演示里好用、一进真实业务就不敢用的根源。

作为一款GUI VLA(视觉-语言-动作)模型,Mano-CUA具备对图形界面的感知、理解、规划、操作与验证能力,可通过纯视觉方式直接操控桌面软件、网页界面以及更复杂的图形化工作流。Thinking模式的价值,在于让模型执行前进行更充分的任务拆解与推理判断:面对一个跨多个软件、需要中途判断的流程,它会先在"脑子里"把步骤想清楚、对可能的岔路做预判,再动手。前面提到的9%与10%–13%的成功率提升,正来自这种"先规划、再执行"的能力。

更关键的差异在隐私与合规。Mano-CUA支持在Apple M4/M5芯片设备上本地运行,推理过程无需将数据上传云端。对金融、政务、医疗、制造等对数据出域较为敏感的行业,这往往不是加分项,而是能不能用的前提。在断网、本地部署或隐私敏感的环境下,端侧设备依然能承担较复杂的GUI自动化任务,这是端侧路线相较云端方案的一处结构性差异。

此外,纯视觉操作还降低了落地门槛。由于不必依赖目标系统开放API,面对大量没有标准接口的老旧业务系统,Agent也能像人一样看着屏幕操作,省去了企业自动化中常被忽视的接口适配成本。结合本地部署,企业得以在办公自动化、软件操作、私有化业务流程等场景中,以相对可控的成本构建自己的智能体应用。

对资本市场:端侧路线背后,是一道关于AI商业化的现实考题

跳出产品本身,端侧智能体的进展也为观察AI商业化提供了一个值得关注的视角。

当前大模型的成本结构与互联网时代存在明显差异。互联网生意的边际成本趋近于零,而大模型云端推理每一次调用都要消耗算力与电力,调用规模越大成本越高,更接近电力或制造业的逻辑。这也是市场对算力环节给出较高确定性估值的底层原因之一。在这一背景下,把推理能力下沉到端侧设备,被越来越多从业者视为对冲推理成本、提升单位算力产出效率的一条现实路径。

明略科技在端侧的布局正落在这条线索上。此次明略也正式宣布,来源项目Mano-P由单一模型升级为面向端侧的统一模型序列,未来还将持续发布覆盖不同参数量级、不同模态的端侧模型,试图打造一个开箱即用的端侧模型工具箱。这一动作透露出的思路,是从"做一个跑分领先的模型"转向"建一套可持续迭代的端侧能力矩阵"——后者更接近基础设施的逻辑,也更可能形成长期价值。

值得客观看待的是,端侧智能体仍处商业化早期,可对标的成熟上市样本有限,真实场景中的规模化效果仍需时间验证。但这一方向所指向的命题——如何在控制成本的前提下,让AI在企业真实环境中可靠地完成工作——正是当下AI产业从"能不能用"走向"用得起、用得好"的关键所在。对于试图在这一命题上给出系统性答案的公司,市场或许需要一套不同于"比拼模型参数"的视角去理解其价值。

对行业:端侧、GUI操作、模型序列,三条线索同时收敛

把视野放到行业,会发现端侧智能体正成为越来越多团队共同投入的方向,明略并不孤单。

今年5月,面壁智能开源了1.3B参数的端侧多模态模型MiniCPM-V 4.6,主打小参数、低内存占用,据其披露仅需约6GB内存即可在手机等终端运行;字节跳动的GUI Agent技术UI-TARS,则据公开报道正在向终端设备渗透。不同玩家路径各异:有的侧重模型层的参数效率,有的依托自有终端入口分发,明略则更强调端侧模型能力与协作网络的全栈打通。

与此同时,衡量Agent操作电脑能力的权威基准OSWorld,业界最好成绩已逼近80%,标志着智能体正越过"能不能操作电脑"的临界点。能力问题趋于解决后,竞争焦点正从"单一模型谁更强",转向"谁能提供一整套可持续迭代、开箱即用的端侧能力"——竞争单位从一个模型,升级为一套模型序列加配套生态。单点模型容易被追平,成体系的生态才更可能形成路径依赖。

在这条赛道上,明略的差异化在于它试图打通的是"端侧模型—推理能力—协作网络"的全栈链路。Mano-CUA负责看懂并操作界面,Thinking模式让它从"能演示"走向"能可靠完成",而Mano-P序列化则意味着这套能力可以持续扩展、覆盖更多场景。这也呼应了一个朴素判断:模型跑分是入场券,而非护城河;真正拉开差距的,是长链路任务的稳定性、工具调用的容错能力,以及企业级落地的工程化水平——这些靠刷榜单解决不了,本质是系统工程与长期迭代的结果。

当Agent学会"先想再动手",它就向"从演示工具变成生产力工具"迈进了一步。端侧让它更可信,Thinking让它更可靠。对企业,这意味着AI能在自己的设备上、隔着隐私墙,可靠地把活干完;对行业,这是智能体从"秀能力"转向"拼落地"的一个注脚;而对资本市场,它提示的或许是一个更根本的问题——衡量一家AI公司的价值,除了模型有多强,还要看它能不能让AI在真实世界里,用得起、也用得好。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
多名演员发文抵制!业内人士:很悲哀,收入猛降八成,几乎成“免费劳动力”

多名演员发文抵制!业内人士:很悲哀,收入猛降八成,几乎成“免费劳动力”

浙江之声
2026-07-04 08:13:16
詹姆斯去向逐渐尘埃落定,布朗尼离开湖人后的下家也逐渐清晰

詹姆斯去向逐渐尘埃落定,布朗尼离开湖人后的下家也逐渐清晰

夜白侃球
2026-07-05 12:27:56
你们有何颜面作出好的示范?

你们有何颜面作出好的示范?

胖胖说他不胖
2026-07-04 10:00:12
太尴尬了!一员工因到点下班,领导在全员群公开辱骂,反遭怒怼

太尴尬了!一员工因到点下班,领导在全员群公开辱骂,反遭怒怼

火山詩话
2026-07-04 08:11:30
于帕梅卡诺:奥利塞不会加盟皇马,他会留在拜仁

于帕梅卡诺:奥利塞不会加盟皇马,他会留在拜仁

懂球帝
2026-07-05 12:31:15
检察日报评论要让泰山景区领导睡不着觉了

检察日报评论要让泰山景区领导睡不着觉了

吐槽青年
2026-07-04 20:51:05
巴拉圭门将:我们踢球脏?那又能怎么办呢,我们就是这么强硬

巴拉圭门将:我们踢球脏?那又能怎么办呢,我们就是这么强硬

懂球帝
2026-07-05 10:01:04
那把U型锁,不过是复旦沈逸教授换成了话筒

那把U型锁,不过是复旦沈逸教授换成了话筒

文史非常道毕延河
2026-07-05 16:16:39
普通人对自己最好的托举,它排第一

普通人对自己最好的托举,它排第一

十点读书
2026-07-04 18:40:31
加内特封神操作!3500万美元工资延迟7年拿,到底有多聪明?

加内特封神操作!3500万美元工资延迟7年拿,到底有多聪明?

篮眼看球
2026-07-05 16:54:17
马斯克的神秘学校首次全球招生!不看分数、不用考试、老师都是NASA科学家

马斯克的神秘学校首次全球招生!不看分数、不用考试、老师都是NASA科学家

留学生日报
2026-07-04 19:19:11
日本人乘坐中国高铁后,愤怒说出三大“缺点”,让人无力反驳

日本人乘坐中国高铁后,愤怒说出三大“缺点”,让人无力反驳

快乐彼岸
2026-07-02 06:21:59
3名状元+2名榜眼!联盟最强天赋队诞生,詹姆斯戴维斯有望再联手

3名状元+2名榜眼!联盟最强天赋队诞生,詹姆斯戴维斯有望再联手

大卫的篮球故事
2026-07-05 18:36:02
女生乘车离开,一网约车司机崩溃:“全是素颜霜,根本擦不掉……”

女生乘车离开,一网约车司机崩溃:“全是素颜霜,根本擦不掉……”

都市快报橙柿互动
2026-07-04 17:32:50
中日决战!7月6日赛程!蒯曼vs张本美和

中日决战!7月6日赛程!蒯曼vs张本美和

最爱乒乓球
2026-07-05 14:41:36
离开黄有龙后,她转身嫁给富豪,4年连生3娃,43岁深陷抑郁症

离开黄有龙后,她转身嫁给富豪,4年连生3娃,43岁深陷抑郁症

日不西沉
2026-07-05 17:47:33
WTT大满贯决赛赛程表!7月6日男单决赛对阵表!女单决赛对阵时间

WTT大满贯决赛赛程表!7月6日男单决赛对阵表!女单决赛对阵时间

林子说事
2026-07-05 16:10:55
伊布:C罗3场禁赛被撤销!国际足联总给他和葡萄牙优待 莱万转发

伊布:C罗3场禁赛被撤销!国际足联总给他和葡萄牙优待 莱万转发

念洲
2026-07-05 10:30:01
每体:拉什福德在英格兰队训练中穿裆过掉孔萨,后者随即倒地

每体:拉什福德在英格兰队训练中穿裆过掉孔萨,后者随即倒地

懂球帝
2026-07-05 17:50:10
某被裁大厂员工要“栽”了。被媳妇“炫富”赔偿56万,被网友扒出

某被裁大厂员工要“栽”了。被媳妇“炫富”赔偿56万,被网友扒出

蚂蚁大喇叭
2026-07-04 18:05:49
2026-07-05 20:12:49
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1121615文章数 1336658关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

俄乌战场近期突然激烈 专家:战场逻辑和重点发生改变

头条要闻

俄乌战场近期突然激烈 专家:战场逻辑和重点发生改变

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

霉霉婚礼照片泄露 有四人违规

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

教育
手机
数码
公开课
军事航空

教育要闻

2026高考志愿填完后别再只傻傻等录取!档案状态一定要盯紧!

手机要闻

全网吵翻!到底是谁带头取消了有线耳机?网友:错怪苹果了

数码要闻

三星SSD 990规格曝光:连续读取速度最高为7250MB/s

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

普京与特朗普通话85分钟 细节公布

无障碍浏览 进入关怀版