网易首页 > 网易号 > 正文 申请入驻

明略端侧模型上线Thinking模式:从单点模型到能力矩阵,重新理解明略的端侧叙事

0
分享至

近日,明略科技为其端侧GUI模型Mano-CUA上线了Thinking模式,新版本Mano-CUA-4B-2.0已在HuggingFace与ModelScope上线。这次升级用一句话说清就是:让AI从"看一眼屏幕就动手",变成"先想清楚多步怎么走,再动手"。

别小看这一步。它直接抬高了一个对企业最关键的指标——成功率。据明略科技公布的实测,在100道真机macOSGUI任务中(MacBookPro、AppleM5、16GB内存),Thinking模式让整体任务成功率较快速模式提升约9%;在更考验拆解与判断的中高难度任务上,提升达到约10%至13%。换句话说,那些过去端侧设备"做不稳"的复杂流程,现在开始能交给它了。

更值得关注的是这件事发生在哪里:全程在本地设备上完成,数据无需上云。这恰好同时跨过了企业用AI替人干活的两道坎——复杂任务的可靠性(敢不敢交给它),和数据能不能不出门(合规上能不能用)。当业界都在比模型参数和榜单分数时,真正决定AI能不能在企业里落地的,往往是这两件"榜单之外"的事。Mano-CUA-4B-2.0这次补的,正是这块。

这背后还藏着一个更大的命题:AI到底怎么才能"用得起、用得好"。下面分三层来看——它对企业、对资本市场、对整个行业,分别意味着什么。

对企业:端侧GUIAgent正跨过"生产可用"的门槛

过去一年,让AI直接看懂并操作电脑界面(业界称ComputerUse或GUIAgent)成为智能体落地的热门方向。难点在于,真实业务往往是多步骤、跨界面、需要动态判断的流程,Agent点错一步,后续就可能全盘偏离——这正是它在演示里好用、一进真实业务就不敢用的根源。

作为一款GUIVLA(视觉-语言-动作)模型,Mano-CUA具备对图形界面的感知、理解、规划、操作与验证能力,可通过纯视觉方式直接操控桌面软件、网页界面以及更复杂的图形化工作流。Thinking模式的价值,在于让模型执行前进行更充分的任务拆解与推理判断:面对一个跨多个软件、需要中途判断的流程,它会先在"脑子里"把步骤想清楚、对可能的岔路做预判,再动手。前面提到的9%与10%–13%的成功率提升,正来自这种"先规划、再执行"的能力。

更关键的差异在隐私与合规。Mano-CUA支持在AppleM4/M5芯片设备上本地运行,推理过程无需将数据上传云端。对金融、政务、医疗、制造等对数据出域较为敏感的行业,这往往不是加分项,而是能不能用的前提。在断网、本地部署或隐私敏感的环境下,端侧设备依然能承担较复杂的GUI自动化任务,这是端侧路线相较云端方案的一处结构性差异。

此外,纯视觉操作还降低了落地门槛。由于不必依赖目标系统开放API,面对大量没有标准接口的老旧业务系统,Agent也能像人一样看着屏幕操作,省去了企业自动化中常被忽视的接口适配成本。结合本地部署,企业得以在办公自动化、软件操作、私有化业务流程等场景中,以相对可控的成本构建自己的智能体应用。

对资本市场:端侧路线背后,是一道关于AI商业化的现实考题

跳出产品本身,端侧智能体的进展也为观察AI商业化提供了一个值得关注的视角。

当前大模型的成本结构与互联网时代存在明显差异。互联网生意的边际成本趋近于零,而大模型云端推理每一次调用都要消耗算力与电力,调用规模越大成本越高,更接近电力或制造业的逻辑。这也是市场对算力环节给出较高确定性估值的底层原因之一。在这一背景下,把推理能力下沉到端侧设备,被越来越多从业者视为对冲推理成本、提升单位算力产出效率的一条现实路径。

明略科技在端侧的布局正落在这条线索上。此次明略也正式宣布,来源项目Mano-P由单一模型升级为面向端侧的统一模型序列,未来还将持续发布覆盖不同参数量级、不同模态的端侧模型,试图打造一个开箱即用的端侧模型工具箱。这一动作透露出的思路,是从"做一个跑分领先的模型"转向"建一套可持续迭代的端侧能力矩阵"——后者更接近基础设施的逻辑,也更可能形成长期价值。

值得客观看待的是,端侧智能体仍处商业化早期,可对标的成熟上市样本有限,真实场景中的规模化效果仍需时间验证。但这一方向所指向的命题——如何在控制成本的前提下,让AI在企业真实环境中可靠地完成工作——正是当下AI产业从"能不能用"走向"用得起、用得好"的关键所在。对于试图在这一命题上给出系统性答案的公司,市场或许需要一套不同于"比拼模型参数"的视角去理解其价值。

对行业:端侧、GUI操作、模型序列,三条线索同时收敛

把视野放到行业,会发现端侧智能体正成为越来越多团队共同投入的方向,明略并不孤单。

今年5月,面壁智能开源了1.3B参数的端侧多模态模型MiniCPM-V4.6,主打小参数、低内存占用,据其披露仅需约6GB内存即可在手机等终端运行;字节跳动的GUIAgent技术UI-TARS,则据公开报道正在向终端设备渗透。不同玩家路径各异:有的侧重模型层的参数效率,有的依托自有终端入口分发,明略则更强调端侧模型能力与协作网络的全栈打通。

与此同时,衡量Agent操作电脑能力的权威基准OSWorld,业界最好成绩已逼近80%,标志着智能体正越过"能不能操作电脑"的临界点。能力问题趋于解决后,竞争焦点正从"单一模型谁更强",转向"谁能提供一整套可持续迭代、开箱即用的端侧能力"——竞争单位从一个模型,升级为一套模型序列加配套生态。单点模型容易被追平,成体系的生态才更可能形成路径依赖。

在这条赛道上,明略的差异化在于它试图打通的是"端侧模型—推理能力—协作网络"的全栈链路。Mano-CUA负责看懂并操作界面,Thinking模式让它从"能演示"走向"能可靠完成",而Mano-P序列化则意味着这套能力可以持续扩展、覆盖更多场景。这也呼应了一个朴素判断:模型跑分是入场券,而非护城河;真正拉开差距的,是长链路任务的稳定性、工具调用的容错能力,以及企业级落地的工程化水平——这些靠刷榜单解决不了,本质是系统工程与长期迭代的结果。

当Agent学会"先想再动手",它就向"从演示工具变成生产力工具"迈进了一步。端侧让它更可信,Thinking让它更可靠。对企业,这意味着AI能在自己的设备上、隔着隐私墙,可靠地把活干完;对行业,这是智能体从"秀能力"转向"拼落地"的一个注脚;而对资本市场,它提示的或许是一个更根本的问题——衡量一家AI公司的价值,除了模型有多强,还要看它能不能让AI在真实世界里,用得起、也用得好。

以上内容与数据,与有连云立场无关,不构成投资建议。据此操作,风险自担。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
杨毅:李凯尔归化是高层领导特批 他能打NBA是角色球员带不动我们

杨毅:李凯尔归化是高层领导特批 他能打NBA是角色球员带不动我们

狼叔评论
2026-07-04 20:26:08
世界杯爆发冲突!最脏球队袭击法国 姆巴佩被针对 球迷:这是拳击

世界杯爆发冲突!最脏球队袭击法国 姆巴佩被针对 球迷:这是拳击

安海客
2026-07-05 09:13:31
格局窄到离谱!伊朗连国葬都拿来攻讦邻国,这波操作实在难看

格局窄到离谱!伊朗连国葬都拿来攻讦邻国,这波操作实在难看

老马拉车莫少装
2026-07-04 10:26:26
大满贯捷报:国乒抗日成功夺冠!王艺迪剃光头,赛后发言笑爆全场

大满贯捷报:国乒抗日成功夺冠!王艺迪剃光头,赛后发言笑爆全场

桃叶渡春
2026-07-05 10:49:20
风水轮流转!中国网友集体反对欧洲吹空调,奥巴马回旋镖砸中西方

风水轮流转!中国网友集体反对欧洲吹空调,奥巴马回旋镖砸中西方

普陀动物世界
2026-07-05 06:46:49
外蒙宣布独立时,只有一个部落支持留在中国,如今情况怎么样了?

外蒙宣布独立时,只有一个部落支持留在中国,如今情况怎么样了?

抽象派大师
2026-06-29 16:55:46
哇塞!这才叫真正的漂亮,太美了!

哇塞!这才叫真正的漂亮,太美了!

TVB的四小花
2026-07-05 10:40:59
A股“捡钱时代”已到来:如果手中只有12万,建议死啃这九张思维导图,从贫穷到富有就是这么简单

A股“捡钱时代”已到来:如果手中只有12万,建议死啃这九张思维导图,从贫穷到富有就是这么简单

新浪财经
2026-07-04 04:46:43
整整4.46亿美金!东契奇别高兴太早,湖人自己选的路跪着也要走完

整整4.46亿美金!东契奇别高兴太早,湖人自己选的路跪着也要走完

世界体育圈
2026-07-03 17:52:57
1947年,蒋介石问延安农民:你见过毛泽东吗?农民回答三个字

1947年,蒋介石问延安农民:你见过毛泽东吗?农民回答三个字

莫地方
2026-07-03 00:06:56
都体:尤文为凯西提供3+1合同,年薪约500万欧

都体:尤文为凯西提供3+1合同,年薪约500万欧

懂球帝
2026-07-05 11:48:07
5日凌晨大满贯,国乒喜讯,4-0剃光头大胜、4强,张本美和太狠了

5日凌晨大满贯,国乒喜讯,4-0剃光头大胜、4强,张本美和太狠了

林子说事
2026-07-05 06:55:42
别硬扛高温!1.5匹空调开24小时,电费真相让你大跌眼镜

别硬扛高温!1.5匹空调开24小时,电费真相让你大跌眼镜

小兔子发现大事情
2026-07-04 16:22:21
Opta预测世界杯1/8决赛晋级概率:法国86.6%,阿根廷79.7%

Opta预测世界杯1/8决赛晋级概率:法国86.6%,阿根廷79.7%

懂球帝
2026-07-05 00:49:24
心理学:凡是从不参加同学聚会、不爱发动态、不混圈子的人,十有八九在这两个方面远超常人,观察了身边上百人屡试不爽

心理学:凡是从不参加同学聚会、不爱发动态、不混圈子的人,十有八九在这两个方面远超常人,观察了身边上百人屡试不爽

心理观察局
2026-07-05 06:49:09
下个云南锗业?10元低价磷化铟+800G光芯片龙头 主力爆抢3亿筹码

下个云南锗业?10元低价磷化铟+800G光芯片龙头 主力爆抢3亿筹码

元芳说投资
2026-07-05 06:25:14
世界杯带火非洲岛国佛得角,人口50多万拥有7座客运机场,当地中国人称:最近国人多了起来

世界杯带火非洲岛国佛得角,人口50多万拥有7座客运机场,当地中国人称:最近国人多了起来

时代财经
2026-07-04 20:18:23
如何判断一个人是不是性工作者?网友说看倒精方法是否老练!

如何判断一个人是不是性工作者?网友说看倒精方法是否老练!

灯锦年
2026-07-01 17:38:16
九华山美女道士,靠身体施法“日进斗金”,8个男徒弟曝光内幕

九华山美女道士,靠身体施法“日进斗金”,8个男徒弟曝光内幕

苏大强专栏
2025-05-08 15:16:18
7月5日足球世界杯推荐:精选4场赛事解析,巴西vs挪威,含比分!

7月5日足球世界杯推荐:精选4场赛事解析,巴西vs挪威,含比分!

足球二串大王
2026-07-05 08:23:20
2026-07-05 13:04:49
有连云 incentive-icons
有连云
中国领先的AI原生金融智能平台,为金融机构等提供智能体全链路解决方案。
277534文章数 62995关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

中国为何援助"中高收入国家"佛得角 媒体披露原因

头条要闻

中国为何援助"中高收入国家"佛得角 媒体披露原因

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

王力宏成都舞台受伤 仍然坚持三小时

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

手机
健康
亲子
家居
游戏

手机要闻

苹果、小米、荣耀全部原地没动,vivo、OPPO一升一降

听说少吃点能抗衰老?专家讲解!

亲子要闻

颠覆认知的新发现!出生仅几十小时的婴儿,竟自带天生数感?

家居要闻

传奇筑 日常诗

索尼放弃PS实体版游戏 价格垄断令玩家担忧

无障碍浏览 进入关怀版