2025年的这个冬天,对于中国科技圈而言,注定是不平静的。
就在12月5日,字节跳动旗下的豆包手机助手团队突然发布了一份《关于调整AI操作手机能力的说明》。这份公告的发布时间点非常微妙——距离他们高调推出那款号称“能自动操作APP”的AI手机(Nubia M153技术预览版),仅仅过去了不到5天。
在公告中,豆包团队表现得十分诚恳但又透着一丝无奈。他们宣布,为了“让技术走得更稳、更远”,将对AI操作手机的能力进行一系列规范化调整。这些调整包括限制AI在刷分、激励领取场景的使用,暂停对金融类APP的操作,以及限制部分竞技游戏场景的辅助能力。
从发布时的“全网沸腾”,到如今的“主动降温”,这短短100多个小时里发生的剧情反转,不仅是一次产品的试错,更是AI时代“新物种”与移动互联网“旧规则”之间的一次剧烈碰撞。
这背后,到底发生了什么?
48小时的“过山车”体验
把时间拨回12月1日。当时,字节跳动联合中兴通讯发布了这款搭载豆包大模型的手机。在长达11分钟的演示视频里,它展示了一种令所有人眼前一亮的能力:GUI Agent(图形用户界面智能体)。
![]()
简单来说,这款手机里的AI不再只是陪你聊天的吉祥物,它像是一个隐形的管家,拥有了“手指”。它能帮你打开淘宝、京东、拼多多进行比价并下单;能帮你操作特斯拉App打开后备箱;甚至能帮你截取外卖订单发给微信好友。
这种“所见即所得”的操作能力,被视为继苹果Siri之后的又一次交互革命。一时间,这款售价3499元的工程机被炒到了5000元以上,甚至出现了“一码难求”的盛况。
现实的反馈来得比预想中更快、更猛烈。
12月3日,也就是手机发货后的第二天,首批用户群里开始出现“炸锅”的现象。多位用户反馈,当他们试图使用豆包手机助手在微信里发送消息、抢红包,或者进行转账操作时,遭遇了腾讯方面的强力风控。
微信界面弹出了红色的警告字样:“登录环境异常”,随即账号被强制退出,甚至被暂时限制登录。紧接着,支付宝等金融类App也出现了类似的情况。有用户抱怨:“我只是想让AI帮我点个外卖,结果支付环节直接被拦截了。”
更尴尬的是,部分试图用AI“解放双手”打游戏的用户发现,王者荣耀账号因为被判定使用“第三方辅助(外挂)”而被禁赛。
面对接二连三的“翻车”事故,豆包团队不得不按下了暂停键。
技术“越界”:AI为何撞上了风控墙?
在普通用户看来,这似乎是App厂商在“针对”新手机。但如果从技术和安全的角度深挖,你会发现这场冲突几乎是必然的。
豆包手机助手所采用的“GUI Agent”技术,其本质是通过视觉模型识别手机屏幕上的内容,然后通过系统底层权限,模拟人类的手指进行点击和滑动。
问题恰恰就出在“模拟”二字上。
对于微信、支付宝这样拥有亿级用户的国民级应用来说,区分“真人的手指”和“机器的脚本”是风控系统的核心任务。在此之前,大量的黑产、灰产正是利用模拟点击技术(如群控设备、自动抢红包挂、游戏脚本)来破坏生态平衡、窃取资金或制造垃圾流量。
《腾讯微信软件许可及服务协议》中明确规定,禁止用户使用自动化工具、插件或外挂进行操作。这不仅是霸王条款,更是保障金融安全和平台公平的底线。
当豆包手机助手试图用AI去接管这些操作时,在App的服务器端看来,这与黑客使用的恶意脚本并没有本质区别:它们的点击频率过于精准,操作路径过于机械,甚至在毫秒级的时间内完成了人类无法完成的决策。
因此,微信和支付宝的“封锁”,某种意义上是触发了自动化的防御机制。如果不解决身份认证和信任机制的问题,单纯靠“模拟点击”的技术路线,注定会撞得头破血流。
商业逻辑的“降维打击”
除了安全层面的顾虑,更深层的矛盾在于商业模式的根本冲突。
移动互联网的黄金十年,是建立在“App孤岛”和“注意力经济”基础上的。美团、淘宝、抖音、小红书,每一个超级App都希望把用户圈在自己的围墙里。他们精心设计了开屏广告、复杂的推荐流、诱人的弹窗,目的只有一个:让你多逛一会儿。
只有用户“逛”起来,广告才能曝光,算法才能推荐,商业闭环才能完成。
而AI Agent的出现,是对这种模式的“降维打击”。
想象一下,如果你想买一瓶洗发水,你对AI说:“帮我买最便宜的霸王洗发水”。AI会瞬间在后台扫描淘宝、京东、拼多多,直接跳过所有的开屏广告,忽略所有的直播推荐,直接锁定最低价商品并下单。
在这个过程中,App精心构建的“商业街”变成了AI眼中的“无人仓库”。广告商的钱白投了,平台的流量入口失效了,用户的停留时长归零了。
如果豆包手机助手真的普及开来,并且不加限制地被使用,那么现有的互联网巨头们的财报将变得非常难看。公告中提到的“限制刷分、刷激励场景”,正是对这一矛盾的直接回应——拼多多和抖音极速版的“金币”,是发给真实用户的,不是发给AI机器人的。
字节跳动的“焦虑”与“野望”
既然阻力如此之大,字节跳动为什么还要冒着风险,如此激进地推出这款产品?
答案在于两个字:入口。
2025年的互联网行业有着强烈的共识:大模型正在成为新的操作系统。阿里有完整的电商生态,腾讯有微信这个超级连接器,华为有鸿蒙系统和硬件终端。而字节跳动,虽然拥有目前国内月活最高的豆包大模型(1.72亿),却始终缺少一个属于自己的硬件载体。
过去几年,字节在Pico(VR眼镜)上的尝试并不算成功。在AI时代,如果不能掌握硬件入口,字节就有可能沦为纯粹的内容提供商或模型服务商,这对于张一鸣来说是不可接受的。
因此,字节选择了与中兴通讯合作。这是一种类似“华为+赛力斯(问界)”的模式:互联网大厂提供“灵魂”(大模型+OS层),硬件厂商提供“躯体”(手机硬件)。
![]()
通过这种方式,字节试图绕过App厂商的API接口限制,直接从系统层面接管用户的使用权。这是一种“甚至不需要App厂商同意”的霸道打法。它虽然能在短时间内给用户带来震撼的体验,但也最容易引发行业生态的集体反弹。
行业的未来:对抗还是结盟?
豆包手机的这次“急刹车”,并不意味着AI手机的方向错了,而是说明“破壁”的方式需要调整。
目前行业内主要存在两种流派:
一种是字节跳动目前的“模拟操作派”。它的优点是通用性强,不需要App适配就能用;缺点是合规风险极高,体验极其依赖App的界面布局,一旦App改版,AI可能就“瞎”了。
另一种是华为鸿蒙正在推行的“A2A(Agent to Agent)派”。华为通过制定一套系统级的协议,邀请美团、去哪儿等厂商把自己的AI接口接进来。这种方式下,手机助理是指挥官,App里的AI是执行官,双方通过正规接口通信。这显然更稳定、更安全,也更符合商业规则,但推进速度较慢,需要构建庞大的联盟。
豆包团队在公告中提到:“积极与相关厂商沟通,希望共同制定清晰、安全的AI操作行为准则。”这或许意味着,字节跳动也意识到了,单纯靠“黑客式”的模拟操作走不通,最终还是要回到谈判桌上,与腾讯、阿里等巨头坐下来,商定一套利益共享的规则。
写到最后
2025年的这款Nubia M153,或许不会成为一款畅销的手机,但它注定会被写进中国AI发展的历史。
![]()
它像一条鲶鱼,搅动了沉寂已久的手机市场,也撕开了AI技术与旧互联网生态之间那层温情脉脉的面纱。它让我们看到了AI全能助理的美好愿景,也让我们直面了安全、隐私和商业利益分配的残酷现实。
对于用户而言,我们期待一个能真正“解放双手”的时代;但对于行业而言,在技术狂奔之前,必须先补上“规则”这一课。这场关于数字主权的博弈,才刚刚开始。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.