2月26日,三星在旧金山发布年度旗舰Galaxy S26系列,AI毫无悬念地成为最大看点。需要提醒的是,从今年开始,三星将与苹果一样,使用谷歌Gemini驱动AI助理。
谷歌安卓生态系统总裁Sameer Samat在发布会上展示了Gemini的最新能力——让手机自己点外卖。
作为给AI“上强度”的演示案例,Samat让Gemini总结家庭群中每个人对不同披萨的喜好,然后自动登录外卖平台完成下单。
类似的场景还包括通过优步叫车:用户只需告诉Gemini目的地,AI会在设备上以虚拟窗口打开应用,滚动界面完成选择,并在最终提交订单前提醒用户确认。
Samat介绍,目前AI可以通过MCP或安卓应用功能框架来操作应用。如果两者都不存在,Gemini也能尝试打开应用,自己琢磨该怎么操作。
但他也承认,把安卓从手机操作系统转变为“智能系统”,最大的障碍依然是应用开发者。目前这项任务自动化功能仅限于优步、外卖平台Grubhub和DoorDash等少数应用。他期待今年晚些时候能有更多应用原生支持智能体操作。
想法很好,但类似的尝试,早有人遇到过更现实的阻力。
字节跳动与中兴合作推出的豆包手机,就是典型案例。2025年12月,豆包手机助手技术预览版发布,核心能力是“读屏+模拟点击”——用户只需说话,AI就能跨应用完成订餐、打车、比价等操作。
听起来很理想,但发布仅一天后,就遭遇了微信、淘宝、支付宝等头部App的API调用限制,AI功能几近瘫痪。
在腾讯公司年会上,马化腾罕见评价此事,直言将用户手机屏幕录制并上传云端“极其不安全、不负责任”。字节方面则回应称将严格遵守用户授权,云端处理遵循“不存储、不训练原则”。
豆包手机踩中的雷,其实是两条技术路线选择的问题。一条是“读屏派”,优点是通用性强,不依赖App开放接口,但需要获取屏幕内容、模拟点击,隐私风险敞口大,也容易触动互联网巨头的核心利益。
另一条是“API派”,比如阿里千问在阿里生态内打通淘宝、饿了么、高德等应用,用户提出需求,系统调用各业务接口完成服务闭环。这条路对交易和风控更友好,但只能服务自家生态,跨出体系就无能为力。
两条路线的本质冲突,在于互联网大厂不会轻易让出流量入口和核心数据。
这也解释了为什么vivo目前虽然在国内市场份额很大,却依然选择与字节跳动推进AI手机合作,预装豆包手机助手。
AI手机走到今天,核心命题已经不再是模型参数大小或硬件算力强弱,而是AI能不能真正替人做事,以及如何在做事的过程中解决隐私安全、生态开放和利益分配这三个实际问题。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.