网易首页 > 网易号 > 正文 申请入驻

苹果AI新研究:使其理解手机操作后果,避免高风险行为

0
分享至

IT之家 6 月 27 日消息,随着 AI 智能体越来越聪明,甚至能够主动帮助用户在手机上完成各种任务(例如修改某项设置、打开导航),但 AI 本身并不理解 UI 结构对应的具体运行机制,仅仅是按照预设程序执行操作。

苹果与华盛顿大学的研究人员现在联合发表了一篇论文,探讨如何让 AI 学会判断各种操作所产生的后果,避免执行用户未批准的高风险动作。

AI 智能体的自主行为是 2026 年苹果系统升级的核心功能之一。苹果在 2024 年 WWDC 上就曾展示过 Siri 的未来发展方向 —— 帮用户代做诸如在线购物、订票等任务,但这种自动化看似便捷,却引发了关键问题:如果 AI 误点“删除账户”而非“注销”,会发生什么?

手机作为个人设备,存储着银行金融数据、健康记录、照片和私人信息。当 AI 智能体代行任务时,必须区分哪些动作无害、哪些可能造成持久或危险后果,更需知道何时停止并请求用户确认。

然而,多数 AI 开发商只是停留在让 AI“会操作”(如识别按钮、找到对应的页面、按指令执行程序),却甚少关注这些操作对用户的后续影响。

苹果 AI 研究人员指出,并不是所有动作都安全无风险:点击“刷新”按钮是低风险行为,但点击“转账”则是高风险行为。

这项研究从 AI 安全与 UI 设计专家参与的研讨会开始,目标是创建一个“分类法”(结构化列表),用于定义 UI 动作的不同影响类型。团队围绕以下问题展开:

  • 动作是否可撤销?
  • 影响仅涉及机主还是包括更多人?
  • 是否改变隐私设置或产生费用?

论文显示,研究人员建立了一种多维度标注手机 App 动作的方法。例如,删除消息可能在 2 分钟内可撤销,但超过时间则无法恢复;转账通常需协助才能撤销。

这种分类法的重要性在于,它为 AI 提供了推理人类意图的框架 —— 相当于一份“风险检查”程序,帮助 AI 判断“哪些动作可能出错”或“为何需要额外确认”。

为训练 AI 区分动作风险,研究人员让参与者在模拟移动环境中记录高风险动作(IT之家注:如修改账户密码、发送消息、更新支付详情),而非浏览、搜索等低风险任务。

团队将新数据与现有覆盖安全、常规交互的数据集结合,用分类法标注所有数据,随后测试了包括 OpenAI GPT-4 在内的五大 AI 模型,评估其预测动作影响水平或分类属性的能力。

结果显示,在提示中加入分类法有助于提高风险判断准确率,但即使表现最佳的“GPT-4 多模态”模型,正确率也仅约 58%。

研究发现,AI 模型常会高估风险 —— 比如将“清除空计算器历史记录”这类无害动作标记为高风险。这种“谨慎偏见”看似更安全,却可能因频繁请求确认而让 AI 助手变得烦人或无用。而更严重的问题在于,模型难以完成判断 —— 无法确定动作是否可撤销,或如何影响他人。

苹果研究人员认为,用户需要的是“有用且安全”的自动化功能:误删账户的 AI 是灾难,但要是连调整音量这种操作都要请示用户的话还不如不做。

研究人员认为,他们的分类法可帮助设计更好的 AI 政策 —— 例如,用户可自定义何时需要请求批准。这种方法支持透明化与个性化,帮助 AI 设计者识别当前模型的薄弱点(尤其在处理真实世界高风险任务时)。

研究表明,教 AI“识别按钮”还不够,它必须理解“点击背后的意义”—— 这对 AI 而言是项艰巨任务。人类可以通过上下文提示和历史经验来进行判断,但机器却很难完美地解决这种复杂性操作。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
台湾要求全军禁止下载使用高德,孙玉良:禁令神助攻,当天冲第一

台湾要求全军禁止下载使用高德,孙玉良:禁令神助攻,当天冲第一

孙玉良
2026-04-25 09:21:34
徐志摩不喜欢妻子,却每晚都要同房,妻子怀孕后他却又不想要孩子

徐志摩不喜欢妻子,却每晚都要同房,妻子怀孕后他却又不想要孩子

掠影后有感
2026-04-23 10:44:28
河北偷狗姐已社会性死亡:人被拘了,名声臭了,更恶心的还在后面

河北偷狗姐已社会性死亡:人被拘了,名声臭了,更恶心的还在后面

寒士之言本尊
2026-04-25 16:17:01
员工存钱触发反洗钱,绝味藏7亿被查,635亿市值崩塌股东买单!

员工存钱触发反洗钱,绝味藏7亿被查,635亿市值崩塌股东买单!

老特有话说
2026-04-11 17:23:21
央视小尼离婚后单身至今,原因曝光:不是放不下前妻,是放不下她

央视小尼离婚后单身至今,原因曝光:不是放不下前妻,是放不下她

翰飞观事
2026-04-10 14:59:12
以色列,突然空袭!内塔尼亚胡最新表态!国际油价大跳水

以色列,突然空袭!内塔尼亚胡最新表态!国际油价大跳水

数据宝
2026-04-25 13:17:19
黄一鸣回应:没结婚一天找8个男的也没关系 承认跟40岁大叔交往过

黄一鸣回应:没结婚一天找8个男的也没关系 承认跟40岁大叔交往过

法老不说教
2026-04-25 14:34:56
黄一鸣急眼了!澄清孩子是王思聪的,不排斥老头,称七八十岁都行

黄一鸣急眼了!澄清孩子是王思聪的,不排斥老头,称七八十岁都行

小俎娱乐
2026-04-24 14:12:30
猛降14℃!降温、降雨、雷暴大风即将抵达长沙!另外,“五一”假期长沙天气最新预测→

猛降14℃!降温、降雨、雷暴大风即将抵达长沙!另外,“五一”假期长沙天气最新预测→

芒果都市
2026-04-25 15:31:14
1979年越南女兵炸毁我军坦克,罗兴元端起高压喷火枪,将千度烈焰灌进了十米外的地道

1979年越南女兵炸毁我军坦克,罗兴元端起高压喷火枪,将千度烈焰灌进了十米外的地道

寄史言志
2026-04-24 22:21:06
女骑手两年暴涨35%,女司机猛增75%,中年女人为何抢着跑车?

女骑手两年暴涨35%,女司机猛增75%,中年女人为何抢着跑车?

老特有话说
2026-04-17 17:19:57
停水通知!提前做好储水准备

停水通知!提前做好储水准备

大连开放前沿
2026-04-25 08:36:44
德国防长说德国海军部队将被部署到地中海

德国防长说德国海军部队将被部署到地中海

新京报
2026-04-25 15:37:43
她66岁担任上海市人大常委会副主任,丈夫中将,两个儿子也是中将

她66岁担任上海市人大常委会副主任,丈夫中将,两个儿子也是中将

春秋砚
2026-04-25 15:10:07
手握20多个冠军,嫁外国名将带夫定居广州,如今是中山大学副教授

手握20多个冠军,嫁外国名将带夫定居广州,如今是中山大学副教授

以茶带书
2026-04-16 14:50:51
印度终于抢到化肥,却被狠宰一刀!算清这笔账,为何中国不慌?

印度终于抢到化肥,却被狠宰一刀!算清这笔账,为何中国不慌?

丁丁鲤史纪
2026-04-25 11:45:39
力挺张敬轩翻车后果显现!群众打12345投诉,英皇深陷信任危机中

力挺张敬轩翻车后果显现!群众打12345投诉,英皇深陷信任危机中

东方不败然多多
2026-04-25 12:55:18
我71岁,晚年,我不请保姆,不住养老院,我就这样养老,偷着乐

我71岁,晚年,我不请保姆,不住养老院,我就这样养老,偷着乐

人间百态大全
2026-04-25 06:40:03
零时差 | 美伊局势“神反转”,谁在算计谁?

零时差 | 美伊局势“神反转”,谁在算计谁?

人民网
2026-04-24 23:30:56
美正考虑暂停西班牙北约成员国资格

美正考虑暂停西班牙北约成员国资格

财联社
2026-04-24 22:52:23
2026-04-25 17:39:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
341110文章数 607166关注度
往期回顾 全部

科技要闻

DeepSeek V4发布!黄仁勋预言的"灾难"降临

头条要闻

男子登机口被拦 对方没称重直接收取200元行李逾重费

头条要闻

男子登机口被拦 对方没称重直接收取200元行李逾重费

体育要闻

火箭0-3触发百分百出局定律:本季加时赛9战8败

娱乐要闻

邓超最大的幸运,就是遇见孙俪

财经要闻

90%订单消失,中东旺季没了

汽车要闻

2026款乐道L90亮相北京车展 乐道L80正式官宣

态度原创

亲子
健康
本地
公开课
军事航空

亲子要闻

看来是真的不想写作业

干细胞如何让烧烫伤皮肤"再生"?

本地新闻

云游中国|逛世界风筝都 留学生探秘中国传统文化

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美防长:战事不会“没完没了”

无障碍浏览 进入关怀版