网易首页 > 网易号 > 正文 申请入驻

AI 医疗建议可靠性存疑:MIT 研究揭示用户提问方式影响 AI 判断

0
分享至

IT之家 7 月 10 日消息,随着生成式人工智能(AI)技术不断演进,其应用场景已从早期的简单问答扩展到更复杂的任务。然而,对于缺乏技术背景的用户而言,如何高效、准确地使用这些 AI 工具,正变得越来越具有挑战性。

一份独立报告显示,微软 AI 部门收到的用户投诉中,最常见的一条是“Copilot 不如 ChatGPT 好用”。对此,微软迅速回应,将问题归咎于用户“提示词工程能力不佳”。为改善用户体验,微软还推出了“Copilot 学院”,帮助用户提升 AI 使用技能。

IT之家注意到,麻省理工学院(MIT)的一项最新研究(via Futurism)表明,微软将问题归咎于用户提示词能力的做法或许并非全无道理。

该研究指出,过度依赖 AI 工具获取医疗建议可能带来危险。更令人担忧的是,如果用户在提问时出现拼写错误(如单词拼错或多余空格),AI 可能会因此建议用户无需就医。此外,使用花哨语言或俚语也可能导致 AI 判断失误。

研究还发现,女性用户比男性更容易受到此类错误建议的影响,尽管这一结论仍需进一步验证。

此次研究涵盖了多个 AI 工具,包括 OpenAI 的 GPT-4、Meta 的 LLaMA-3-70B,以及一款名为 Palmyra-Med 的医疗专用 AI。研究人员模拟了数千个健康案例,数据来源包括真实患者投诉、Reddit 上的健康相关帖子,以及 AI 生成的病例。

为测试 AI 的稳定性,研究人员在数据中加入了“扰动因素”,如句子首字母大小写不一致、感叹号、情绪化语言,以及“可能”“大概”等不确定表达。结果显示,这些扰动使 AI 建议用户“无需就医”的概率上升了 7% 至 9%。

研究负责人、MIT 研究员阿比尼塔・古拉巴蒂娜(Abinitha Gourabathina)指出:“这些模型通常是在医学考试题目上训练和测试的,但实际应用场景却相差甚远,比如评估临床病例的严重程度。我们对大语言模型的理解仍然非常有限。”

这一研究结果引发了对 AI 在医疗领域应用的广泛担忧。值得注意的是,就在不久前,微软刚刚宣布其新推出的 AI 医疗工具“准确率是人类医生的 4 倍,成本却低 20%”。微软 AI 首席执行官甚至称其为“迈向医疗超级智能的真正一步”。

然而,这项研究再次提醒我们,生成式 AI 在医疗等高度复杂的领域仍远未达到完全可靠的水平。尽管技术发展迅速,但在真正投入使用前,仍需更多验证与审慎评估。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
600581,将被*ST!明天停牌!

600581,将被*ST!明天停牌!

证券时报e公司
2026-03-29 22:05:39
注意!明日北京机动车限行尾号轮换

注意!明日北京机动车限行尾号轮换

BRTV新闻
2026-03-29 09:37:36
一人睡遍整个娱乐圈?司晓迪打响了2026年第一炮

一人睡遍整个娱乐圈?司晓迪打响了2026年第一炮

阅毒君
2026-01-05 07:05:06
美国打伊朗到底图什么?八成中国人以为是抢石油……

美国打伊朗到底图什么?八成中国人以为是抢石油……

基本常识
2026-03-02 23:53:16
黄仁勋和家人,一张温馨合影,家庭和睦,已深度融入美国主流社会

黄仁勋和家人,一张温馨合影,家庭和睦,已深度融入美国主流社会

老殁体育解说
2026-03-27 19:35:54
Lisa晒生日照,穿泳衣大胆露屁股,表情夸张扭曲,面相都变了

Lisa晒生日照,穿泳衣大胆露屁股,表情夸张扭曲,面相都变了

秋姐居
2026-03-27 14:39:01
郑丽文来京时间确定,马英九拒绝通话,大陆发出统一后安排

郑丽文来京时间确定,马英九拒绝通话,大陆发出统一后安排

通鉴史智
2026-03-29 09:51:50
她家这个嫁军火商的二姐,才叫玩得花!

她家这个嫁军火商的二姐,才叫玩得花!

BenSir本色说
2026-03-27 22:05:46
爱情观念,本质上是忽悠男人的!

爱情观念,本质上是忽悠男人的!

赖焕庆
2026-03-09 11:00:10
排面!全红婵晒19岁庆生照:跳水奥运冠军集体亮相,杨倩也出席

排面!全红婵晒19岁庆生照:跳水奥运冠军集体亮相,杨倩也出席

李喜林篮球绝杀
2026-03-29 10:56:49
释永信“开光”真相大白,过程不堪入目,易中天也有牵扯

释永信“开光”真相大白,过程不堪入目,易中天也有牵扯

寻墨阁
2026-03-25 11:39:10
蔡正元进牢了,菜单被扒得比判决书还细,这事真就这么耐人寻味

蔡正元进牢了,菜单被扒得比判决书还细,这事真就这么耐人寻味

观星赏月
2026-03-29 14:24:35
广州制衣厂半数工人患尿毒症,打工透析续命,背后原因引深思

广州制衣厂半数工人患尿毒症,打工透析续命,背后原因引深思

复转这些年
2026-03-29 18:58:45
这下不吹了,俄乌两军连续大战,打破一个又一个“无敌”武器神话

这下不吹了,俄乌两军连续大战,打破一个又一个“无敌”武器神话

策略述
2025-11-12 18:42:46
691辆!中国车在澳洲掀翻日本28年统治,比亚迪却不是最大的赢家

691辆!中国车在澳洲掀翻日本28年统治,比亚迪却不是最大的赢家

李子橱
2026-03-29 12:00:17
军衔最高的12位开国女军官,都是什么军衔?

军衔最高的12位开国女军官,都是什么军衔?

幽州校尉
2026-03-28 07:31:51
难遇良人,孔蒂下课后热刺近3年5位主帅胜率均不及5成

难遇良人,孔蒂下课后热刺近3年5位主帅胜率均不及5成

懂球帝
2026-03-29 23:43:32
在医院你遭遇过最羞耻的事是什么?网友:一个比一个炸裂啊

在医院你遭遇过最羞耻的事是什么?网友:一个比一个炸裂啊

解读热点事件
2026-02-04 00:05:07
刚刚,伊朗发动大规模袭击

刚刚,伊朗发动大规模袭击

中国基金报
2026-03-29 21:29:30
惨遭性侵、自杀未遂截瘫,为求安乐死和亲爹打官司!25岁的西班牙姑娘如愿走了...

惨遭性侵、自杀未遂截瘫,为求安乐死和亲爹打官司!25岁的西班牙姑娘如愿走了...

新欧洲
2026-03-28 19:29:05
2026-03-30 00:19:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
336537文章数 607097关注度
往期回顾 全部

科技要闻

马斯克承认xAI"建错了",11位创始人均离职

头条要闻

中国警告美国:勿将"冲突战乱"引入亚太地区

头条要闻

中国警告美国:勿将"冲突战乱"引入亚太地区

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

汪峰定律再现!李荣浩喊话单依纯侵权

财经要闻

Kimi、Minimax 们的算力荒

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

亲子
教育
本地
艺术
公开课

亲子要闻

夏天来了,如何给小宝宝洗澡?具体步骤如下

教育要闻

总想养听话的孩子,其实正在毁掉他一生

本地新闻

在潍坊待了三天,没遇到一个“潍坊人”

艺术要闻

耗资4亿!天津第三殡仪馆改成了“公园”样,不阴森了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版