网易首页 > 网易号 > 正文 申请入驻

AI 医疗建议可靠性存疑:MIT 研究揭示用户提问方式影响 AI 判断

0
分享至

IT之家 7 月 10 日消息,随着生成式人工智能(AI)技术不断演进,其应用场景已从早期的简单问答扩展到更复杂的任务。然而,对于缺乏技术背景的用户而言,如何高效、准确地使用这些 AI 工具,正变得越来越具有挑战性。


一份独立报告显示,微软 AI 部门收到的用户投诉中,最常见的一条是“Copilot 不如 ChatGPT 好用”。对此,微软迅速回应,将问题归咎于用户“提示词工程能力不佳”。为改善用户体验,微软还推出了“Copilot 学院”,帮助用户提升 AI 使用技能。

IT之家注意到,麻省理工学院(MIT)的一项最新研究(via Futurism)表明,微软将问题归咎于用户提示词能力的做法或许并非全无道理。

该研究指出,过度依赖 AI 工具获取医疗建议可能带来危险。更令人担忧的是,如果用户在提问时出现拼写错误(如单词拼错或多余空格),AI 可能会因此建议用户无需就医。此外,使用花哨语言或俚语也可能导致 AI 判断失误。

研究还发现,女性用户比男性更容易受到此类错误建议的影响,尽管这一结论仍需进一步验证。

此次研究涵盖了多个 AI 工具,包括 OpenAI 的 GPT-4、Meta 的 LLaMA-3-70B,以及一款名为 Palmyra-Med 的医疗专用 AI。研究人员模拟了数千个健康案例,数据来源包括真实患者投诉、Reddit 上的健康相关帖子,以及 AI 生成的病例。

为测试 AI 的稳定性,研究人员在数据中加入了“扰动因素”,如句子首字母大小写不一致、感叹号、情绪化语言,以及“可能”“大概”等不确定表达。结果显示,这些扰动使 AI 建议用户“无需就医”的概率上升了 7% 至 9%。

研究负责人、MIT 研究员阿比尼塔・古拉巴蒂娜(Abinitha Gourabathina)指出:“这些模型通常是在医学考试题目上训练和测试的,但实际应用场景却相差甚远,比如评估临床病例的严重程度。我们对大语言模型的理解仍然非常有限。”

这一研究结果引发了对 AI 在医疗领域应用的广泛担忧。值得注意的是,就在不久前,微软刚刚宣布其新推出的 AI 医疗工具“准确率是人类医生的 4 倍,成本却低 20%”。微软 AI 首席执行官甚至称其为“迈向医疗超级智能的真正一步”。

然而,这项研究再次提醒我们,生成式 AI 在医疗等高度复杂的领域仍远未达到完全可靠的水平。尽管技术发展迅速,但在真正投入使用前,仍需更多验证与审慎评估。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
沉默4天后,大陆通知全世界,岛内担心赖清德被捕,统派大佬扛旗

沉默4天后,大陆通知全世界,岛内担心赖清德被捕,统派大佬扛旗

现代小青青慕慕
2026-01-09 11:31:00
事业编制开除难,网友吐槽辞职三年只得单间办公室。

事业编制开除难,网友吐槽辞职三年只得单间办公室。

特约前排观众
2026-01-10 00:15:05
到底什么叫洗钱?网友"完美闭环"式回答,感觉错过了一个亿

到底什么叫洗钱?网友"完美闭环"式回答,感觉错过了一个亿

另子维爱读史
2026-01-09 22:18:04
俄已经有三支主要的反俄武装了  最大的一支还有4万人

俄已经有三支主要的反俄武装了 最大的一支还有4万人

维美丽心甜
2025-11-25 07:20:03
你知道女性的阴道有多长吗?或许与你所想,完全不同!

你知道女性的阴道有多长吗?或许与你所想,完全不同!

战争茶馆
2025-11-26 10:33:50
3死4命危!2024年,8旬农妇包蜗牛粽吃完丧命,亲友守灵又吃死2人

3死4命危!2024年,8旬农妇包蜗牛粽吃完丧命,亲友守灵又吃死2人

万象硬核本尊
2025-11-26 18:02:04
它是止咳第一名,放到锅中蒸一蒸,轻松排出黄痰,做法真的很简单

它是止咳第一名,放到锅中蒸一蒸,轻松排出黄痰,做法真的很简单

江江食研社
2025-12-11 10:30:10
解密加勒万河谷冲突全过程,我军是如何以80人击溃印军600人的?

解密加勒万河谷冲突全过程,我军是如何以80人击溃印军600人的?

阿胡
2024-12-02 14:33:09
通便润肠最厉害的“2果2菜”,吃一次排出隔夜便!别只知道吃香蕉

通便润肠最厉害的“2果2菜”,吃一次排出隔夜便!别只知道吃香蕉

资说
2025-12-24 09:57:11
机关事业单位退休人员,职业年金补发16个月,补发1.2万,多吗?

机关事业单位退休人员,职业年金补发16个月,补发1.2万,多吗?

有范又有料
2026-01-09 09:24:45
2026年苹果产品首降来了:iPhone 17降价1300元!叠加国补到手价4699元起

2026年苹果产品首降来了:iPhone 17降价1300元!叠加国补到手价4699元起

快科技
2026-01-07 19:25:25
继杨振宁去世不到2月,翁帆首次携76岁妈妈亮相,一个细节惹争议

继杨振宁去世不到2月,翁帆首次携76岁妈妈亮相,一个细节惹争议

涵豆说娱
2025-12-04 15:03:22
中国被骗了?当我们猛造航母的时候,美国却开始重点打造两栖舰

中国被骗了?当我们猛造航母的时候,美国却开始重点打造两栖舰

萧矹影视解说
2026-01-07 13:06:47
大领导大收藏家大窃贼

大领导大收藏家大窃贼

巧哥有话说
2025-12-29 20:03:09
荣耀“不讲武德”,2亿广角+8000mAh+6000nit,突降到2294元

荣耀“不讲武德”,2亿广角+8000mAh+6000nit,突降到2294元

北境不忘
2026-01-09 14:37:40
哗众取宠?最帅升旗手张自轩大婚,700万婚车打头,穿军装引争议

哗众取宠?最帅升旗手张自轩大婚,700万婚车打头,穿军装引争议

云景侃记
2026-01-09 11:33:23
瑞典名将卡尔伯格与华裔美女大婚,相恋八年 岳父是前八一队教练

瑞典名将卡尔伯格与华裔美女大婚,相恋八年 岳父是前八一队教练

郝小小看体育
2025-12-18 00:29:41
李在明访华刚结束,就被美国敲打,美参议院表态对我们非常不友好

李在明访华刚结束,就被美国敲打,美参议院表态对我们非常不友好

我心纵横天地间
2026-01-09 16:52:21
这回,国足让人满意了?

这回,国足让人满意了?

新民晚报
2026-01-09 10:23:18
今夜,又暴涨了!

今夜,又暴涨了!

中国基金报
2026-01-10 00:13:56
2026-01-10 04:39:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
323837文章数 606873关注度
往期回顾 全部

科技要闻

市场偏爱MiniMax:开盘涨42%,市值超700亿

头条要闻

丹麦专家:美军“拿下”格陵兰岛只要45分钟

头条要闻

丹麦专家:美军“拿下”格陵兰岛只要45分钟

体育要闻

金元时代最后的外援,来中国8年了

娱乐要闻

关晓彤鹿晗风波后露面 不受影响状态佳

财经要闻

投资必看!瑞银李萌给出3大核心配置建议

汽车要闻

助跑三年的奇瑞 接下来是加速还是起跳?

态度原创

时尚
亲子
数码
手机
公开课

推广中奖名单-更新至2025年12月19日推广

亲子要闻

“国学驯化”从娃娃抓起?

数码要闻

铭凡CES 2026新闻稿提及英特尔酷睿Ultra 9 290HX Plus处理器

手机要闻

vivo X200T详细参数曝光,X300 Ultra待发布

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版