网易首页 > 网易号 > 正文 申请入驻

AI 医疗建议可靠性存疑:MIT 研究揭示用户提问方式影响 AI 判断

0
分享至

IT之家 7 月 10 日消息,随着生成式人工智能(AI)技术不断演进,其应用场景已从早期的简单问答扩展到更复杂的任务。然而,对于缺乏技术背景的用户而言,如何高效、准确地使用这些 AI 工具,正变得越来越具有挑战性。


一份独立报告显示,微软 AI 部门收到的用户投诉中,最常见的一条是“Copilot 不如 ChatGPT 好用”。对此,微软迅速回应,将问题归咎于用户“提示词工程能力不佳”。为改善用户体验,微软还推出了“Copilot 学院”,帮助用户提升 AI 使用技能。

IT之家注意到,麻省理工学院(MIT)的一项最新研究(via Futurism)表明,微软将问题归咎于用户提示词能力的做法或许并非全无道理。

该研究指出,过度依赖 AI 工具获取医疗建议可能带来危险。更令人担忧的是,如果用户在提问时出现拼写错误(如单词拼错或多余空格),AI 可能会因此建议用户无需就医。此外,使用花哨语言或俚语也可能导致 AI 判断失误。

研究还发现,女性用户比男性更容易受到此类错误建议的影响,尽管这一结论仍需进一步验证。

此次研究涵盖了多个 AI 工具,包括 OpenAI 的 GPT-4、Meta 的 LLaMA-3-70B,以及一款名为 Palmyra-Med 的医疗专用 AI。研究人员模拟了数千个健康案例,数据来源包括真实患者投诉、Reddit 上的健康相关帖子,以及 AI 生成的病例。

为测试 AI 的稳定性,研究人员在数据中加入了“扰动因素”,如句子首字母大小写不一致、感叹号、情绪化语言,以及“可能”“大概”等不确定表达。结果显示,这些扰动使 AI 建议用户“无需就医”的概率上升了 7% 至 9%。

研究负责人、MIT 研究员阿比尼塔・古拉巴蒂娜(Abinitha Gourabathina)指出:“这些模型通常是在医学考试题目上训练和测试的,但实际应用场景却相差甚远,比如评估临床病例的严重程度。我们对大语言模型的理解仍然非常有限。”

这一研究结果引发了对 AI 在医疗领域应用的广泛担忧。值得注意的是,就在不久前,微软刚刚宣布其新推出的 AI 医疗工具“准确率是人类医生的 4 倍,成本却低 20%”。微软 AI 首席执行官甚至称其为“迈向医疗超级智能的真正一步”。

然而,这项研究再次提醒我们,生成式 AI 在医疗等高度复杂的领域仍远未达到完全可靠的水平。尽管技术发展迅速,但在真正投入使用前,仍需更多验证与审慎评估。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
三四十元一碗的面,浇头汤底都是袋装?和府捞面回应:材料都是当天制作

三四十元一碗的面,浇头汤底都是袋装?和府捞面回应:材料都是当天制作

中国能源网
2026-01-07 08:45:05
广东16岁女儿被父亲过度宠溺,被母亲回家撞见后,失控将其砍死

广东16岁女儿被父亲过度宠溺,被母亲回家撞见后,失控将其砍死

晓艾故事汇
2024-11-04 10:55:36
Scotto:多队有意祖巴茨 快船报价至少两个首轮

Scotto:多队有意祖巴茨 快船报价至少两个首轮

北青网-北京青年报
2026-01-07 09:10:14
军长叫来500士兵砸场,警察局长吓得直冒冷汗,起因竟是一个杯子

军长叫来500士兵砸场,警察局长吓得直冒冷汗,起因竟是一个杯子

朝暮书屋
2024-04-26 17:08:50
乌专家:中国“吸干”苏联遗产,我们图纸都没看懂,他们造出2.0

乌专家:中国“吸干”苏联遗产,我们图纸都没看懂,他们造出2.0

博览历史
2025-12-29 19:26:45
续约韦世豪解约卡隆!蓉城正接触拜合拉木,茹萨加盟令周定洋失宠

续约韦世豪解约卡隆!蓉城正接触拜合拉木,茹萨加盟令周定洋失宠

刀锋体育
2026-01-07 13:30:11
“补脑首选”不是核桃,而是它!一天吃几颗,脑袋聪明,记忆好

“补脑首选”不是核桃,而是它!一天吃几颗,脑袋聪明,记忆好

江江食研社
2026-01-06 13:30:03
NBA名宿建议火箭交易谢泼德史密斯换特雷杨,球迷:想坑火箭啊

NBA名宿建议火箭交易谢泼德史密斯换特雷杨,球迷:想坑火箭啊

张癈卤说体育
2026-01-07 13:27:50
张凌赫跨年表演杀穿外网:40秒封神背后,争议与野心并存?

张凌赫跨年表演杀穿外网:40秒封神背后,争议与野心并存?

不甜的李子
2026-01-06 10:45:54
1967年,罗舜初叮嘱到国防科委上班的李敏:千万不要被人利用

1967年,罗舜初叮嘱到国防科委上班的李敏:千万不要被人利用

大运河时空
2026-01-06 10:40:03
两性相处:如果女人不重视你,男人记住这三点,你就赢了

两性相处:如果女人不重视你,男人记住这三点,你就赢了

张小楠说情感
2026-01-07 13:31:52
明朝的一首词,抵得过千万首唐诗宋词,因为这首词全篇都是名句

明朝的一首词,抵得过千万首唐诗宋词,因为这首词全篇都是名句

长风文史
2025-12-18 15:00:28
官宣,国乒教练离队第1人,56岁,被外协挖走,曾培养王楚钦莎莎

官宣,国乒教练离队第1人,56岁,被外协挖走,曾培养王楚钦莎莎

乐聊球
2026-01-06 12:32:48
TA:曼联计划未来几天内和索尔斯克亚、卡里克分别面谈执教事宜

TA:曼联计划未来几天内和索尔斯克亚、卡里克分别面谈执教事宜

画夕
2026-01-07 14:00:28
“时速高达185公里”,外媒:日本演员广末凉子因“过失驾驶致人受伤”,被判罚款70万日元

“时速高达185公里”,外媒:日本演员广末凉子因“过失驾驶致人受伤”,被判罚款70万日元

环球网资讯
2026-01-06 15:37:19
1.7五百万基金|A股突然跳水!大龙今天有加有减!

1.7五百万基金|A股突然跳水!大龙今天有加有减!

龙行天下虎
2026-01-07 13:57:37
东北供暖危机:80%居民自掏腰包受冻,18℃成笑谈!

东北供暖危机:80%居民自掏腰包受冻,18℃成笑谈!

刘哥谈体育
2026-01-07 13:29:54
正视差距!中国想复刻美国特种兵“斩首”某岛还缺什么?

正视差距!中国想复刻美国特种兵“斩首”某岛还缺什么?

花花娱界
2026-01-05 20:42:58
黄仁勋回应H200何时售往中国:正加快生产,等待许可的最终细节敲定

黄仁勋回应H200何时售往中国:正加快生产,等待许可的最终细节敲定

界面新闻
2026-01-07 10:53:25
许家印被执行4700万

许家印被执行4700万

扬子晚报
2026-01-07 12:43:41
2026-01-07 14:48:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
323292文章数 606866关注度
往期回顾 全部

科技要闻

豪掷世界第一"球" 杨元庆亮出联想AI护城河

头条要闻

古巴公布32名阵亡军人姓名和照片 年龄介于26岁至67岁

头条要闻

古巴公布32名阵亡军人姓名和照片 年龄介于26岁至67岁

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

2026年央视春晚彩排:沈腾确定回归

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

蔚来2025百万台收官 一场迟到的自我修复

态度原创

教育
艺术
游戏
时尚
亲子

教育要闻

初二这一年,差不多就能看出孩子将来上什么大学了

艺术要闻

David Grossmann:不一样的风景画

《DQ7RE》试玩版上线:可继承存档 送限定外观

冬天穿衣既要有温度又要有风度!看看这些穿搭,优雅又显瘦

亲子要闻

帮忙带娃被网暴后续,小姑子晒出多张证据,亲戚透露更多内情

无障碍浏览 进入关怀版