网易首页 > 网易号 > 正文 申请入驻

AI 医疗建议可靠性存疑:MIT 研究揭示用户提问方式影响 AI 判断

0
分享至

IT之家 7 月 10 日消息,随着生成式人工智能(AI)技术不断演进,其应用场景已从早期的简单问答扩展到更复杂的任务。然而,对于缺乏技术背景的用户而言,如何高效、准确地使用这些 AI 工具,正变得越来越具有挑战性。


一份独立报告显示,微软 AI 部门收到的用户投诉中,最常见的一条是“Copilot 不如 ChatGPT 好用”。对此,微软迅速回应,将问题归咎于用户“提示词工程能力不佳”。为改善用户体验,微软还推出了“Copilot 学院”,帮助用户提升 AI 使用技能。

IT之家注意到,麻省理工学院(MIT)的一项最新研究(via Futurism)表明,微软将问题归咎于用户提示词能力的做法或许并非全无道理。

该研究指出,过度依赖 AI 工具获取医疗建议可能带来危险。更令人担忧的是,如果用户在提问时出现拼写错误(如单词拼错或多余空格),AI 可能会因此建议用户无需就医。此外,使用花哨语言或俚语也可能导致 AI 判断失误。

研究还发现,女性用户比男性更容易受到此类错误建议的影响,尽管这一结论仍需进一步验证。

此次研究涵盖了多个 AI 工具,包括 OpenAI 的 GPT-4、Meta 的 LLaMA-3-70B,以及一款名为 Palmyra-Med 的医疗专用 AI。研究人员模拟了数千个健康案例,数据来源包括真实患者投诉、Reddit 上的健康相关帖子,以及 AI 生成的病例。

为测试 AI 的稳定性,研究人员在数据中加入了“扰动因素”,如句子首字母大小写不一致、感叹号、情绪化语言,以及“可能”“大概”等不确定表达。结果显示,这些扰动使 AI 建议用户“无需就医”的概率上升了 7% 至 9%。

研究负责人、MIT 研究员阿比尼塔・古拉巴蒂娜(Abinitha Gourabathina)指出:“这些模型通常是在医学考试题目上训练和测试的,但实际应用场景却相差甚远,比如评估临床病例的严重程度。我们对大语言模型的理解仍然非常有限。”

这一研究结果引发了对 AI 在医疗领域应用的广泛担忧。值得注意的是,就在不久前,微软刚刚宣布其新推出的 AI 医疗工具“准确率是人类医生的 4 倍,成本却低 20%”。微软 AI 首席执行官甚至称其为“迈向医疗超级智能的真正一步”。

然而,这项研究再次提醒我们,生成式 AI 在医疗等高度复杂的领域仍远未达到完全可靠的水平。尽管技术发展迅速,但在真正投入使用前,仍需更多验证与审慎评估。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
当年为救钱学森,中国付出了什么代价?筹码大到让美国无法拒绝!

当年为救钱学森,中国付出了什么代价?筹码大到让美国无法拒绝!

史韵流转
2025-09-11 08:48:53
英国和江苏谁更强?英国6800万人创造了2.9万亿GDP,江苏能有多少

英国和江苏谁更强?英国6800万人创造了2.9万亿GDP,江苏能有多少

墨印斋
2025-09-14 08:22:04
上海下一个动迁黄金板块,可能就在这里

上海下一个动迁黄金板块,可能就在这里

爱看剧的阿峰
2025-09-13 17:23:53
1931年,周恩来带人处决叛徒顾顺章家人,放过仨小孩,却酿成祸患

1931年,周恩来带人处决叛徒顾顺章家人,放过仨小孩,却酿成祸患

阿胡
2024-07-31 11:50:32
包养10位情妇,睡觉翻牌生下11个私生子,75岁还在拼命生娃!

包养10位情妇,睡觉翻牌生下11个私生子,75岁还在拼命生娃!

削桐作琴
2025-09-08 15:05:36
主帅决定球队的发展方向,上海海港和申花走向两个极端

主帅决定球队的发展方向,上海海港和申花走向两个极端

米奇兔
2025-09-13 14:15:17
0-3崩盘!十人迈阿密2连败净丢6球,梅西勺子点球被扑+妙传遭吐饼

0-3崩盘!十人迈阿密2连败净丢6球,梅西勺子点球被扑+妙传遭吐饼

我爱英超
2025-09-14 09:38:46
山东女子打麻将输钱,自愿与三名牌友发生关系抵债,是否构成犯罪

山东女子打麻将输钱,自愿与三名牌友发生关系抵债,是否构成犯罪

四月十九
2024-09-03 17:10:30
联盟最有钱的10位老板:蔡崇信122亿第7,3人超300亿,第一1515亿

联盟最有钱的10位老板:蔡崇信122亿第7,3人超300亿,第一1515亿

你的篮球频道
2025-09-14 10:40:38
连续2场进球!南野拓实已经成在法甲进球最多的日本球员

连续2场进球!南野拓实已经成在法甲进球最多的日本球员

雷速体育
2025-09-14 10:50:35
高盛否认胜宏科技目标价895元传闻,AI龙头股价飙至352元新高!

高盛否认胜宏科技目标价895元传闻,AI龙头股价飙至352元新高!

风风顺
2025-09-14 07:40:16
【周运】柒爸一周星座运势(9.15-9.21)

【周运】柒爸一周星座运势(9.15-9.21)

柒爸星座
2025-09-14 12:17:26
纯视觉路线的豪赌:特斯拉的摄像头,遇到了人眼同样的瓶颈

纯视觉路线的豪赌:特斯拉的摄像头,遇到了人眼同样的瓶颈

Autolab
2025-09-12 22:38:50
康辉:我高考分数远超清北,却被人暗中顶替,依靠父亲查明真相!

康辉:我高考分数远超清北,却被人暗中顶替,依靠父亲查明真相!

桑启红原
2025-09-14 11:11:19
炸裂!曾凡博头号人选!最后一个NBA双向合同

炸裂!曾凡博头号人选!最后一个NBA双向合同

篮球实战宝典
2025-09-14 00:00:59
一交易一签约太及时!火箭队外线5射手成型,内线双炮台被低估

一交易一签约太及时!火箭队外线5射手成型,内线双炮台被低估

熊哥爱篮球
2025-09-14 12:25:50
美国纠集28国对华加税,中方态度很坚决:敢加税将考虑反制!

美国纠集28国对华加税,中方态度很坚决:敢加税将考虑反制!

浣花洗剑录
2025-09-14 12:20:08
原来天下真有不透风的墙,张柏芝、陈坤就做到了,不得不佩服他们

原来天下真有不透风的墙,张柏芝、陈坤就做到了,不得不佩服他们

七阿姨爱八卦
2025-09-13 16:57:05
1986年叶剑英去世,六位遗孀排序让工作人员犯难,聂帅拍板解难题

1986年叶剑英去世,六位遗孀排序让工作人员犯难,聂帅拍板解难题

觅史
2025-08-14 15:03:52
76歲婚紗女王皺紋突然消失終極大回春,曾被公開真實容貌嚇壞網民

76歲婚紗女王皺紋突然消失終極大回春,曾被公開真實容貌嚇壞網民

粤睇先生
2025-09-12 00:35:03
2025-09-14 13:32:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
305740文章数 606544关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

拉脱维亚籍"九头身"裁判回成都献舞 还想带家人来旅游

头条要闻

拉脱维亚籍"九头身"裁判回成都献舞 还想带家人来旅游

体育要闻

3次遭争议判罚!皇马向FIFA投诉西甲裁判

娱乐要闻

彪悍那英,大女人与旧妻子

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

旅游
时尚
艺术
本地
数码

旅游要闻

热闻|清明假期将至,热门目的地有哪些?

衣服“买精不买多”,日常准备这几款单品,简单舒适又大方

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

本地新闻

云游中国 | 草原驭秋风 祁连山邂逅黑河源头

数码要闻

美商海盗船被起诉内存最高速度“虚假宣传”,将花550万美元和解

无障碍浏览 进入关怀版