网易首页 > 网易号 > 正文 申请入驻

AI 医疗建议可靠性存疑:MIT 研究揭示用户提问方式影响 AI 判断

0
分享至

IT之家 7 月 10 日消息,随着生成式人工智能(AI)技术不断演进,其应用场景已从早期的简单问答扩展到更复杂的任务。然而,对于缺乏技术背景的用户而言,如何高效、准确地使用这些 AI 工具,正变得越来越具有挑战性。


一份独立报告显示,微软 AI 部门收到的用户投诉中,最常见的一条是“Copilot 不如 ChatGPT 好用”。对此,微软迅速回应,将问题归咎于用户“提示词工程能力不佳”。为改善用户体验,微软还推出了“Copilot 学院”,帮助用户提升 AI 使用技能。

IT之家注意到,麻省理工学院(MIT)的一项最新研究(via Futurism)表明,微软将问题归咎于用户提示词能力的做法或许并非全无道理。

该研究指出,过度依赖 AI 工具获取医疗建议可能带来危险。更令人担忧的是,如果用户在提问时出现拼写错误(如单词拼错或多余空格),AI 可能会因此建议用户无需就医。此外,使用花哨语言或俚语也可能导致 AI 判断失误。

研究还发现,女性用户比男性更容易受到此类错误建议的影响,尽管这一结论仍需进一步验证。

此次研究涵盖了多个 AI 工具,包括 OpenAI 的 GPT-4、Meta 的 LLaMA-3-70B,以及一款名为 Palmyra-Med 的医疗专用 AI。研究人员模拟了数千个健康案例,数据来源包括真实患者投诉、Reddit 上的健康相关帖子,以及 AI 生成的病例。

为测试 AI 的稳定性,研究人员在数据中加入了“扰动因素”,如句子首字母大小写不一致、感叹号、情绪化语言,以及“可能”“大概”等不确定表达。结果显示,这些扰动使 AI 建议用户“无需就医”的概率上升了 7% 至 9%。

研究负责人、MIT 研究员阿比尼塔・古拉巴蒂娜(Abinitha Gourabathina)指出:“这些模型通常是在医学考试题目上训练和测试的,但实际应用场景却相差甚远,比如评估临床病例的严重程度。我们对大语言模型的理解仍然非常有限。”

这一研究结果引发了对 AI 在医疗领域应用的广泛担忧。值得注意的是,就在不久前,微软刚刚宣布其新推出的 AI 医疗工具“准确率是人类医生的 4 倍,成本却低 20%”。微软 AI 首席执行官甚至称其为“迈向医疗超级智能的真正一步”。

然而,这项研究再次提醒我们,生成式 AI 在医疗等高度复杂的领域仍远未达到完全可靠的水平。尽管技术发展迅速,但在真正投入使用前,仍需更多验证与审慎评估。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日媒:张本智和示好高市极其愚蠢 他在中国被视为数典忘祖之辈

日媒:张本智和示好高市极其愚蠢 他在中国被视为数典忘祖之辈

劲爆体坛
2026-01-05 12:06:04
布克再亮旧时剑,湖人弃将送给雷霆第六败

布克再亮旧时剑,湖人弃将送给雷霆第六败

只关于篮球
2026-01-05 13:55:47
折磨人的生理反应有哪些?网友:排卵期就想穿性感一点

折磨人的生理反应有哪些?网友:排卵期就想穿性感一点

带你感受人间冷暖
2026-01-04 00:10:07
心理学家:极度自私的人,往往不是斤斤计较,而是有着这3个特征

心理学家:极度自私的人,往往不是斤斤计较,而是有着这3个特征

木言观
2025-12-27 18:01:28
英超:曼城1-1切尔西落后枪手6分 赖因德斯破门 恩佐94分钟绝平

英超:曼城1-1切尔西落后枪手6分 赖因德斯破门 恩佐94分钟绝平

狍子歪解体坛
2026-01-05 03:32:09
表面含金量97%以上!2013年小伙在山东海边, 挖出近160克“金石”

表面含金量97%以上!2013年小伙在山东海边, 挖出近160克“金石”

万象硬核本尊
2026-01-02 17:46:32
童锦程风波后首发声:合理的抚养费会给,但不会满足女方私欲

童锦程风波后首发声:合理的抚养费会给,但不会满足女方私欲

小徐讲八卦
2026-01-03 06:37:18
特朗普改口称 不相信乌克兰袭击普京官邸

特朗普改口称 不相信乌克兰袭击普京官邸

每日经济新闻
2026-01-05 13:04:46
i茅台开售半小时内多次售罄,外媒评价“显示了该产品的高需求”

i茅台开售半小时内多次售罄,外媒评价“显示了该产品的高需求”

环球网资讯
2026-01-05 09:41:22
重磅!总投超6000亿!江苏2026十大超级工程,交通民生全覆盖

重磅!总投超6000亿!江苏2026十大超级工程,交通民生全覆盖

小陆搞笑日常
2026-01-05 07:10:40
英超双蓝会补时绝平,曼城1-1切尔西留遗憾,争冠之路再遇荆棘

英超双蓝会补时绝平,曼城1-1切尔西留遗憾,争冠之路再遇荆棘

云儿评球
2026-01-05 13:56:55
李在明送给中国两件礼物,这就像两颗子弹射向了高市早苗

李在明送给中国两件礼物,这就像两颗子弹射向了高市早苗

张斌说
2026-01-05 09:57:23
黄岩岛以东激烈对弈,无侦-10不顾阻扰,强行“加入”美航母军演

黄岩岛以东激烈对弈,无侦-10不顾阻扰,强行“加入”美航母军演

书纪文谭
2026-01-04 17:24:17
免签后的土耳其,悄悄围猎中国中产

免签后的土耳其,悄悄围猎中国中产

旅界Pro
2026-01-03 09:15:00
著名脊柱外科专家、院士候选人,被官宣双开!

著名脊柱外科专家、院士候选人,被官宣双开!

梅斯医学
2026-01-05 07:54:59
我那兄弟娶了个洋媳妇,天天哀嚎:搂着俄罗斯老婆睡,堪比抱刺猬

我那兄弟娶了个洋媳妇,天天哀嚎:搂着俄罗斯老婆睡,堪比抱刺猬

前沿天地
2025-12-29 11:22:33
配料表完全相同!山姆被指与小象超市共享同一供应商,网友吐槽:260元山姆会员卡可以退了【附零售行业市场分析】

配料表完全相同!山姆被指与小象超市共享同一供应商,网友吐槽:260元山姆会员卡可以退了【附零售行业市场分析】

前瞻网
2026-01-04 14:17:29
你见过的最沉得住气的人是怎样?网‬友:五分钟连超10万人的奇迹

你见过的最沉得住气的人是怎样?网‬友:五分钟连超10万人的奇迹

夜深爱杂谈
2026-01-04 23:05:06
行业陋习!雷军确认小字营销要改 小米改用大字注释

行业陋习!雷军确认小字营销要改 小米改用大字注释

3DM游戏
2026-01-04 10:19:04
婆婆住我家每天做饭还给我三千生活费,我把婆婆送走,接来亲妈

婆婆住我家每天做饭还给我三千生活费,我把婆婆送走,接来亲妈

黄小乖的日记
2025-12-01 11:21:33
2026-01-05 14:20:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
322861文章数 606861关注度
往期回顾 全部

科技要闻

雷军新年首播:确认汽车业务降速

头条要闻

媒体:美军掳走马杜罗却放过罗德里格斯 背后或有隐情

头条要闻

媒体:美军掳走马杜罗却放过罗德里格斯 背后或有隐情

体育要闻

女子世界第一,9年前在咖啡店洗碗

娱乐要闻

黄宗泽夺双料视帝,泪洒颁奖台忆往昔

财经要闻

李迅雷:扩内需要把重心从"投"转向"消"

汽车要闻

不是9S是8X!极氪全新高性能旗舰SUV命名官宣

态度原创

手机
艺术
家居
房产
健康

手机要闻

真我Neo8官宣本月发布!外观正式揭晓:独一无二

艺术要闻

19幅 列宾美院学生优秀毕业作品

家居要闻

白色大理石 奢华现代

房产要闻

再次登顶海南楼市!超越阿那亚的,只有阿那亚!

这些新疗法,让化疗不再那么痛苦

无障碍浏览 进入关怀版