网易首页 > 网易号 > 正文 申请入驻

Nature认定的论文综述神器来了

0
分享至

闻乐 发自 凹非寺
量子位 | 公众号 QbitAI

AI写论文这事儿确实不新鲜了,但天下苦假引用久矣。

以往咱用大模型写个综述,看着像模像样的,结果一查参考文献——

好家伙,论文不存在、期刊不存在、作者也不存在(扶额)。

现在不用愁了,Nature新发表了一篇研究,艾伦人工智能研究所(Ai2)和华盛顿大学开源了一个叫OpenScholar的AI系统,写文献综述绝不瞎编。



背靠整整4500万篇科学论文库,直接把GPT-4o那种78%-90%的虚假引用率给干翻了。

那么问题来了,大家都在编,OpenScholar为啥不编?

自我反馈推理

其实主要还是因为LLM的底层逻辑就是预测下一个词出现的概率。

当你问它一个非常生僻的学术问题时,它为了维持语言的连贯性以及“我无所不知”的人设——

会强行根据语料库里的作者名、期刊名、标题关键词,拼凑出一个看起来最像真论文的…幻觉产物。

还有,通用AI缺乏事实锚点,读过万卷书结果全记串了。

张教授写过超导,李教授写过材料,当你问它超导材料时,它能面不改色地给你编出一篇《张教授与李教授关于超导材料的巅峰对话》……

这种由于训练数据截断以及缺乏真实文献验证机制导致的假引用,真的太太太离谱了!



OpenScholar就不一样了,不再拍脑门预测下一个词,直接接入了一个名为ScholarStore的庞大数据库。

这是目前公开的最大科学领域段落索引,全开源可下载,任何人都能本地部署或者扩展。

里面实打实地存了4500万篇论文的全文和摘要,再通过RAG技术,让每个知识点都背靠一篇真实存在的论文。

当你抛出一个科研难题,它会先在那个拥有2.37亿个向量嵌入的超大数据库里疯狂检索,把相关的论文片段全翻出来。

给出初稿之后,带着生成的“这里缺少讨论”“这里引文不准”“需要补搜最新进展”等反馈再检索、再改稿,通过搜索、生成、自我审查、再搜索、再修正这套闭环,反复确认输出的内容是不是真有论文支撑。

这样一来显著降低了幻觉,提高了输出内容的覆盖度和引文精度,整个管道还会被用来生成高质量合成数据,反哺训练。



有多强?

但是!如果只是搜得准,那它充其量是个高级搜索引擎,OpenScholar不止如此。

它在知识合成的深度上,已经开始正面硬刚人类专家了。

研发团队整了个叫Scholar QABench的测试集,涵盖了计算机科学、物理、生物医药等最吃逻辑的领域,由3000个问题和250个长篇专家答案构成。

在自动测评上,OpenScholar-8B这个体量不算大的模型,在正确性上GPT-4o高出5%,比专业的PaperQA2也高出7%,引文准确度和人类专家持平。



团队还搞了个“人机大战”双盲实验,把AI写的答案和实打实的博士、研究员写的答案放一起,然后让另一群顶级科学家来盲评打分。

16位专家两两对比了108份学术答案。结果显示,OpenScholar-8B的回答有51%比人类研究者亲手写的更好,升级组合版的OpenScholar-GPT4o胜率更是冲到70%,而普通GPT-4o只有32%。

评审专家们普遍反馈,OpenScholar的优势集中在信息覆盖更全面、结构更清晰、逻辑连贯性更强,实用价值也更高。

作者团队

这篇研究的一作Akari Asai是艾伦人工智能研究所研究科学家,2026年秋起将任卡内基梅隆大学助理教授。

在此之前她获得了东京大学电气工程与计算机科学专业的学士学位,后在华盛顿大学完成博士学业,研究聚焦于自然语言处理和机器学习,尤其侧重于大型语言模型。



Jacqueline He目前在华盛顿大学读自然语言处理专业博士,本科毕业于普林斯顿大学,曾是普林斯顿自然语言处理小组成员,主要导师是陈丹琦。

读研之前,她还担任过Meta的软件工程师。

Rulin Shao本科毕业于西安交通大学,取得了数学的学士学位,后在卡内基梅隆大学完成了机器学习硕士学位,现为华盛顿大学博士生,同时也是Meta的访问研究员。



团队的其他作者均来自伊利诺伊大学厄巴纳 - 香槟分校、卡内基梅隆大学、Meta、北卡罗来纳大学教堂山分校、斯坦福大学等高校和机构。

论文地址:https://arxiv.org/abs/2411.14199

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
看了姚晨的旧照,才明白凌潇肃曹郁为啥相继沦陷了,嘴大不是缺陷

看了姚晨的旧照,才明白凌潇肃曹郁为啥相继沦陷了,嘴大不是缺陷

八斗小先生
2026-03-20 15:24:18
通用丰田等联名致函:敦促美国继续限制进口中国车

通用丰田等联名致函:敦促美国继续限制进口中国车

快科技
2026-03-24 11:18:08
日本一留学生的帖子爆火!日本网友对不同国家和颜值的外国留学生,态度竟然差这么多?!

日本一留学生的帖子爆火!日本网友对不同国家和颜值的外国留学生,态度竟然差这么多?!

东京新青年
2026-03-25 18:41:06
泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

泪目!全红婵这张红金海报藏深意:从湛江渔村到全球代言人

TVB的四小花
2026-03-26 12:18:20
张雪峰给女儿的底气:名字变商标,这就是中国式父爱!

张雪峰给女儿的底气:名字变商标,这就是中国式父爱!

喜欢历史的阿繁
2026-03-26 13:06:57
14岁初中生把干冰放冰箱,半夜爆炸致价值上万冰箱报废 家长:没责备他

14岁初中生把干冰放冰箱,半夜爆炸致价值上万冰箱报废 家长:没责备他

红星新闻
2026-03-24 23:25:19
张雪峰猝死后,卢克文也不敢跑步了,曾每年跑1千公里,身体垮了

张雪峰猝死后,卢克文也不敢跑步了,曾每年跑1千公里,身体垮了

水晶的视界
2026-03-26 09:28:29
辞职刚4天,通报就来了:这位副总,想跑没跑掉

辞职刚4天,通报就来了:这位副总,想跑没跑掉

老鹰哥
2026-03-25 12:17:52
4月越忙越富的三生肖曝光:好运风口已至,一路上坡顺风顺水!

4月越忙越富的三生肖曝光:好运风口已至,一路上坡顺风顺水!

毅谈生肖
2026-03-26 10:54:48
养生|大便后你用几张纸?用纸量判断你的身体情况

养生|大便后你用几张纸?用纸量判断你的身体情况

A活着
2026-03-24 19:25:23
省政府领导班子密集调整,省委常委任常务副省长

省政府领导班子密集调整,省委常委任常务副省长

上观新闻
2026-03-25 15:46:23
精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

深度报
2026-02-11 23:35:03
1950年女地下党被捕,枪毙前高呼:我可以招,但我要见哥哥

1950年女地下党被捕,枪毙前高呼:我可以招,但我要见哥哥

云霄纪史观
2026-03-26 11:04:00
兄弟俩同出宁海路,一个资产清零,一个负债率28%稳坐前500强

兄弟俩同出宁海路,一个资产清零,一个负债率28%稳坐前500强

花小猫的美食日常
2026-03-26 07:41:46
火箭3将成大麻烦!杜兰特难破包夹,谢泼德不稳,伊森已成毒瘤!

火箭3将成大麻烦!杜兰特难破包夹,谢泼德不稳,伊森已成毒瘤!

篮球资讯达人
2026-03-26 13:25:09
巫启贤曝综艺剧本,如若拆穿节目组要赔钱,只能装作认不出李克勤

巫启贤曝综艺剧本,如若拆穿节目组要赔钱,只能装作认不出李克勤

歪歌社团
2026-03-24 04:08:26
志愿军功臣行刑时朝鲜姑娘冲上前,彭总感慨:让他们在一起吧

志愿军功臣行刑时朝鲜姑娘冲上前,彭总感慨:让他们在一起吧

老范谈史
2026-03-23 17:49:13
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
女大学生住院做检查,报告竟是假的!珠海中山五院等多方回应

女大学生住院做检查,报告竟是假的!珠海中山五院等多方回应

南方都市报
2026-03-24 12:42:25
2026年身份证就是老年证!爸妈满60岁别办证,这4件事千万不能忘

2026年身份证就是老年证!爸妈满60岁别办证,这4件事千万不能忘

复转这些年
2026-03-26 09:26:17
2026-03-26 13:44:50
量子位 incentive-icons
量子位
追踪人工智能动态
12346文章数 176424关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

头条要闻

伊朗议长和外长暂被移出美以清除名单 时限4到5天

体育要闻

35岁替补门将,凭什么入选英格兰队?

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

黄仁勋:芯片公司的时代已经结束了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

本地
旅游
亲子
游戏
公开课

本地新闻

春日吃花第三站——广东

旅游要闻

明起全面实行线上实名预约购票!云台山景区发布公告

亲子要闻

躺平的孩子意外觉醒了,在父母学会当“乌龟”!

IGN认为Xbox机会来了!新主机要转守为攻 重塑自我

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版