网易首页 > 网易号 > 正文 申请入驻

AAAI 2025 | 只根据题目和摘要就能预测论文影响力?

0
分享至

TL;DR:

我们发现微调LLM并引导它来根据题目和摘要预测一个0-1之间的文献计量学指标是很有应用前景的。实验结果表明,微调后的LLM可以准确发现潜在高影响力的论文(NDCG@20>0.9)。我们的方法可以帮助自动科研系统以及个人研究者从海量新发表论文中筛选潜在高质量论文。

论文题目: From Words to Worth: Newborn Article Impact Prediction with LLM 论文链接: https://arxiv.org/abs/2408.03934 数据集与代码主页: https://sway.cloud.microsoft/KOH09sPR21UbojbcHuggingFace 在线 Demo: https://huggingface.co/spaces/ssocean/Newborn_Article_Impact_Predict

大家可能对“文章影响力预测”任务比较陌生,但是想必各位对“学术成果评定”都再熟悉不过了。学术成果评定主要依赖的是一篇文章历史的统计数据,从影响力、潜在的社会或经济贡献等方面评定一篇学术论文的价值。与成果评定评估已经存在的事实相反,论文影响力预测专注于预测一篇论文未来的学术影响力。

图1 早先方法范式一览: 长期以来,论文影响力预测的主流方案就是把引用特征、发表期刊会议等级、作者机构声誉、文章关键字等信息送入诸如SVM、RNN等各样的算法模型中,试图预测这这篇文章未来的引用情况。

自论文影响力预测任务诞生的那一刻起,它就成为了大型学术机构的“专利”。这些大型机构可能会用它来进行调拨科研经费、资助人才等等我们想象不到的事。确实呢,在以前这件事和普通科研人不能说唇齿相依,只能说毫不相干!但随着科研论文发文量的爆炸式增长以及各种新兴的LLM+应用的诞生(如AI4S、自动综述系统、自动科研系统等等),能够用于鉴别重要文献的影响力预测任务变得愈发重要。

这就像以前视频直播是电视台的专利,但随着移动互联网和短视频平台进入千家万户,现在想当主播的普通人也要开始学习布置机位、搭建绿布、调节补光等专业技能。
图2 “巧妇难为无米之炊”,普通研究者和AI系统都需要在海量的文献中,找到最有价值的相关文献。

既然文章影响力预测任务变得愈发重要,以往的方法能否派上用场呢?很遗憾,不太行。

图1谈到了以往的大多数方法高度依赖文章的外部历史信息,但这些信息其实对个人研究者甚至是机构来说,都是很难获取的(比如如何准确获取一篇文章第一个月被引的次数?如何拿到双盲论文的作者信息和发文机构? 这是能说的么)。

另外,有些信息会导致预测任务存在信息泄露的风险。比如,期刊影响因子其实就是一本期刊的平均引用次数。拿期刊影响因子作为输入,去预测一篇被该期刊收录的某篇文章未来的引用次数存在一定的信息泄露可能。更别提有些工作想要预测未来三年的引用情况,要先拿到过往十年的引用数据。过度依赖外部信息导致了以往方法大多只能预测已经发表了一段时间、甚至是已经被收录的文章影响力,而对那些刚刚新发表的论文影响力预测几乎是束手无策。

除了高度依赖外部信息及只能预测已发表论文,这些预测目标本身也存在争议。大家知道,引用次数随领域波动是很大的。就拿图4为例,AI领域顶刊TPAMI的影响因子26.7,不到Nature的1/2,医学顶刊CA的10/1。大领域是如此,小领域也存在类似的现象:专注于通用目标检测的论文,势必会比深耕甲骨文OCR的收获更多的注意(引用次数)。这就导致对领域贡献相同的论文(粗浅的认为质量完全一样的论文),可能就因为领域的不同,引用次数有数倍甚至数十倍的差异。这样巨大的差异导致算法模型在学习过程中也会产生较大的困惑,在多领域联合训练时梯度波动较大(因此,也有方法一个小领域训一个模型,最后在推理时根据领域选择对应的模型)。

那既然引用次数用不成了,有没有什么能支持跨领域对比的指标呢,而且最好还带有神经网络最喜欢的数值归一化性质的?这样就能解决引用次数随领域波动导致训练不稳定的问题了。还真有,那就是带有超越指数性质的TNCSI!好的,我不装了,这是我们之前的一个工作,但当时该指标是用来评价文献综述的累积影响力的。

简单来说,它是由LLM确定的“同领域”内1000篇论文引用分布拟合出的概率密度函数的积分所得出的(跨领域对比的问题解决了!)。如图5所示,TNCSI就是蓝色曲线下方指定区间上的面积。由于是概率密度函数的积分,TNCSI的取值范围天然位于0-1之间(神经网络最喜欢的数值归一化也来了!)。

既然跨领域和归一化的问题都解决了,我们用TNCSI来进行预测如何?我们要先分析下TNCSI的优缺点。首先,TNCSI是一个高度可解释的、数值归一化的指标,它是一篇论文的引用次数超过同领域其它论文的概率。另外,与引用次数相同,TNCSI是一个可以评价单篇文章的指标(莱顿宣言明确指出,不应使用期刊级别的评价指标例如影响因子来评价单篇文章)。这些性质对回归任务来说真的是非常诱人!

但是,由于TNCSI服务对象不同(我们那篇是针对综述设计的),它不能直接判断普通文章的研究领域。此外,TNCSI在设计之处旨在对齐引用次数,着重考虑的是累积影响力。但对文章影响力预测任务来说,使用累计影响力会导致较早发表文献由于时间优势积累更大的影响力,对新发表论文造成“倚老卖老”的不利局面。

遇山开路,遇水架桥!我们先咔咔改了早先提取综述研究领域的prompt,使其现在可以判断普通论文的领域关键字(从而检索相关的1000篇文章)。随后,作者团队又去时间管理局里转了一圈,让Loki把TNCSI踢出神圣时间线,赋予其抵御时间的能力(❌)。随后,我们将TNCSI统计全时间段论文的引用次数分布改为了仅统计该论文发表前后半年共计一年内论文的引用分布情况,从而赋予其抵御时间的能力(✔️)。

好,GT的计算方式已经非常明确(如图8所示)。事不宜迟,我们哐哐造了12000+条数据,每一条数据大概是这样-->(题目,摘要,TNCSI_SP)。这12000条数据来自所arXiv的cs.AI cs.CL cs.CV三大领域,横跨2020、2021、2022三年,整体数据分布是均匀的(每一个区间上的样本量基本相同)。

图8 指标计算过程

有了数据集,现在终于到正头戏了——使用LLM来预测文章影响力!! 长话短说,我们魔改了下LLM的工作方式(如图9所示),把原本逐token逐token生成的范式改为了只生成第一个token,随后把这个token送入MLP并将输出的logits进行sigmoid归一化(闭环了闭环了!)。我们发现LLaMA-3的效果最好,在一个预测0-1之间的数值回归任务中,MAE仅为0.216,NDCG更是干到了0.901!(NDCG∈[0,1],越接近1表明发现高影响力论文的能力越强)。与早先方法的对比(图10)表明我们的方法在仅依靠题目和摘要的情况下,还能有着遥(cou)遥(huo)领(neng)先(yong)的性能表现!

我们还设计了一个有趣的小实验,即分别使用不同年份的数据进行训练。如图11所示,我们发现在使用TNCSI作为回归指标时,不同年份之间的MAE方差很大,导致最终预测效果较差。而使用TNCSI_SP作为预测指标时,不同年份之间的MAE波动很小,整体预测性能也更好。

最后,为了验证我们方法在真实应用中的有效性,我们找了500+篇2024.1.1后年新发表的且已被不同JCR分区期刊收录的文章(这些文章极大概率不在LLaMA-3的预训练语料中,不存在信息泄露风险),并使用所提出的方法预测其影响力。实验结果表明,等级更高的分区,往往有着更高的Top5% & Top25%预测影响力,符合常识认知。

最后我们还是想说一下,不要试图通过虚假声称性能(比如没有达到SOTA但是声称SOTA)等方式来试图提高指标预测分数,让我们共同维护一个良好的学术环境!

不过呢,我们也确实清楚,预测指标肯定会被用来作为indicator,来引导题目和摘要的撰写。对于这种情况,我们的建议是:(1)不要被指标牵着鼻子走,不建议为了“刷分”,把原版题目、摘要改的面目全非。(2)理想区间是在0.60-0.85之间(3)尽量不要优化题目,只针对摘要进行优化。摘要优化时,只进行语义上的优化(换词、优化表达等);(4)当摘要优化到第一次分数下降时,就停止“分数导向的优化”(意思就是不要再看分来优化了)。如果分数不管怎么优化都不高于0.60,或许你应当完全重写摘要(纯理论分析型论文除外!)。

llustration From IconScout By IconScout Store

-The End-

扫码观看!

本周上新!

“AI技术流”原创投稿计划

TechBeat是由将门创投建立的AI学习社区(

www.techbeat.net
) 。 社区上线500+期talk视频,3000+篇技术干货文章,方向覆盖CV/NLP/ML/Robotis等;每月定期举办顶会及其他线上交流活动,不定期举办技术人线下聚会交流活动。我们正在努力成为AI人才喜爱的高质量、知识型交流平台,希望为AI人才打造更专业的服务和体验,加速并陪伴其成长。

投稿内容

// 最新技术解读/系统性知识分享 //

// 前沿资讯解说/心得经历讲述 //

投稿须知

稿件需要为原创文章,并标明作者信息。

我们会选择部分在深度技术解析及科研心得方向,对用户启发更大的文章,做原创性内容奖励

投稿方式

发送邮件到

melodybai@thejiangmen.com

或添加工作人员微信(yellowsubbj)投稿,沟通投稿详情;还可以关注“将门创投”公众号,后台回复“投稿”二字,获得投稿说明。

关于我“门”

将门是一家以专注于数智核心科技领域新型创投机构,也是北京市标杆型孵化器。 公司致力于通过连接技术与商业,发掘和培育具有全球影响力的科技创新企业,推动企业创新发展与产业升级。

将门成立于2015年底,创始团队由微软创投在中国的创始团队原班人马构建而成,曾为微软优选和深度孵化了126家创新的技术型创业公司。

如果您是技术领域的初创企业,不仅想获得投资,还希望获得一系列持续性、有价值的投后服务,欢迎发送或者推荐项目给我“门”:

bp@thejiangmen.com

点击右上角,把文章分享到朋友圈

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
网传新X3大崩盘 不到25万是真是假?实探4S店揭开真相

网传新X3大崩盘 不到25万是真是假?实探4S店揭开真相

沙雕小琳琳
2026-03-10 19:23:50
解放军里职务最低的开国将军:一直到本人去世,最高职务仅为师长

解放军里职务最低的开国将军:一直到本人去世,最高职务仅为师长

旧史新谭
2026-03-10 18:58:21
最大内鬼被挖出!俄媒:卡尼确认完哈梅内伊位置,会没开完就溜了

最大内鬼被挖出!俄媒:卡尼确认完哈梅内伊位置,会没开完就溜了

天天热点见闻
2026-03-09 06:51:26
安洗莹:王祉怡是随时可能超越我的选手,就像我当年战胜陈雨菲一样

安洗莹:王祉怡是随时可能超越我的选手,就像我当年战胜陈雨菲一样

懂球帝
2026-03-10 14:43:21
陈都灵太嫩了

陈都灵太嫩了

阿废冷眼观察所
2026-02-28 11:28:38
值得珍藏:电力+卫星互联网+光刻机+商业航天+英伟达+硅+半导体等

值得珍藏:电力+卫星互联网+光刻机+商业航天+英伟达+硅+半导体等

Thurman在昆明
2026-03-10 00:16:42
赌球+假球+出卖球队!被NBA终身禁赛后,他用一场三双宣告回归

赌球+假球+出卖球队!被NBA终身禁赛后,他用一场三双宣告回归

球童无忌
2026-03-10 20:13:59
普京:责成俄政府评估对欧停供能源可行性,在中东地区持续冲突背景下,俄能源企业要抓住当前时机,利用新增收入来减轻债务

普京:责成俄政府评估对欧停供能源可行性,在中东地区持续冲突背景下,俄能源企业要抓住当前时机,利用新增收入来减轻债务

每日经济新闻
2026-03-10 16:49:28
狂卖1.06亿假“港药”!5年暴利生意被曝光,百年老字号竟是骗局

狂卖1.06亿假“港药”!5年暴利生意被曝光,百年老字号竟是骗局

素衣读史
2026-03-10 16:56:25
灭国级绞杀!伊朗新领袖刚上台,美军基地全面开放,这要彻底亡国

灭国级绞杀!伊朗新领袖刚上台,美军基地全面开放,这要彻底亡国

东极妙严
2026-03-09 17:19:50
国宝进鸡棚!2023年,浙江村民以为蛇偷蛋,扒开枯枝发现1只

国宝进鸡棚!2023年,浙江村民以为蛇偷蛋,扒开枯枝发现1只

万象硬核本尊
2026-03-10 17:29:00
时间节点如何?轰炸1月,全面轰炸即将开始、大体1周,月底有眉目

时间节点如何?轰炸1月,全面轰炸即将开始、大体1周,月底有眉目

邵旭峰域
2026-03-09 12:52:01
上海这晚,57岁周涛秒了30岁李雪琴,不愧是央视严选的国泰民安脸

上海这晚,57岁周涛秒了30岁李雪琴,不愧是央视严选的国泰民安脸

大铁猫娱乐
2026-02-08 00:10:03
NBA最新报道:勒布朗・詹姆斯对加盟勇士、联手库里的态度已明确

NBA最新报道:勒布朗・詹姆斯对加盟勇士、联手库里的态度已明确

夜白侃球
2026-03-10 18:59:56
没想到,两会还没结束,48岁王励勤高调官宣喜讯,又让人刮目相看

没想到,两会还没结束,48岁王励勤高调官宣喜讯,又让人刮目相看

八斗小先生
2026-03-10 16:56:35
伊朗副外长谈停火首要条件:不会再有进一步侵略

伊朗副外长谈停火首要条件:不会再有进一步侵略

看看新闻Knews
2026-03-10 10:58:17
“谷道破裂”一个屈辱的死法,就发生在这个女人身上

“谷道破裂”一个屈辱的死法,就发生在这个女人身上

长安一孤客
2026-03-10 11:35:52
淋浴玻璃隔断“正退出”中国家庭?看了年轻人的做法,发现很高级

淋浴玻璃隔断“正退出”中国家庭?看了年轻人的做法,发现很高级

室内设计师有料儿
2026-03-10 10:38:48
Windows 11系统OpenClaw(龙虾)安装教程|保姆级一步到位

Windows 11系统OpenClaw(龙虾)安装教程|保姆级一步到位

星哥说事
2026-03-08 23:47:27
日本发表了涉台言论后,支持大陆的国家寥寥无几

日本发表了涉台言论后,支持大陆的国家寥寥无几

安安说
2026-03-10 11:36:25
2026-03-10 22:47:00
将门创投 incentive-icons
将门创投
加速及投资技术驱动型初创企业
2305文章数 596关注度
往期回顾 全部

教育要闻

快!南京这些热门民办校“动”了!

头条要闻

小伙辗转8天回国:后悔赚钱赚到伊朗 赴死的心都有了

头条要闻

小伙辗转8天回国:后悔赚钱赚到伊朗 赴死的心都有了

体育要闻

加兰没那么差,但鲈鱼会用吗?

娱乐要闻

《逐玉》注水风波升级!315评论区沦陷

财经要闻

“龙虾补贴”密集出炉 最高1000万!

科技要闻

全民"养虾"背后:大厂集体下场疯狂卖Token

汽车要闻

MG4有SUV衍生 上汽乘用车多款新车规划曝光

态度原创

教育
手机
游戏
时尚
军事航空

教育要闻

近10年,全国普通高校毕业生规模连年增长!

手机要闻

7999起,小米17 Ultra徕卡版全新黑银色开售

羡慕吗?国外图书馆都能借上3A大作了

看来看去这些才是适合普通人的穿搭!不花哨、不繁琐,提气质

军事要闻

刚说完战争很快结束 特朗普改口

无障碍浏览 进入关怀版