网易首页 > 网易号 > 正文 申请入驻

刚刚,ACL首届博士论文奖揭晓!半个顶会都是中国人,超51%占比史无前例

0
分享至


新智元报道

编辑:桃子 好困

【新智元导读】ACL首届博士论文奖公布了,UC伯克利助理教授Sewon Min摘桂冠!开幕式上,组委会公开了今年参会背景,提交论文的中国作者占全世界一半。ACL,如今成了中国的顶会?

ACL 2025在维也纳开幕了!

今年的ACL,可谓是座无虚席,盛况空前。开幕式上,组委会公布了今年参会的具体情况。


值得一提的是,论文里的中国作者已经占据了半壁江山,比例超过51%。

其中,第一作者有高达51.3%来自大陆,排在第二的美国仅为14%。



ACL今年整体情况如下(主会议部分):

• 1,700篇主会论文,1,400篇Findings论文,108篇产业论文

• 17篇CL(Computational Linguistics)论文,40篇TACL(Transactions of ACL)论文

• 2场主旨演讲,1场专家小组讨论


此外,顶会附属活动还包括:28场workshop(投稿超800篇),8场教程(tutorial),64演示(demo),104篇学生研究工作(SRW)论文。

同在今天,首届ACL「计算语言学博士论文奖」正式公布了。

来自UC伯克利EECS助理教授Sewon Min,因论文Rethinking Data Use in Large Language Models斩获大奖。


7月初,她曾获得了ACM博士论文奖荣誉提名

ACL成了中国顶会?

作为NLP领域A类顶会之一,ACL每年汇聚了世界各地学者,今年是第63届年会。

回看过去十年,ACL总论文提交量增长了10倍,过去5年增长了4倍。

今年,顶会共提交了8360(8350)篇论文,其中主会录用率为20.3%,共有1699篇论文。Findings录用率为16.7%,共有1392篇论文。


相较于去年,论文总提交数量上涨了70%,审稿人共有5903人,上涨了38%。

更有趣的是,ACL桌拒比率比24年飙升160%。


从提交论文研究的领域来看,NLP应用(13.1%)位列第一,资源和评估占比12.4%,还有多模态和语言Grounding、语言建模等领域,成为了研究重点。


其他一些数据统计:

  • 67%的论文标题和摘要中有「LLM」一词,其中9%提及了GPT,8%提及了Llama,还有2%论文提及了DeepSeek、BERT、Gemini/Gemma。

  • 50位作者提交了超过10篇论文,23%的作者提交了超2篇论文。

  • 250篇论文有超10位作者,仅一位作者论文有20篇。

  • 65%的论文标题里都有「:」!


目前,ACL最佳论文奖暂未公布,今年首次公布了「计算语言学博士论文奖」。

ACL首届博士论文奖

这篇获奖论文Rethinking Data Use in Large Language Models,于2024年发表,全文长达157页,是华盛顿大学Sewon Min的博士毕业论文。

ACL组委会点评,这篇论文为大模型的行为和能力提供了关键见解,特别是在上下文学习方面。

其研究结果,对当今NLP的核心产生了影响。


论文地址:https://www.sewonmin.com/assets/Sewon_Min_Thesis.pdf

总的来说,这篇研究核心,重点围绕LLM如何利用训练时使用的的大量文本语料库。

首先,作者揭示了这些模型在训练后学习新任务的内在机制——其所谓的上下文学习能力几乎完全取决于从训练数据中获取的知识。

接着,她又提出了一类新型非参数化语言模型。

它们将训练数据重新定位为可检索的信息数据库,从而显著提升准确性与可更新性。

在此过程中,作者还开发首批广泛应用的神经检索模型之一,以及将传统两阶段流程简化为单阶段的创新方法。

研究表明,非参数化模型为负责任的数据使用开辟了新途径。比如,通过对授权文本与受版权内容的分类差异化处理。

最后,Sewon Min对下一代语言模型的发展方向作出展望,强调高效Scaling、事实性增强、去中心化架构这三大核心目标。


7月初,她的这篇论文,还获得了ACM博士论文荣誉提名。在接受ACM采访中,她首次畅谈了选择LLM领域原因,以及对当前AI领域的一些看法。

以下内容,为采访部分截取:

Q:你是如何决定将LLM作为研究方向的?

NLP领域的研究者长期致力于构建「通用模型」——无需针对特定任务训练就能处理多种任务。

当大语言模型出现时,其技术路径是通过海量数据的自监督训练来构建巨型模型,从而消除对人类监督的依赖。

这似乎为实现该目标指明了一条道路。

这个理念简单得令人沮丧,却揭示了诸多关键要素:数据质量与规模的核心作用、对人类先验知识的最小化依赖、以及消除人工标注环节。以上是官方回答。

老实说,这个领域听起来就令人兴奋,而且研究过程充满乐趣。如今该领域能产生如此广泛而深远的影响,我感到非常幸运。

Q:你在近期演讲中提到,当前LLM生成人物传记时,事实错误率高达42%。为何会出现这种情况?

我认为这与当前LLM基于记忆训练数据的底层机制有关。

对于知名人士,模型能生成准确传记,因为相关高频出现于训练数据中;但对于曝光不足的对象,模型往往无法准确回忆,转而生成看似合理实则错误的文本(即幻觉现象)。

这反映了此类模型数据学习机制的核心局限。

Q:你在「非参数化」大语言模型领域取得突破性成果。能否举例说明非参数化大语言模型与标准大语言模型在生成响应时的区别?

标准大语言模型常虚构事实。例如,当我询问无法联网的ChatGPT「首尔有哪些米其林三星餐厅」时,它错误列举了二星餐厅Gaon和已歇业的La Yeon,甚至编造营业时间——这反映出记忆知识的过时与缺失。

而非参数化大语言模型会从实时更新的数据存储中检索文档(如2025年提到首尔唯一三星餐厅Mingles的文章),并基于这些文档给出正确答案。

作者介绍


Sewon Min是加州大学伯克利分校电子工程与计算机科学系的助理教授,同时也是艾伦人工智能研究所的研究科学家,并隶属于伯克利人工智能研究实验室和伯克利自然语言处理研究组。

她的研究方向是自然语言处理和机器学习,特别是在大语言模型领域——致力于深入理解并推动模型的发展,重点研究如何利用海量的文本语料库。


此前,她在华盛顿大学获得计算机科学与工程博士学位,在首尔大学获得计算机科学与工程学士学位。曾担任Meta FAIR的兼职访问研究员,并先后在谷歌研究院和Salesforce研究院实习。


参考资料:

https://x.com/aclmeeting/status/1949836573144445424 https://www.acm.org/articles/people-of-acm/2025/sewon-min


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
郑钦文宣布:退出2026年澳网 经评估未达到100%战斗状态

郑钦文宣布:退出2026年澳网 经评估未达到100%战斗状态

醉卧浮生
2026-01-08 15:56:12
闫学晶风波不断升级!网友扒出其儿子考中戏新疆班,分数要低30分

闫学晶风波不断升级!网友扒出其儿子考中戏新疆班,分数要低30分

小徐讲八卦
2026-01-07 16:31:06
U23亚洲杯刚刚开打,第一位下课主帅已经诞生,中国队渔翁得利

U23亚洲杯刚刚开打,第一位下课主帅已经诞生,中国队渔翁得利

绿茵舞着
2026-01-07 20:57:07
马杜罗还有救,联合国召开大会,6国出面救人,朝鲜下令发射导弹

马杜罗还有救,联合国召开大会,6国出面救人,朝鲜下令发射导弹

军机Talk
2026-01-06 10:23:09
笑死,果然大多数中年人都意识不到自己有多老!8090后也跟着破防了

笑死,果然大多数中年人都意识不到自己有多老!8090后也跟着破防了

另子维爱读史
2026-01-07 20:53:19
2026申花最强门将已经到位 再缺神扑就没办法!

2026申花最强门将已经到位 再缺神扑就没办法!

80后体育大蜀黍
2026-01-07 23:33:42
女子开车不慎掉进池塘,71岁大爷跳河救人,事后女子上门感谢,竟在大爷家中看见自己小时候的照片.....

女子开车不慎掉进池塘,71岁大爷跳河救人,事后女子上门感谢,竟在大爷家中看见自己小时候的照片.....

乔话
2026-01-06 22:36:58
9岁女孩在校做题时,昏倒去世

9岁女孩在校做题时,昏倒去世

中国新闻周刊
2026-01-08 14:34:06
四川一对夫妻同时失业,刚贷款买房4个月:人算不如天算啊

四川一对夫妻同时失业,刚贷款买房4个月:人算不如天算啊

唐小糖说情感
2026-01-07 16:28:02
李沁雷军在一起了!?

李沁雷军在一起了!?

八卦疯叔
2026-01-08 11:36:17
咸阳“水上雅丹”一男子溺亡,当地称系村民下水捞衣服酿悲剧,事发地上月刚火爆出圈

咸阳“水上雅丹”一男子溺亡,当地称系村民下水捞衣服酿悲剧,事发地上月刚火爆出圈

极目新闻
2026-01-08 16:00:44
你见过的最沉得住气的人是怎样?网‬友:五分钟连超10万人的奇迹

你见过的最沉得住气的人是怎样?网‬友:五分钟连超10万人的奇迹

夜深爱杂谈
2026-01-04 23:05:06
咸鱼还是太全面了,怪不得人称国内黑市

咸鱼还是太全面了,怪不得人称国内黑市

另子维爱读史
2025-12-20 17:07:20
曼联27次传中!弗莱彻双顺足激活谢什科,解决老问题出现新问题

曼联27次传中!弗莱彻双顺足激活谢什科,解决老问题出现新问题

卡灵顿分析师
2026-01-08 18:22:46
刺激!苹果突然官宣:1月8日,新品正式发售!

刺激!苹果突然官宣:1月8日,新品正式发售!

科技堡垒
2026-01-06 11:41:33
iPhone 13系列开启限时半价电池换新服务 仅需399元!

iPhone 13系列开启限时半价电池换新服务 仅需399元!

手机中国
2026-01-07 12:13:21
曾经他们硬气的拒绝了中国,如今好怀念他们当初桀骜不驯的样子!

曾经他们硬气的拒绝了中国,如今好怀念他们当初桀骜不驯的样子!

北纬的咖啡豆
2025-12-23 14:28:08
勇士这一次是真的搬起石头砸自己的脚了?

勇士这一次是真的搬起石头砸自己的脚了?

邓肯的笑
2026-01-08 18:26:01
特朗普提出将美国军费提升至1.5万亿美元

特朗普提出将美国军费提升至1.5万亿美元

澎湃新闻
2026-01-08 08:25:03
今日金价一夜突变!1月8日调整后,全国珠宝店,黄金最新售价

今日金价一夜突变!1月8日调整后,全国珠宝店,黄金最新售价

别人都叫我阿腈
2026-01-08 06:59:15
2026-01-08 18:39:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14285文章数 66451关注度
往期回顾 全部

教育要闻

9岁女孩在学校写试卷时昏倒去世,母亲:我不忍心尸检,怕女儿疼。当地已成立工作专班并配合家属善后

头条要闻

陈志被押解回国 太子银行进入清算程序贷款人仍需还款

头条要闻

陈志被押解回国 太子银行进入清算程序贷款人仍需还款

体育要闻

约基奇倒下后,一位故人邪魅一笑

娱乐要闻

抗战剧《马背摇篮》首播,获观众好评

财经要闻

微软CTO韦青:未来人类会花钱"戒手机"

科技要闻

智谱拿下“全球大模型第一股”,凭什么

汽车要闻

从量变到"智"变 吉利在CES打出了五张牌

态度原创

亲子
家居
本地
游戏
公开课

亲子要闻

汪小菲老婆孕晚期拍孕妇照,大肚光滑没长纹,一顿五菜三汤被娇养

家居要闻

理性主义 冷调自由居所

本地新闻

1986-2026,一通电话的时空旅程

“很多士兵会死” 制作人透露《绝地潜兵2》重大更新

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版