网易首页 > 网易号 > 正文 申请入驻

不仅仅是代码链接:arXiv联手Papers with Code,推出两项新功能

0
分享至

作者 | 青暮

据官方推特消息,Papers With Code联合arXiv推出了代码链接功能,以后在上传arXiv论文的时候,就能顺便提交代码,不需要在论文里默默地加上链接,然后被忽略啦!

1

新功能用法

Papers With Code近期与arXiv建立了合作伙伴关系,以支持arXiv上的代码链接。arXiv上的机器学习文章现在有了一个“代码”选项卡,用于将官方代码和社区代码与论文链接起来,如下图所示:

图注:arXiv论文的新代码选项卡,由Papers with Code提供支持。

图注:官方代码和社区代码均来自Papers with Code。

具体来说,论文作者可以通过转至arxiv.org/user,并单击带有“Papers With Code”图标的“Link to code”(如下图所示),以将正式代码添加到arXiv论文中。

点击该图标将定向到Papers With Code,然后作者就可以添加代码。一旦添加了官方实现,官方代码部分将显示在arXiv文章页面上。如果存在的话,还会包含其它社区实现的链接。而在用户请求下,可以永久删除与该用户连接的其他数据。

2

结构化搜索的典范

Papers with Code 于 2018 年 7 月建立,初衷是帮助机器学习爱好者追踪最新的论文及源代码,快速了解最前沿的技术进展,创立者是剑桥大学的两位高材生Robert Stojnic和Ross Taylor。

该网站涉及了多种机器学习任务,包括计算机视觉、自然语言处理、医疗、方法论、语音、游戏、图、时序、音频、机器人、音乐、推理、计算机代码、知识库、对抗等。

Papers with Code将 arXiv 上最新的机器学习论文与 GitHub 上的代码对应起来,让用户可以按标题关键词查询,或者按流行程度、GitHub 收藏数、当前最优排列论文。 所以,arXiv的新功能无非是把Papers with Code的部分原有功能植入了arXiv。

截至2019年12月,Papers with Code 已经累积了 18000 篇论文、1000 项任务和 1500 个排行榜,成为最常用的机器学习资源网站之一。此时,Papers with Code 已并入 Facebook AI ,但其仍然保持平台独立性。

在开发结构化搜索上,Papers with Code可谓不遗余力。 今年五月份Papers with Code发布了重大更新,当时他们已经拥有2500多个排行榜和20,000多个结果,并且利用他们的结果提取方法,排行榜中的实验结果可以直接链接到arXiv论文中的表格。

图注:表格结果提取流程。

今年7月,Papers with Code又发布了提取论文模型方法的新功能,方法页面提供了论文的有关方法、架构、相关论文、涉及任务、随时间变化的使用趋势以及该方法所依赖的子组件。其中子组件涉及730多种机器学习的构建基块:优化器、激活、注意层、卷积等。以下是MobileNetV2的示例。

有关方法、架构:

相关论文:

涉及任务:

随时间变化的使用趋势:

该方法所依赖的子组件:

3

茫茫沧海寻一栗

arXiv是一个收集了物理学、数学、计算机科学、生物学与数理经济学的论文预印本的网站,始建于1991年8月14日。截至2008年10月,arXiv.org已收集超过50万篇预印本;至2014年底,其藏量达到1百万篇。截至2016年10月,提交率已达每月超过10,000篇。

今年8月,arXiv则集成了170万篇arXiv预印本,托管到了Kaggle上供用户免费使用,数据库包括论文标题、作者、类别、摘要、全文pdf等论文相关信息。

arXiv论文信息的可发现率低一直是个困扰用户的主要问题。arXiv网站所收录的论文数量十分庞大,为用户的阅读带来明显的压力。这是由于过分依赖 LaTex 而出现的缺陷,此外还包括使用门槛高、pdf格式不支持在线编辑、论文与数据互相独立等缺陷。

而可发现率低则很可能会导致读者忽略一些重要的发现、关联知识、创新工具或视角。

但是看得出来,arXiv正在通过合作关系,比如Papers with Code和Kaggle,为改善该资料库的可读性以及可编辑性、令其更加结构化而努力着。

4

不仅仅是代码链接

这个在arXiv页面显示代码的新功能是由Papers with Code开发的。Papers with Code表示,他们的目标是“通过使研究更易于掌握、使用和扩展来加速科学进步。” 在arXiv上显示代码可以使研究人员更容易地基于最新的机器学习研究进行开发。

Papers with Code还希望这项行动对机器学习之外的计算科学社区产生连锁反应,并表示他们将继续探索新的工具来解决机器学习中的问题,例如可再现性和信息过载。

arXiv则表示,他们重视用户数据的开放性、社区性和隐私性,并且仅与遵守相同原则的合作伙伴合作。

与所有第三方合作者一样,Papers with Code只能访问有关arXiv用户的最少和匿名数据,并且仅用于确保arXivLabs功能的正确运行,并严格禁止arXiv书面同意中未包括的任何其他用途。

Papers with Code和arXiv的此次合作成果不仅仅是提供代码链接功能,Papers with Code还为arXiv开发了新分类算法。

论文作者在arXiv上提交论文时,机器学习分类器会自动使用论文的标题和摘要作为输入,将研究文章与现有的arXiv类别进行匹配。如果模型找到的类别与作者选择的类别不同,它将提出推荐的类别。作者可以接受新类别推荐,也可以忽略。

算法的开发人员是arXiv的忠实读者,他们尝试了几种方法,最终使用了两个开源模型ULMFiT和fastText,它们分别进行了160万份摘要和12万篇论文全文的训练,并结合了数据分层方法(解决大型类别不平衡)。

分类器GitHub地址:https://github.com/arXiv/arxiv-classifier

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
CBA男篮最新动态!辽宁vs浙江,赛前带来辽宁队赵继伟、新大外援、威尔斯以及浙江男篮最新消息

CBA男篮最新动态!辽宁vs浙江,赛前带来辽宁队赵继伟、新大外援、威尔斯以及浙江男篮最新消息

凯丰侃球
2026-04-03 00:12:56
地铁直达!北京28亿中医新院区,2029年建成,看病不用跑远路

地铁直达!北京28亿中医新院区,2029年建成,看病不用跑远路

水泥土的搞笑
2026-04-03 00:39:39
检查一下:卧室里有“这7样”东西,尽快拿走!别给自己找麻烦

检查一下:卧室里有“这7样”东西,尽快拿走!别给自己找麻烦

抠搜侠
2026-04-02 16:01:42
名场面!特朗普突袭最高法想立威,反被法官一句话回怼:变脸离席

名场面!特朗普突袭最高法想立威,反被法官一句话回怼:变脸离席

小豹子找食物
2026-04-02 17:44:44
李嘉诚贴身风水师:因泄露天机遭天谴,死后为鬼算命,瞧不上许老板

李嘉诚贴身风水师:因泄露天机遭天谴,死后为鬼算命,瞧不上许老板

可儿故事汇
2024-08-20 23:50:14
8天已到,高市拒绝道歉!外交部宣布动手,日本有人财产全被冻结

8天已到,高市拒绝道歉!外交部宣布动手,日本有人财产全被冻结

书纪文谭
2026-04-02 13:22:34
美以还未撤军,阿联酋将对伊朗宣战,话音刚落,中巴发表联合声明

美以还未撤军,阿联酋将对伊朗宣战,话音刚落,中巴发表联合声明

烈史
2026-04-01 22:50:25
76人153-131大胜奇才!乔治创31年纪录,不愧是年薪5100万球员

76人153-131大胜奇才!乔治创31年纪录,不愧是年薪5100万球员

篮球大视野
2026-04-02 09:46:05
针对演员AI换脸、声纹复刻,行业协会重磅发声!

针对演员AI换脸、声纹复刻,行业协会重磅发声!

证券时报e公司
2026-04-02 19:31:01
美准备派地面部队打伊朗?中方严肃警告:绝不允许将战乱引入亚太

美准备派地面部队打伊朗?中方严肃警告:绝不允许将战乱引入亚太

兴史兴谈
2026-04-01 20:14:06
连续4个月损失人数超过动员人数,7.6万俄高校学生或加入俄军

连续4个月损失人数超过动员人数,7.6万俄高校学生或加入俄军

山河路口
2026-04-01 11:38:12
粉底液将军事件再升级!网友怀疑反华势力入侵,张凌赫恐被当炮灰

粉底液将军事件再升级!网友怀疑反华势力入侵,张凌赫恐被当炮灰

千言娱乐记
2026-04-02 12:32:24
特朗普:美国联邦政府不能承担育儿医保费用,因为美国正在打仗,并建议州政府提高税率

特朗普:美国联邦政府不能承担育儿医保费用,因为美国正在打仗,并建议州政府提高税率

大象新闻
2026-04-02 21:53:07
中年群体猝死事件刷屏!网友建议:别再裸睡,万一猝死太不体面

中年群体猝死事件刷屏!网友建议:别再裸睡,万一猝死太不体面

火山詩话
2026-04-01 13:23:12
普京拍板为伊朗兜底?特朗普通告全球,法国上将:中国迟早也要动

普京拍板为伊朗兜底?特朗普通告全球,法国上将:中国迟早也要动

李健政观察
2026-04-02 12:18:04
美媒:哈马斯的5000枚火箭弹,至少打出了中国5年的战略缓冲期

美媒:哈马斯的5000枚火箭弹,至少打出了中国5年的战略缓冲期

轩逸阿II
2026-03-29 12:25:26
博主:据传王霄在辽宁铁人办公室上了一天班之后已经离任

博主:据传王霄在辽宁铁人办公室上了一天班之后已经离任

懂球帝
2026-04-02 17:39:13
美国遮羞布被扯下?马斯克:没有中国,谁也别想造出电动车!

美国遮羞布被扯下?马斯克:没有中国,谁也别想造出电动车!

混沌录
2026-04-02 16:18:31
整容脸千万别演年代剧!看冬去春来里章若楠和林允对比就全明白了

整容脸千万别演年代剧!看冬去春来里章若楠和林允对比就全明白了

TVB的四小花
2026-04-02 14:56:47
中央网信办、工业和信息化部、公安部关于开展2026年个人信息保护系列专项行动的公告

中央网信办、工业和信息化部、公安部关于开展2026年个人信息保护系列专项行动的公告

小易正能量
2026-04-02 20:44:14
2026-04-03 04:44:49
AI科技评论 incentive-icons
AI科技评论
点评学术,服务AI
7167文章数 20742关注度
往期回顾 全部

科技要闻

三年亏20亿,最新估值58亿,Xreal冲刺港股

头条要闻

伊朗称击中敌军先进战机 已坠入波斯湾

头条要闻

伊朗称击中敌军先进战机 已坠入波斯湾

体育要闻

邵佳一的改革,从让每个人踢舒服开始

娱乐要闻

《浪姐》人气榜出炉!曾沛慈断层第一

财经要闻

市场被特朗普一句话打醒 滞胀交易回归

汽车要闻

轴距2米7/后排能跷腿 试驾后驱小车QQ3 EV

态度原创

亲子
房产
旅游
数码
健康

亲子要闻

刚出生的宝宝第一次睁眼,竟偷偷浅浅一笑

房产要闻

巨无霸来了!海口城更,突然又爆大动作!

旅游要闻

文明旅游 | 清明出行,让文明与安全一路相伴!

数码要闻

跨界者大疆:不折腾才是扫地机的终极形态

干细胞抗衰4大误区,90%的人都中招

无障碍浏览 进入关怀版