网易首页 > 网易号 > 正文 申请入驻

MOSS孙天祥新公司要让AI自己写100篇论文,还要全网直播一个月

0
分享至


作者 | 周一笑
邮箱 | zhouyixiao@pingwest.com

一场持续一个月的直播,让AI研究AI自己。

明天上午11点,一场持续约一个月的直播即将上线。

屏幕里将没有主播,只有一个名为FARS的AI系统在工作。它将从零开始,自主完成科研全流程:调研文献、提出假设、设计实验、编写和执行代码、分析数据、撰写论文,目标是连续产出100篇完整的研究论文。全程自动,没有人类介入。

做这件事的公司叫Analemma(行迹智能),成立不到一年,已获得红杉中国、高榕创投、光源资本、嘉程资本、美团龙珠等机构数千万美元的天使轮融资。创始人孙天祥是三年前引爆国内大模型热潮的MOSS的核心开发者。

据硅星人了解,以公开直播的方式部署全自动科研系统,此前在全球范围内尚无先例。

1

四个智能体,一座科研工厂

FARS,全称Fully Automated Research System,全自动研究系统。


FARS技术架构图

技术架构上,FARS是一个多智能体系统,由四个模块构成:Ideation(构思)负责文献调研和假设生成,Planning(规划)负责实验方案设计,Experiment(实验)负责代码编写和执行,Writing(写作)负责论文撰写。四个智能体在一个共享文件系统中协作,这个文件系统同时承担工作空间和持久记忆的角色。

模型层面,FARS调用了Claude、GPT、Gemini等多家闭源模型的API,部分链路使用后训练的自研模型。换言之,FARS的核心能力在Agent系统工程层面:如何编排多个智能体协同完成一个跨越数天的长链条任务,如何让系统在没有人类干预的情况下持续可靠地运转。硬件上,团队将一个包含160张NVIDIA GPU的集群封装成工具,供实验智能体调度和调用。


Fars

设计理念上,FARS和传统学术论文的逻辑有明显区别。按照团队的说法,FARS的设计基于研究系统的第一性原理:高效、可靠地拓展知识边界。它的产出以“短论文”形式呈现,每篇聚焦一个边界清晰的研究贡献,鼓励报告失败结果,不要求遵循传统学术论文的篇幅和结构限制。

FARS团队认为,此前的AI科研系统“仍然在按照现代学术出版的惯例来生产论文”,而FARS选择跳出这个框架,回到科研的基本单元:一个清晰的假设,加上对它的可靠验证。无论验证结果是正向还是负向,都构成有意义的知识。

本次直播中,FARS将从9个预设研究方向出发,涵盖当前AI研究的多个热点:强化学习从可验证奖励中学习(RLVR)、小语言模型后训练、前沿LLM自动化评估、超越Transformer的模型架构、持续学习、扩散语言模型、AI Agent记忆机制、测试时计算缩放(Test-Time Scaling)、世界模型。系统也被允许自由探索预设方向之外的课题。

FARS目前聚焦的研究领域是AI本身。孙天祥在Google Scholar上标注的研究关键词中有一个"AI4AI",即用AI来研究AI。选择这个领域有务实考量:AI领域的实验可以完全在计算机上完成,不需要物理实验室,天然适合自动化。当然,局限也很明显:FARS暂时无法进行极度消耗算力的实验(如大规模预训练),也无法完成需要人类直接参与的实验(如人工标注或专家评估)。

关于产出质量的把控,团队设置了一道门槛:FARS生产的每篇论文在上传arXiv之前,将经过至少3位具有五年以上研究经验的团队成员审核,论文首页也会被明确标注为AI生成。据了解,团队不打算将这些论文投稿到传统学术会议,而是会邀请同行评审,更关注论文的实际引用和结果价值。

那为什么要做成公开直播,而且目标定在100篇?

团队给出的解释是:规模是评估自动化研究系统的关键。几篇看上去不错的论文说明不了什么,但100篇的连续产出,会让系统的真实能力充分暴露。他们也坦言,此前从未大规模部署过FARS,对它的实际工作过程和产出结果“感到同样的未知和好奇”。


在FARS之前,Analemma已经上线了一个名为Lemma的产品(lemma.analemma.ai),提供快速文献调研、深度调研报告和代码实验三项功能。孙天祥告诉硅星人,Lemma是辅助驾驶,定位是生产力工具;FARS是自动驾驶,定位是基础设施。

1

从MOSS走出来的创业者

孙天祥,2019年从西安电子科技大学毕业后直博进入复旦大学,师从邱锡鹏和黄萱菁两位教授,2024年获得计算机科学博士学位。读博期间,他以第一作者在ICML、ACL、NAACL、AAAI等AI顶会发表论文十余篇,Google Scholar引用超4200次,曾获字节跳动奖学金(全国13人)、WAIC云帆奖明日之星(全球15人)、复旦学术之星(全校STEM研究生仅10人)等荣誉。

但让他被更多人知道的,是MOSS。

2023年2月20日,复旦大学自然语言处理实验室发布了MOSS,国内首个面向公众的类ChatGPT对话式大语言模型。消息当天冲上知乎热榜第一、微博多个热搜,服务器瞬间被挤爆。在各大公司还在宣布“即将推出”自家大模型的时候,一个8人学生团队抢先交出了答卷。两个月后,MOSS全面开源代码、数据和模型参数,成为国内首个开源的对话式大语言模型。

孙天祥是MOSS的主开发者。他的导师邱锡鹏后来在接受采访时说过一句话:“一个学术研究的实验室无法做出和ChatGPT能力相近的模型。”MOSS的意义也确实不在于追平ChatGPT,而在于用极度有限的资源验证了这条技术路线的可行性,为后来国内大模型的快速跟进提供了开源基础。

MOSS走红时,孙天祥还在读博。据了解,当时国内几位知名的大模型创业者都曾邀请他加入,但彼时博士还没毕业。2024年毕业后,VC也接踵而至。他最终选择了自己创业:2025年3月创办Analemma(行迹智能),同期加入上海创智学院担任助理教授,走了一条学术和创业并行的路。


据了解,Analemma目前团队约15人,其中一半是研究团队,核心成员来自复旦MOSS团队和InternLM(书生大模型)项目。公司名取自天文学术语“日行迹”,指太阳在一年中于天空划出的8字形轨迹。Slogan是“在一个问题无限的世界里,我们需要构建无限心智”。从名字到定位,都指向一个研究驱动的长期目标。


1

一条正在升温的赛道

FARS并非第一个试图让AI自主做科研的系统。过去一年半,这个方向出现了密集进展。

2024年8月,日本AI公司Sakana AI发布了AI Scientist,被称为首个端到端全自动科研系统。它可以从idea到论文全程自动完成,每篇成本约15美元,代码完全开源。但后续的第三方评估相当不客气:有研究者指出AI Scientist生成的论文中位引用仅5篇,存在幻觉数字、占位符文本、重复章节等问题,整体质量被描述为"相当于一个赶deadline的、没什么动力的本科生"。

2025年4月,Sakana AI发布了升级版AI Scientist v2,引入基于树搜索的实验策略。这一版出现了标志性突破:一篇AI生成的论文成功通过了ICLR 2025 Workshop的同行评审,这也是AI生成的科研论文首次被学术会议接收。不过这只是Workshop级别,距离主会议论文还有距离。

同期,香港大学Chao Huang团队发布了AI-Researcher,获得NeurIPS 2025 Spotlight论文,覆盖计算机视觉、NLP、数据挖掘等多个领域,并已推出产品化版本Novix。

在大公司一侧,OpenAI在2025年10月公布了路线图:计划在2026年9月前开发出"AI研究实习生",能有意义地加速研究者的工作;到2028年3月,目标是完全自主的AI研究员,可独立完成端到端研究。首席科学家Jakub Pachocki的表态很有分量:为了重大科学突破,值得把整个数据中心的算力投入到单一问题上。

FARS在这个赛道里处于什么位置?

技术路线上,它和AI Scientist、AI-Researcher属于同一类端到端全自动科研系统,FARS也明确提到了上述所有竞品并逐一做了对标。但FARS也有自己的差异点:它跳出了学术出版的惯例,回到研究本身的逻辑,以可验证的假设为单位来组织产出。

更关键的差异在展示方式。之前的系统公开了代码和样例论文,发布了benchmark,但没有人做过实时、大规模、全透明的公开部署。这是一个大胆的选择。团队也直言,他们无法独立评估自己系统的产出,需要更广泛的学术社区参与评价。

起步领域的选择同样值得关注。AI4AI和此前Sakana AI Scientist选择机器学习子领域的逻辑类似,AI研究的实验门槛最低,只需要代码和算力,迭代最快,也最容易被同行评估。但这也意味着,距离“AI做生物学研究、物理学研究”的愿景还有相当距离。团队也承认,AI4AI是当前阶段的选择,而非方法论本身的限制。


明天上午11点,FARS的直播将在analemma.ai/fars上线,同时在多个社媒平台同步播出。在接下来约一个月里,这个系统将在公众面前从零开始做科研,所有产出通过其GitHub账号(github.com/fars-analemma)实时公开。

三年前,孙天祥和8个同学做出了MOSS,在资源极度有限的条件下抢先交了一份答卷。现在他想验证的命题更大:AI能不能自己做科研。这个问题的答案,最终取决于那100篇论文的质量。论文会公开,所有人都可以去读、去评。

FARS只聚焦在AI领域,离"AI做所有学科的科研"还很远。但这个方向本身正在快速升温。智源研究院在其2026年趋势预测中指出,AI for Science正在从Copilot角色向AI Scientist角色迁移,开始具备自主执行"假设提出、实验设计、数据分析、结论推断"完整科研链路的能力。OpenAI把"全自主AI研究员"写进了2028年的路线图。DeepMind去年底宣布将在英国建设首个AI自动化研究实验室。

在这场围绕自动化科研的全球竞赛中,FARS可能是来自中国的第一个公开实验。它的结果值得关注。


点个爱心,再走 吧

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
Lisa上萝莉岛伺候资本大佬!?

Lisa上萝莉岛伺候资本大佬!?

八卦疯叔
2026-02-10 11:31:25
完爆了勇士防线!马刺后场核心的重要性真是被严重低估了?

完爆了勇士防线!马刺后场核心的重要性真是被严重低估了?

稻谷与小麦
2026-02-13 01:42:32
《太平年》大结局:孙太真病逝,李元清编百家姓,范仲淹生父赢麻

《太平年》大结局:孙太真病逝,李元清编百家姓,范仲淹生父赢麻

全球风情大揭秘
2026-02-13 01:32:40
上海男篮卫冕CBA杯冠军引热议!山西6人犯满离场洛夫顿获MVP

上海男篮卫冕CBA杯冠军引热议!山西6人犯满离场洛夫顿获MVP

狼叔评论
2026-02-12 22:34:06
博主吐槽被拒载于是自己买车载狗,看到当事狗后,网友集体反水:你知道的,我很少站司机这边除了这次!

博主吐槽被拒载于是自己买车载狗,看到当事狗后,网友集体反水:你知道的,我很少站司机这边除了这次!

爱宠物
2026-02-12 21:48:37
上海夺冠更衣室!卢伟点赞外援+3本土球员,刘铮展露傲娇表情!

上海夺冠更衣室!卢伟点赞外援+3本土球员,刘铮展露傲娇表情!

篮球资讯达人
2026-02-12 23:54:21
国米意甲0次获利自证清白,全主力阵容应对魔鬼赛程!

国米意甲0次获利自证清白,全主力阵容应对魔鬼赛程!

肥强侃球
2026-02-12 23:27:35
重庆双胞胎器官衰竭,医院却查不出病因,父亲煮面时发现致命线索

重庆双胞胎器官衰竭,医院却查不出病因,父亲煮面时发现致命线索

天梦见证
2025-04-01 20:46:34
南丁格尔做了张“玫瑰图”,结果把士兵的死亡率从42%降到2.2%

南丁格尔做了张“玫瑰图”,结果把士兵的死亡率从42%降到2.2%

果壳
2026-02-12 16:48:42
除夕夜都别睡了!“春节红包大战”总额飙至近100亿

除夕夜都别睡了!“春节红包大战”总额飙至近100亿

极目新闻
2026-02-11 19:26:54
三峡大坝“账本”曝光:运行了20余年,2500亿投入如今回本了吗?

三峡大坝“账本”曝光:运行了20余年,2500亿投入如今回本了吗?

墨兰史书
2026-01-26 08:20:07
李立群回河南祭祖:曾给同父异母的大哥三笔钱,让他从贫穷到富有

李立群回河南祭祖:曾给同父异母的大哥三笔钱,让他从贫穷到富有

笔墨V
2026-02-13 02:07:48
姚晨没想到,离春节不到7天,前夫凌潇肃靠着佟大为,又火了一把

姚晨没想到,离春节不到7天,前夫凌潇肃靠着佟大为,又火了一把

天天热点见闻
2026-02-12 10:42:06
10分钟内股价直线涨停!光伏巨头最新公告:未直接与SpaceX发生合作

10分钟内股价直线涨停!光伏巨头最新公告:未直接与SpaceX发生合作

每日经济新闻
2026-02-12 18:32:07
刘青云夫妇洛阳度假,58岁郭蔼明穿破洞裤,不用带娃不愁钱像40岁

刘青云夫妇洛阳度假,58岁郭蔼明穿破洞裤,不用带娃不愁钱像40岁

八怪娱
2026-02-12 11:03:53
除夕当天,家里这3个地方千万别熄灯!老辈人传下的“引财方”

除夕当天,家里这3个地方千万别熄灯!老辈人传下的“引财方”

小陆搞笑日常
2026-02-08 17:24:09
深夜突变!金价闪崩,直线暴跌3%!美股全线跳水,超4100股下跌,苹果市值蒸发超8000亿元,中概股跌幅扩大

深夜突变!金价闪崩,直线暴跌3%!美股全线跳水,超4100股下跌,苹果市值蒸发超8000亿元,中概股跌幅扩大

每日经济新闻
2026-02-13 01:02:05
马斯克谈Seedance 2.0:发展速度太快

马斯克谈Seedance 2.0:发展速度太快

财联社
2026-02-12 13:40:07
宗熙先生:春节将至,为什么成片的黄灯笼会引发不适?

宗熙先生:春节将至,为什么成片的黄灯笼会引发不适?

宗熙先生
2026-02-08 12:40:58
跳水队新春晚会,陈芋汐当主持人,谁注意全红婵回北京待遇改变

跳水队新春晚会,陈芋汐当主持人,谁注意全红婵回北京待遇改变

不冻港来了
2026-02-11 18:54:02
2026-02-13 04:39:00
硅星人 incentive-icons
硅星人
硅(Si)是创造未来的基础,欢迎来到这个星球。
2860文章数 10437关注度
往期回顾 全部

科技要闻

10倍速的一夜:三大模型春节前的暗战

头条要闻

钟南山:会用证据让全世界服气

头条要闻

钟南山:会用证据让全世界服气

体育要闻

31岁首次参加冬奥,10年前她是个水管工

娱乐要闻

《惊蛰无声》违规抢占排片遭影院控诉

财经要闻

“影子万科”如何掘金万科?

汽车要闻

开212 T01柴油版去穿越 连牧马人都跟不上

态度原创

时尚
艺术
旅游
教育
数码

50+女人怎么穿更好看?过来人告诉你答案,越老越美赢麻了

艺术要闻

震惊!罗布泊的模特竟然如此美艳动人!

旅游要闻

五大顶流萌团C位出道 上海全新文旅IP“海上萌主”春节亮相

教育要闻

中考数学,课本上消失的定理

数码要闻

英伟达App更新,搞定Optimus MUX显卡切换难题

无障碍浏览 进入关怀版