完全戳中了学生党的痛点,github星标直达6.4k。
![]()
academic-research-skills
项目名叫academic-research-skills(以下简称ARS),是一套Claude Code技能包。
只需两行命令安装,直接一条龙串起整套学术研究流水线。
![]()
academic-research-skills
只能说,我读研的时候怎么没碰到这种好东西呢…
![]()
示意图
ARS的核心架构由4个skill组成,它们各司其职,拼在一起就是一条从选题到交稿的完整链路。
我这里还做了图,大家可以看得比较直观:
![]()
Deep Research是一支13个Agent的研究团队。
有苏格拉底导师Agent,通过对话引导研究者理清思路。
还有魔鬼代言人Agent,专门挑刺,防止研究者在早期就陷入思维定式。
![]()
Academic Paper是一支12个Agent的写作团队。
从大纲设计、论证构建、草稿撰写,到双语摘要生成、图表可视化、引用格式转换,全流程覆盖。
特别值得一提的是风格校准功能,AI会学习你过往作品的写作风格,让输出更像你自己写的,而不是千篇一律的AI味。
输出格式支持Markdown、DOCX、LaTeX,最终可以编译成APA 7.0或IEEE格式的PDF。
![]()
Academic Paper Reviewer是一支7个Agent的审稿团队。
模拟真实学术期刊的评审流程,由主编EIC带领三位领域审稿人,再加上一个魔鬼代言人,从方法论、学科视角、跨学科价值等多个维度打分。
评分采用0到100的量化标准,80分以上接受,65到79小修,50到64大修,50以下拒稿。
![]()
Academic Pipeline是流程编排器,把前面三个团队串联成一条10阶段的流水线。
从研究、写作、完整性检查、同行评审、修订、最终检查,到发表准备和流程总结,每个阶段都有明确的产物和检查点。
你可以在任意阶段插入,比如已经有了初稿,就从Stage 2.5的完整性检查开始;收到了审稿意见,直接从Stage 4的修订切入。
![]()
用Claude Code做学术研究的开源项目已经很多了,但是深扒之后,我发现ARS在底层设计上还是有些过人之处。
可以简单总结为一句话:系统性防止AI搞砸学术研究。
第一,引用核验。
不是简单查一下标题对不对,而是用Levenshtein相似度算法做模糊匹配,阈值设在0.70以上才算通过。
![]()
第二,完整性闸门。
在流水线的Stage 2.5和Stage 4.5,有两道不可跳过的完整性闸门,会运行一份7项AI失败模式检查清单。
这份清单直接来自2026年Nature上发表的一项全自主AI科研研究,其中总结了7种翻车模式,覆盖引用幻觉、数据捏造、方法论造假等情形。
![]()
7种翻车模式
任何在2.5被标记为SUSPECTED的问题,必须在4.5变成CLEAR,或者由人工手动覆盖并留下记录。
设计逻辑是:把「我相信AI不会出错」变成「我要求AI证明它没出错」。
第三,反谄媚协议,让AI敢于说不。
大多数AI工具都有一个隐形毛病,讨好用户。你让它改,它就改,哪怕改得更差。
所以ARS在审稿环节专门设计了反谄媚机制。
审稿团队里有一个Devil’s Advocate,也就是魔鬼代言人,职责是挑刺。
但挑完刺之后,还有一个让步阈值协议。
DA的反驳会被评分1到5,如果低于4分,写作团队不允许承认。
![]()
换句话说,AI不能为了显得好合作就轻易让步。
评分轨迹也会被追踪,任何维度的分数下降都会被标记为回归。
这和软件工程里的不引入新Bug原则一样,改一个地方不能搞砸另一个地方。
第四,三层数据隔离,不让AI偷看答案。
ARS把数据流严格分成三层:
Layer 1是原始输入,默认不可信,可能幻觉、过时、带偏见。
Layer 2是通过完整性验证后的产物。
具体实现上,写作团队和审稿团队分两次独立调用,中间有阶段边界隔离。
写作AI只能收到审稿AI的自然语言反馈,比如「第二章论证跳跃,建议补充对比实验」。
但它看不到原始的评分标准,也不知道每个维度占多少分。
这个设计的灵感来自于Anthropic今年的w2s-researcher研究,其中也用了同样的三层隔离模型。
结论是当AI能读取标签数据时,结果可能不是真的泛化,而是在优化表面特征。
解决方案不是更好的提示词,而是结构上的隔离。
![]()
![]()
这也是我觉得目前学术研究AI工具的关键所在——
ARS的设计哲学,可以总结为README里那句话:
「AI是你的副驾驶,不是飞行员。」
安装方式很简单,如果你已经在用Claude Code,只需要两行命令:
验证安装是否成功,运行:
如果你偏好单条命令测试,也可以用:
不过最简单的安装办法,其实是直接把SKILL.md上传到claude.ai项目知识库。
不需要安装Claude Code,打开浏览器就能用。
不过要注意,这种方式不支持多Agent并行,功能上是单Agent版本,适合轻度体验;想跑完整流水线还是需要Claude Code。
那么,又到了大家最关心的,要花多少钱的环节。
完整跑完10个阶段,单次可消耗超过20万输入token和10万输出token,单独使用某个子模块则少得多。
Max订阅计划分两档,每月100刀或200刀,相当不便宜。
但如果你的科研经费可以报销的话,那…
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.