网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Nature：科研人员最爱AI工具大盘点！从推理到编程，哪款才是最佳助手？

2025-03-25 09:01:16　来源: 新智元

北京举报

0

分享至

新智元报道

编辑：英智

【新智元导读】本文介绍了当前最受科研人员青睐的AI模型，推理出色的o3-mini、全能型DeepSeek-R1、科研常用的Llama、编程利器Claude 3.5 Sonnet和开源明星Olmo 2，它们各有优劣，为科研人员提供了多样选择。

几乎每周都有新的、令人影响深刻的AI工具发布，研究人员纷纷踊跃尝试。

从复杂的数学问题求解，到医学诊断中的精准分析，再到代码编写与论文创作，AI工具展现了巨大的潜力。

但市面上令人眼花缭乱的AI模型，究竟哪一款才是让科研工作者效率起飞的「梦中情模」，能助力科研突破，带来事半功倍的效果呢？

在这里，研究人员与《自然》杂志分享了他们当下最青睐的模型。

o3-mini：推理小能手

提到LLM，就不得不提OpenAI。2022年，OpenAI推出了聊天机器人ChatGPT。

科学家们主要将ChatGPT用于查找信息或作为写作助手，如起草摘要等。而在去年，OpenAI又发布了一系列更先进的模型，其中o3-mini就是一款非常出色的推理模型。

o3-mini是一款速度很快的推理模型，并且面向注册用户免费开放。它经过训练，会以逐步推理的方式回答问题。

这种「思维链」旨在模拟人类推理过程，帮它在科学和数学领域突破了严苛的基准测试。o3-mini擅长处理技术任务，如解决编程问题和重新格式化数据。

牛津大学数学家兼AI研究人员Simon Frieder表示，在解析陌生数学证明等任务上，o3-mini表现非常出色。

不过，他也提到，o3-mini仍然无法与数学家媲美。但不可否认的是，o3-mini为科研人员在处理一些复杂问题时提供了有力的帮助。

OpenAI近期还推出了「深度研究」功能，允许一些付费订阅用户从数百个网站上综合信息并添加引用，生成报告，进行文献综述。

旧金山初创公司FutureHouse的化学家兼AI专家Andrew White表示：「这些模型在组合使用时效果更佳。」

DeepSeek：全能「潜力股」

DeepSeek-R1也是一款备受瞩目的模型。它的能力与OpenAI的o1相当，但通过API使用的成本却低得多。这对于许多科研团队来说，是一个很有吸引力的优势。

DeepSeek-R1是开源权重模型，虽然其训练数据尚未公布，但任何人都可以下载基础模型，并根据自己的研究项目进行定制。

香港中文大学（深圳）的计算机科学家Benyou Wang等人正在开发可以在单机上运行或训练的版本，让更多学者能用到这个强大的模型。

和o1一样，DeepSeek-R1的强项是解决数学问题和编写代码。同时，它在提出假设等任务上也表现不错。这是因为DeepSeek选择公布模型的「思考过程」，使得研究人员能够更好地完善后续问题，提高模型的输出质量。

这种透明度在医学诊断领域也可能发挥巨大作用。Benyou Wang正在利用该模型的推理能力开展实验，致力于构建从患者评估到诊断和治疗建议的清晰路径。

然而，DeepSeek-R1也并非完美无缺。该模型的「思考过程」似乎特别长，这降低了它的运行速度，在查找信息或头脑风暴方面实用性欠佳。

与竞争对手相比，DeepSeek在防范模型生成有害内容方面所采取的措施似乎也较少。一些研究人员认为这种开源且功能强大的模型对于科研发展有着重要意义，而另一些人则对此持谨慎态度。

Llama：科研老伙计

Llama是Meta AI于2023年发布的一组开源权重模型，长期以来一直是科研界常用的LLM。仅通过开源科学平台Hugging Face，Llama各个版本下载量就已超过6亿次。

Llama之所以受到科研界的欢迎，很大程度上是因为它可以被下载并在此基础上进行开发。在处理受保护的数据时，能在个人或机构的服务器上运行至关重要，可以避免敏感信息反馈给其他用户或开发者。

研究人员基于Llama模型开发出了能预测材料晶体结构的大语言模型，还利用它来模拟量子计算机的输出结果。

北卡罗来纳大学教堂山分校的ML科学家Tianlong Chen表示，Llama很适合用于模拟量子计算机，因为相对容易对其进行调整，让它理解专业的量子语言。

不过，Llama也有一些小缺点。比如需要用户申请访问权限，这对一些人来说有点麻烦。

因此，其他开源模型，如西雅图Allen人工智能研究所开发的OLMo，以及阿里云开发的Qwen，现在常常成为科研中的首选。DeepSeek V3如今也是有力的竞争者。

Claude：编程利器

在硅谷，很多人对Claude 3.5 Sonnet的编程能力赞不绝口。

Claude 3.5 Sonnet由总部位于旧金山的AI公司Anthropic开发，它不仅可以编写代码，还能解读图表等视觉信息。此外，它还有一种模式，允许其远程操作用户的计算机。

Claude的写作风格也备受赞誉。一些LLM（如ChatGPT）在去除技术语言时，可能也会误删关键信息。而Claude在润色文本的同时，更擅长保留原意。

因此，在撰写科研基金申请或为代码添加解释性注释时，Claude可能是更好的选择。

在一项基于数据驱动的科学任务的基准测试中，Claude 3.5 Sonnet在编程挑战方面表现出色，这些任务的数据取自生物信息学和计算化学等领域的真实论文。

虽然Claude 3.5 Sonnet作为在线聊天机器人可以免费使用，但和OpenAI的模型一样，研究人员只能通过付费API，才能实现完整集成。

随着更便宜的开源模型越来越强大，人们可能会更倾向于使用开源模型。

Olmo：开源新星

对于想要深入了解内部运行机制的研究人员来说，Olmo 2是一个非常不错的选择。

Olmo 2是目前性能最出色的开源模型之一，它还附带算法的训练数据，以及用于训练和评估模型的代码。

研究Olmo 2这样的模型能让研究人员将偏差来源追溯到训练数据上，同时通过更好地理解算法如何得出输出结果，来提高效率。

目前，开源模型的门槛是需要一定的专业知识才能运行，但随着免费实践课程的增加，进入门槛正在逐渐降低。

如果法院判定使用受版权保护的内容来训练模型属于违法行为，那么像Olmo 2这样基于允许重复使用和修改的数据集所训练的模型，可能是唯一可以安全使用的模型。

参考资料：

https://www.nature.com/articles/d41586-025-00437-0

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

见证英格兰队被宿敌淘汰贝克汉姆抱头痛哭：令人心碎

红星新闻 2026-07-16 10:49:06
6466 跟贴 6466
欧盟发布涉华文件措辞被指系针对中方最激烈官方批评

澎湃新闻 2026-07-16 21:33:19
10204 跟贴 10204

英媒披露贝林厄姆动手原因：巴尔科赛后"挑衅"图赫尔

红星新闻 2026-07-16 15:11:33
8425 跟贴 8425

全国28城海水浴场9地水质评级为"差" 涉及温州

澎湃新闻 2026-07-15 20:24:27
251 跟贴 251
国航确认：涉事飞机落地出现异常

南方都市报 2026-07-16 21:27:00
14 跟贴 14

深一度｜从倒霉蛋到绝杀福将，劳塔罗——永远拼尽全力的人

澎湃新闻 2026-07-16 12:40:28
620 跟贴 620

男子在广东搭高铁背包被错拿，包里装有价值500万元现金，工作人员1小时紧急寻回

大风新闻 2026-07-16 18:52:42
179 跟贴 179
美国皮尤最新民调结果：中国全球好感度超美国

环球网资讯 2026-07-16 18:01:11
1684 跟贴 1684

七次流拍，西安“双子塔”等不到接盘者

每日经济新闻 2026-07-16 15:58:13
561 跟贴 561
海关总署：在全球高温多发的情况下，我国空调、电扇、冰箱等“清凉”家电合计出口了1079.1亿元，为全球消费者送去了阵阵“清凉”

政知新媒体 2026-07-14 13:41:53
1827 跟贴 1827
曾经的“快乐水”卖不动了？超市老板：往年夏天卖断货的碳酸饮料今年送都送不出去

闪电新闻 2026-07-16 22:38:12
146 跟贴 146
福建将开展安全隐患大排查大整治行动

极目新闻 2026-07-16 22:50:40
3 跟贴 3
突然宣布退出国内市场！网友：啊？我才买的

扬子晚报 2026-07-16 22:10:21
318 跟贴 318
二季度GDP增长4.3%，怎么看？

澎湃新闻 2026-07-16 07:18:04
958 跟贴 958
巴黎多处知名景点：缩短开放时间；有中国游客透露：高温影响行程，改成瞎溜达

南方都市报 2026-07-14 20:05:15
1866 跟贴 1866
严格落实带薪休假！国家明确：修订《职工带薪年休假条例》

大象新闻 2026-07-16 16:58:06
245 跟贴 245
月薪6万！001号老君山云海观察员，定了！

极目新闻 2026-07-16 11:19:48
83 跟贴 83
佛得角的含金量，还在上升！

大象新闻 2026-07-16 15:06:16
133 跟贴 133
多家公司宣布：下周一，放假

南方都市报 2026-07-16 21:41:47
53 跟贴 53
日经225指数期货开盘跌1.4%

每日经济新闻 2026-07-16 07:38:04
24 跟贴 24

大爱中国！南美名宿现场支持阿根廷：曾立志要成为国足主帅

大爱中国！南美名宿现场支持阿根廷：曾立志要成为国足主帅

邱泽云

2026-07-16 19:25:31

阿根廷已赢得三座大力神杯，若再夺冠将超越德国独占历史最多

阿根廷已赢得三座大力神杯，若再夺冠将超越德国独占历史最多

懂球帝

2026-07-16 07:39:09

大丑闻！教练性骚扰球员，事关仲慧球队

大丑闻！教练性骚扰球员，事关仲慧球队

跑者排球视角

2026-07-16 23:55:29

万斯抨击以色列：非常隐秘、资金极其雄厚……名副其实的外国影响力，旨在破坏美伊协议

万斯抨击以色列：非常隐秘、资金极其雄厚……名副其实的外国影响力，旨在破坏美伊协议

红星新闻

2026-07-16 12:22:22

西方专家怀疑：格雷厄姆抵华盛顿时已是尸体，基辅时已死亡

西方专家怀疑：格雷厄姆抵华盛顿时已是尸体，基辅时已死亡

地球记

2026-07-16 19:33:02

又一名《西游记》演员离世：演员史崇仁病逝，享年95岁

又一名《西游记》演员离世：演员史崇仁病逝，享年95岁

大象新闻

2026-07-16 21:46:16

拒绝1.7亿肥约，23岁小将真飘了，场均10+8，却不给顶薪就离队

拒绝1.7亿肥约，23岁小将真飘了，场均10+8，却不给顶薪就离队

大西体育

2026-07-16 17:09:20

阿根廷逆转英格兰劳塔罗：我梦到过那个绝杀球

阿根廷逆转英格兰劳塔罗：我梦到过那个绝杀球

新华社

2026-07-16 06:58:13

英媒曾爆料：法航母在南海追中国潜艇，结果碰上中国40艘军舰懵了

英媒曾爆料：法航母在南海追中国潜艇，结果碰上中国40艘军舰懵了

流史岁月

2026-07-15 14:30:10

发现中国有一个奇怪社会现象：父母不在人世间了，什么舅舅姑姑表兄弟，还有一些八竿子打不着的亲属，基本上就形同陌路，不再相互往来

发现中国有一个奇怪社会现象：父母不在人世间了，什么舅舅姑姑表兄弟，还有一些八竿子打不着的亲属，基本上就形同陌路，不再相互往来

背包旅行

2026-07-13 15:12:59

“穷人才会这样过生日！”19岁男生廉价礼物，让父母看清了现实

“穷人才会这样过生日！”19岁男生廉价礼物，让父母看清了现实

熙熙说教

2026-07-16 19:09:49

风向变了！北京房东不卖了改“下蛋”了！280万存银行不如留着收租

风向变了！北京房东不卖了改“下蛋”了！280万存银行不如留着收租

童童聊娱乐啊

2026-07-16 18:54:39

皮尤最新调查：中国全球好感度超美国，说明什么？

皮尤最新调查：中国全球好感度超美国，说明什么？

环球网资讯

2026-07-16 18:01:11

美军突然在南海增派军力！日本外长喊话中国，希望中国给个面子

美军突然在南海增派军力！日本外长喊话中国，希望中国给个面子

比利

2026-07-17 03:28:52

泽连斯基半年换将：乌克兰"无人机防长"费多罗夫被免职

泽连斯基半年换将：乌克兰"无人机防长"费多罗夫被免职

互联网大观

2026-07-16 09:21:30

第一集就全裸出镜，这三部新剧大胆又刺激

第一集就全裸出镜，这三部新剧大胆又刺激

来看美剧

2026-07-16 21:24:49

网红洗发皂暴雷！用了掉发更严重，成本仅1.5元，全是营销骗局

网红洗发皂暴雷！用了掉发更严重，成本仅1.5元，全是营销骗局

小嵩

2026-07-16 05:11:54

冉莹颖你放过邹市明吧，直播间满脸麻木毫无神采，他根本不爱带货

冉莹颖你放过邹市明吧，直播间满脸麻木毫无神采，他根本不爱带货

南万说娱26

2026-07-16 10:27:48

哈兰德不结婚怕分家产？挪威法律：结婚才更危险

哈兰德不结婚怕分家产？挪威法律：结婚才更危险

华庭讲美食

2026-07-16 14:38:28

张小斐曝《女足》庆功宴剧组全到，却唯独缺周星驰，原因超搞笑

张小斐曝《女足》庆功宴剧组全到，却唯独缺周星驰，原因超搞笑

仙味少女心

2026-07-16 01:55:33

AI产业主平台领航智能+时代

15707文章数 66959关注度

往期回顾全部

科技要闻

苹果AI终于要来了：还能追上华为豆包们吗

头条要闻

扎波罗热核电站总工遭袭身亡被指或改变俄乌冲突性质

头条要闻

扎波罗热核电站总工遭袭身亡被指或改变俄乌冲突性质

体育要闻

逆天6后卫神阵，图赫尔活活坑死英格兰

娱乐要闻

天下无不散宴席！白鹿官宣告别欢娱

财经要闻

韩国股市暴涨暴跌借钱炒股的散户快疯了

汽车要闻

小鹏MONA L03上市为什么选在慕尼黑？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

游戏

时尚

艺术

旅游

教育

PS6最全爆料：2027年底性能约PS5三倍还有掌机

放暑假的中学生，挤满医院整形科

艺术要闻

诡异清宫古画：窗后偷看的男人，看见了惊悚真相

旅游要闻

怒江边上宝藏地，四月傣寨泼水，腊月傈僳过新年，四季皆有看点！

教育要闻

最新！多所在京院校公布提前录取分数线

© 1997-2026 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版