网易首页 > 网易号 > 正文 申请入驻

ChemLLM化学大模型开源,wisemodel社区在线体验,助力化学研究

0
分享至

始智AI wisemodel.cn开源社区

始智AI wisemodel.cn社区将打造成huggingface之外最活跃的中立开放的AI开源社区。欢迎《》以及《》。

01

ChemLLM介绍

ChemLLM系列模型是由上海人工智能实验室开发的首个兼备推理、对话等通用能力和化学专业能力的开源大模型。相比于现有的其他大模型,ChemLLM对化学空间进行了有效建模,在产物预测、名称转化和化学性质预测等核心化学任务上表现优异。ChemLLM系列模型已经发布到了始智AI wisemodel.cn开源社区,并且无需任何代码,两步即可完成模型的在线体验。

上海 AI lab 化学大模型团队基于自建ChemData化学专业数据集,在本年初发布的浦科·化学基础上,更新发布了ChemLLM-1.5化学大模型,并在新构建的ChemBench测评数据集上进行了全面的测评。更新后,ChemLLM在核心化学任务上的效果与GPT-4相当,而在通用任务上与尺寸相近的语言模型难分伯仲,欢迎到wisemodel开源社区进行在线体验。

02

科学大语言模型的机遇与挑战

大型语言模型已在图像处理、文字识别、视频制作等多个领域展现出卓越的能力,并已成功应用于化学研究,为科学研究和生产提供支持。目前的研究主要依赖于大型语言模型调用专业化学工具来解决具体的化学问题。然而,直接将化学知识集成到语言模型中,仍然存在以下挑战:

1. 结构化数据的限制: 大多数化学信息和知识存储在结构化数据库中,直接使用这些数据训练LLM可能会损害模型处理自然语言的能力,使得模型的对话和逻辑推理能力发生退化;

2. 特殊的化学信息学表示: 化学信息学中,分子用特殊符号表示,如SMILES。这类数据往往不符合自然语言的规范,因此常规的语言模型难以正确理解和生成这种符号;

3. 化学数据和任务的多样性: 化学数据和任务种类繁多,设计一个灵活并能泛化到多种化学任务上的训练流程十分困难。

03

ChemLLM的技术核心

为解决上述困难,研究人员创造性地采用两阶段指令微调框架对模型进行训练。第一阶段中,研究人员使用开源的Multi-Corpus通用语料数据集进行指令微调,赋予InternLM2-base的基座模型以通用语言能力;第二阶段中,研究人员将构造的ChemData专业数据集与部分通用语料数据集混合对模型进行二次指令微调,在保有模型通用语言、推理能力不受损害的前提下,注入化学知识。

经过两个阶段的训练,模型的通用能力被激发并保留,同时ChemLLM有效地建模了化学空间,具有解决复杂的化学问题的潜力。

04

ChemLLM能力测评

研究人员运用构建的ChemBench测评数据集,在基于文本的分子生成、名称转换、性质预测、温度预测、分子描述、产率预测、溶剂预测、逆合成分析、产物预测共九大专业化学任务上测试了ChemLLM。同时选取了LLaMA2-7B、Mistral-7B、ChatGLM3-6B、Owen-7B、InterLM2-chat-7B,共五个规模相近的语言大模型,和超大通用语言模型GPT-3.5和GPT-4,与ChemLLM进行了比较。

在所有九个化学任务中,ChemLLM显著地超越了五个同规模大模型和通用超大模型GPT-3.5,在基于文本的分子生成、名称转换、性质预测、温度预测、产率预测、逆合成分析六个任务上能够媲美于GPT-4,证明了ChemLLM对化学空间的有效学习。

研究人员也采集并开源了中高考化学测试数据集,连同其他三个公开通用评测数据集上一起,对上述大模型进行了通用知识评测。这四个数据集的测试内容包括中英文多学科认知性知识测试、数学推理能力测试、基础化学能力等,全面考察模型的综合认知和逻辑推理。结果证明,ChemLLM的通用能力达到主流大语言模型水平。

05

在线体验

1

创建在线体验

用户登录之后,点击“模型详情”页面的“在线体验”按钮,用户也可以在“体验”空间页面点击“新建体验”按钮后选择相应的模型镜像进行部署和体验。

2

填写体验基本信息

在部署模型弹窗中填写体验中英文名称和设置相应属性以及选择好镜像和硬件部署,然后直接点击“下一步”按钮。(注:暂时平台上只有A5000-24G的GPU卡可用)

3

确认计费方式

选择相应的计费方式,支持按量计费、包周和包月的方式,直接点击“提交订单”即可完成模型部署。按量计费的方式用户可以选择自动停止的时间,也可以到“用户中心-我的资源-体验”手动停止。

4

创建完成,开始试用

下面点击创建好的服务,就可以进行在线体验了:

06

AI4Chem组织地址:

https://wisemodel.cn/organization/AI4Chem

模型下载:

https://wisemodel.cn/models/AI4Chem/ChemLLM-7B-Chat

https://wisemodel.cn/models/AI4Chem/ChemLLM-7B-DPO

https://wisemodel.cn/models/AI4Chem/ChemLLM-7B

编辑:赵鑫雅

审核:成蕴年

----- END -----

wisemodel相关

系统升级

系列模型:

关于wisemodel更多信息

1

欢迎持续关注和支持

开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态,

2

欢迎加盟wisemodel开源社区

始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn

3

欢迎投稿优质内容

欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。

4

关于wisemodel开源社区

始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。

向上滑动查看更多

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
三星堆又“逆天”了!挖出的竟不是地球之物,考古队曝出更多猛料

三星堆又“逆天”了!挖出的竟不是地球之物,考古队曝出更多猛料

凡知
2026-05-12 10:47:04
杜萍萍的摊位将永久保留,免除租金!百位武汉摊友喊话:等你回来

杜萍萍的摊位将永久保留,免除租金!百位武汉摊友喊话:等你回来

观察鉴娱
2026-05-11 14:35:39
4只皮皮虾1035元,官方回应是否“带客吃回扣”

4只皮皮虾1035元,官方回应是否“带客吃回扣”

中国新闻周刊
2026-05-09 19:38:06
原本只是想压价,舆论让央视进退两难!不买版权或造成更大损失

原本只是想压价,舆论让央视进退两难!不买版权或造成更大损失

中国足球的那些事儿
2026-05-09 17:34:11
广州一工地吊臂折断 砸向刚建成的幼儿园

广州一工地吊臂折断 砸向刚建成的幼儿园

新快报新闻
2026-05-12 11:24:08
汪小菲带儿女去公园散心!玥儿双手叉腰站最后,马筱梅消瘦不少

汪小菲带儿女去公园散心!玥儿双手叉腰站最后,马筱梅消瘦不少

凛若秋霜
2026-05-12 06:41:55
人社部最新动态,2026年养老金有好消息,企退人员补发700元难吗

人社部最新动态,2026年养老金有好消息,企退人员补发700元难吗

浪子阿邴聊体育
2026-05-11 12:25:59
赵心童入选名人堂遭澳洲第一人怒批!罗伯逊:这简直非常荒谬!

赵心童入选名人堂遭澳洲第一人怒批!罗伯逊:这简直非常荒谬!

世界体坛观察家
2026-05-12 07:03:59
水在4℃时密度最大?这个反常识物理Bug,差点决定地球生命的命运

水在4℃时密度最大?这个反常识物理Bug,差点决定地球生命的命运

半解智士
2026-05-05 12:56:18
韩国明星河智苑在杭州西湖无名无牌无人认,真正顶流的生存之道

韩国明星河智苑在杭州西湖无名无牌无人认,真正顶流的生存之道

小邵说剧
2026-05-12 08:25:28
现实版《环太平洋》?宇树科技发布载人变形机甲,企业回应:参考价390万元,能量产

现实版《环太平洋》?宇树科技发布载人变形机甲,企业回应:参考价390万元,能量产

上游新闻
2026-05-12 16:46:07
俄罗斯奥伦堡州一高层住宅楼遭乌军无人机撞击

俄罗斯奥伦堡州一高层住宅楼遭乌军无人机撞击

财联社
2026-05-12 18:52:20
他接受纪律审查和监察调查

他接受纪律审查和监察调查

锡望
2026-05-11 21:56:44
40集谍战大剧来袭!于和伟、王丽坤领衔主演,谍战剧天花板!

40集谍战大剧来袭!于和伟、王丽坤领衔主演,谍战剧天花板!

乐枫电影
2026-05-12 14:19:04
40亿索赔压顶!国际足联高管访华,中方5亿赞助或将血本无归?

40亿索赔压顶!国际足联高管访华,中方5亿赞助或将血本无归?

云舟史策
2026-05-12 07:17:15
利雅得胜利vs利雅得新月前瞻:胜利赢球就夺冠 C罗PK本泽马

利雅得胜利vs利雅得新月前瞻:胜利赢球就夺冠 C罗PK本泽马

智道足球
2026-05-12 14:57:30
一个冰冷现实:中印冲突正全方位升级,中国越避让,印度越对抗

一个冰冷现实:中印冲突正全方位升级,中国越避让,印度越对抗

时光漫游志
2026-05-12 06:09:49
特朗普时隔9年再访华,随行商界大佬都有谁?库克、马斯克在列

特朗普时隔9年再访华,随行商界大佬都有谁?库克、马斯克在列

上游新闻
2026-05-12 12:50:37
土媒:托雷拉撤回离队决定,希望加拉塔萨雷涨薪至500万欧元

土媒:托雷拉撤回离队决定,希望加拉塔萨雷涨薪至500万欧元

懂球帝
2026-05-12 18:11:26
不忍了!小玥儿账号风波不到24小时,汪小菲的一个举动,全网盛赞

不忍了!小玥儿账号风波不到24小时,汪小菲的一个举动,全网盛赞

乡野小珥
2026-05-12 11:15:42
2026-05-12 19:32:49
wisemodel开源社区 incentive-icons
wisemodel开源社区
始智AI wisemodel.cn开源社区,打造中国版“huggingface”
477文章数 16关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

为见女儿最后一面老人第一次坐高铁 买不到票求助特警

头条要闻

为见女儿最后一面老人第一次坐高铁 买不到票求助特警

体育要闻

总是掉链子的“倒霉蛋”,闯进了欧战决赛

娱乐要闻

刘涛晒妈祖诞辰活动照 评论区变许愿池

财经要闻

黄仁勋真是被白宫彻底封杀了

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

艺术
时尚
旅游
本地
公开课

艺术要闻

这位画家的油画美人让人惊叹不已!

征集|| 她们也太会买裙子了!边看边种草

旅游要闻

记者手记|杜尚别,再见却是初见

本地新闻

用苏绣的方式,打开江西婺源

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版