网易首页 > 网易号 > 正文 申请入驻

百亿级人类基因组基础模型发布

0
分享至

本报电(华轩)近日,在第二十届国际基因组学大会上,华大生命科学研究院与之江实验室联合发布了百亿参数人类基因组通用基础模型——Genos。这一针对人类基因组深度优化的基因组基础模型,可支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

Genos的推出标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑,有望促进临床疾病诊断、个人基因组解读及前沿科学研究。

要读懂“生命之书”,首先需要一本完整的“字典”

基因组学领域内的现有模型大多基于一到两个参考基因组进行训练,难以捕捉人类丰富的遗传多样性。而Genos则系统整合了人类泛基因组参考联盟、人类基因组结构变异图谱计划等多个公开资源,汇聚了全球范围内636个“端粒到端粒”级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,旨在从源头减少数据偏见,更全面地代表人类遗传多样性。

基因组的语言极其复杂,一个微小的单碱基突变,其影响可能由百万碱基之外的“遥远”调控元件决定。这要求模型既要有“显微镜”般的单碱基精度,又要有“广角镜”般的百万级超长上下文理解能力。

如同阅读一部鸿篇巨著,既能一字不差地记住细节,又能洞悉全局的宏大叙事。Genos通过混合专家(MoE)架构,助力解决这一难题。MoE架构如同一个拥有众多顶尖专家的智慧团队,面对任务时,总能精准调度最相关的几位专家协同处理,而不是调动所有人全部待命。这一“按需激活”的机制,让Genos在拥有百亿级参数的庞大知识总量的同时,推理成本和资源消耗却远低于同等规模的模型,真正实现了“既强大,又好用”。

为了全面验证模型的性能,研发团队进行了一系列测试。在基因组元件识别、远程调控预测、突变致病性预测等经典评测任务里,Genos在超过一半的任务里比所有现有模型都表现更好,而且长序列评测任务里,如突变热点识别和族群分类上,Genos的表现远超同类模型,展现了其强大的上下文分析能力,有效破译基因组中的“暗物质”。

Genos在直接面向临床应用的致病性突变解读任务中,实现了较高的准确性,当结合021科学基础模型后,准确率更高,为临床诊断提供了全新的高效工具。综合多项评测结果,Genos在各项核心任务中的表现优越,证明了其全面的能力。

“共有、共为、共享”,让前沿科技触手可及

一个模型无论多么强大,如果不能被方便地部署和使用,其价值便大打折扣。Genos是一个可以走向临床、走向个人、走向每一个实验室的“实践先锋”,为下游应用创新提供了坚实的地基。

今年是人类基因组草图绘制完成25周年。“共有、共为、共享”,既是人类基因组计划的精神传承,也是Genos的核心理念。

发布会上,华大生命科学研究院宣布,Genos模型将全面开源开放,且同时提供12亿和100亿参数两个版本,满足不同应用场景的需求。目前,两个版本的模型权重、架构细节与完整训练流程,均已在GitHub、Hugging Face、魔搭等平台公开发布,供全球开发者和科研人员自由使用。同时,在之江实验室的开放平台Zero2X也已发布。

另外,考虑到并非所有使用者都拥有强大的算力资源,该模型已被深度整合进DCS Cloud云平台。用户无需进行复杂的安装配置,即可一键调用Genos,平台为每个账户提供了高达10万次的免费推理服务,极大地降低了基因组智能分析的门槛。

目前,在科研领域,Genos模型通过与DCS cloud结合,能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月才能完成的生物信息分析流程极大提速。此外,Genos模型也已整合进生命科学数据库CNGBdb,可帮助用户精准预测细胞表达量,高效筛选和验证关键候选基因,大幅加速科研发现。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
特朗普抢委原油救急,结果欧洲不要、中国不买,油要在海上生锈?

特朗普抢委原油救急,结果欧洲不要、中国不买,油要在海上生锈?

星辰夜语
2026-01-12 19:26:25
特朗普发图自称委内瑞拉代总统

特朗普发图自称委内瑞拉代总统

界面新闻
2026-01-12 11:13:10
天津2026年的第一场雪要来了?最新预报来了...

天津2026年的第一场雪要来了?最新预报来了...

全接触狐狐
2026-01-13 08:00:06
1980年,王光美拿过追悼会名单,狠狠划掉几人,却添上个正在挨整的将军:他对咱家有恩

1980年,王光美拿过追悼会名单,狠狠划掉几人,却添上个正在挨整的将军:他对咱家有恩

源溯历史
2026-01-07 19:28:08
51岁迪拜前王妃哈雅现身,又老又胖,女儿逃离王室后面相也变了

51岁迪拜前王妃哈雅现身,又老又胖,女儿逃离王室后面相也变了

笑傲春秋
2026-01-12 15:19:36
61岁大爷,前脚还在菜市场挑红薯,后脚就把这“粗粮”塞入肛门

61岁大爷,前脚还在菜市场挑红薯,后脚就把这“粗粮”塞入肛门

医脉圈
2026-01-12 20:52:35
不到24小时,美军不宣而战!近百炸弹被投下,626次空袭惹恼全球

不到24小时,美军不宣而战!近百炸弹被投下,626次空袭惹恼全球

快看张同学
2026-01-12 16:24:13
合川杀猪饭后续:女子命运改变,名不符实根本不呆,网友仙人指路

合川杀猪饭后续:女子命运改变,名不符实根本不呆,网友仙人指路

呼呼历史论
2026-01-12 12:31:28
23岁女导演坠亡之殇|逝前疑遭暴力,嫌犯印度籍系创作伙伴

23岁女导演坠亡之殇|逝前疑遭暴力,嫌犯印度籍系创作伙伴

文娱春秋Plus
2026-01-12 09:50:58
40岁C罗苦笑划手指:榜首战遭逆转 3连败+落后7分 连场被门将坑惨

40岁C罗苦笑划手指:榜首战遭逆转 3连败+落后7分 连场被门将坑惨

我爱英超
2026-01-13 06:13:16
硅谷教父马克·安德森2026开年访谈:AI革命才刚开始,智能的价格正在崩塌

硅谷教父马克·安德森2026开年访谈:AI革命才刚开始,智能的价格正在崩塌

硅星人
2026-01-12 09:58:07
攻克柏林后,斯大林不要黄金,却给苏联拉回3000列德国工业设备

攻克柏林后,斯大林不要黄金,却给苏联拉回3000列德国工业设备

饭小妹说历史
2026-01-13 09:04:22
中国赚钱美国花?老戏骨祖孙三代在美奢华享乐过上“人上人”生活

中国赚钱美国花?老戏骨祖孙三代在美奢华享乐过上“人上人”生活

古事寻踪记
2026-01-08 07:10:52
赫鲁晓夫政变全过程!朱可夫在会议上掏出手枪,当众扣押贝利亚

赫鲁晓夫政变全过程!朱可夫在会议上掏出手枪,当众扣押贝利亚

老脸科普君
2025-12-29 18:44:30
闫学晶:中国没有穷人,穷就是懒,农民种地一年都有二十万收入

闫学晶:中国没有穷人,穷就是懒,农民种地一年都有二十万收入

小娱乐悠悠
2026-01-09 11:18:41
4年后重返大师赛,赵心童创3纪录!冲伟大成就,下轮复仇希金斯?

4年后重返大师赛,赵心童创3纪录!冲伟大成就,下轮复仇希金斯?

刘姚尧的文字城堡
2026-01-13 07:10:28
碎三观!网传江阴某4S店女销售出轨客户四年,亲妈帮着出馊主意…

碎三观!网传江阴某4S店女销售出轨客户四年,亲妈帮着出馊主意…

火山诗话
2026-01-12 13:36:30
隐婚生子真相大白4个月,43岁房祖名真实现状曝光,成龙没说谎

隐婚生子真相大白4个月,43岁房祖名真实现状曝光,成龙没说谎

揽星河的笔记
2025-12-29 20:12:01
内马尔:梅西可能会来巴西观看国王联赛世界杯

内马尔:梅西可能会来巴西观看国王联赛世界杯

懂球帝
2026-01-13 10:33:16
三年3次换帅,魅族正耗尽吉利的耐心

三年3次换帅,魅族正耗尽吉利的耐心

螳螂观察
2026-01-12 18:47:57
2026-01-13 10:47:00
金台资讯 incentive-icons
金台资讯
报道全球 传播中国 人民网股份有限公司
1495856文章数 201002关注度
往期回顾 全部

科技要闻

每年10亿美元!谷歌大模型注入Siri

头条要闻

媒体:巴基斯坦靠歼-10一鸣惊人后 北约成员国求保护

头条要闻

媒体:巴基斯坦靠歼-10一鸣惊人后 北约成员国求保护

体育要闻

一场安东尼奥式胜利,给中国足球带来惊喜

娱乐要闻

周杰伦以球员身份参加澳网,C位海报公开

财经要闻

中国一口气申报20万颗卫星,意味着什么?

汽车要闻

吉利持续加码亿咖通 智能化海外布局提速

态度原创

家居
艺术
房产
本地
时尚

家居要闻

现代简逸 寻找生活的光

艺术要闻

书法争议再起:拙与妍孰优孰劣引发热议

房产要闻

重磅调规!417亩商改住+教育地块!海口西海岸又要爆发!

本地新闻

云游内蒙|“包”你再来?一座在硬核里酿出诗意的城

走过那个夏天,甜茶终于站上金球奖之巅

无障碍浏览 进入关怀版