网易首页 > 网易号 > 正文 申请入驻

Koina:开源平台通过机器学习提升蛋白质组学数据分析效率

0
分享至



近几年来,蛋白质组学可谓是进入了「信息爆炸时代」。单次实验可能生成上百GB的高维数据,这给传统分析工具带来了巨大压力。

而机器学习,尤其是深度学习技术,本应成为加速分析的利器。但碍于数据整合、模型应用门槛等问题,机器学习结果往往缺乏直观的物理或生物学解释,所得结果并不能使研究者信服。

但随着德国慕尼黑工业大学(Technical University of Munich)与美国密西根大学(University of Michigan)等推出 Koina 平台,一个开源的、去中心化的、在线可访问的模型库之后,这一现状得到了改善。

相关的研究内容以「Koina: Democratizing machine learning for proteomics research」为题,于 2025 年 11 月 11 日发布在《Nature Communications》。



论文链接:https://www.nature.com/articles/s41467-025-64870-5

去中心化的机器学习平台

Koina是一个去中心化的机器学习模型平台,旨在帮助蛋白质组学研究人员快速应用、评估并共享机器学习模型。平台通过为研究人员提供开放式模型库和简单接口,解决了模型与数据间的兼容问题,极大降低了技术门槛。



图 1:Koina 的架构概述。

Koina 简化了新蛋白质组学机器学习模型的开发现过程,研究人员可以将自己训练的模型上传到平台,供全球学者访问、评估与使用。并且,该平台提供简单的 API 接口,帮助分析工具轻松集成机器学习模型。



图 2:Koina 可以轻松集成到第三方软件中。

此外,平台可以根据输入数据类型和任务目标,自动推荐最合适的机器学习模型,甚至提供简单的模型训练和调优功能。团队实现了一种启发式算法,这可以根据模型在数据子集的预测值与实验值之间的协议来选择模型。

优化的分析流程

为了应对不同模型支持的翻译后修饰(PTMs)和肽长度方面的差异等加剧的繁琐问题,团队标准化了所有模型之间的交互与输入格式。而输出部分,则予以保留,以便用户能够将他们的预测与原始来源进行核对。

这个共享接口封装了技术异构的模型集合及其相关的预处理和后处理步骤,以独立计算单元的形式,为最终用户抽象了不必要的细节,以「工作流」或「执行图」的形式呈现。



图 3:Prosit_2019_intensity和Prosit_2020_intensity_HCD模型的执行图。

后续的长期使用保持则采用 GitHub actions 的持续集成(CI)流程来支持。此外,Koina 支持同时托管不同版本的模型,这些设计选择促进了已发布模型的可重复性,促进了透明度和问责制,使其他研究人员能够更有信心地基于现有工作进行研究。

Koina 利用机器学习模型对已有数据进行训练,从而发现潜在的、复杂的肽段信息。在与 FragPipe 的结合使用中,它就提高了谱库的准确率与覆盖率。通过对比不同肽段的相似度,Koina 能自动纠正传统方法中的误识别。经过训练,它还能识别更多的低丰度肽段,平台实现了对肽段的高效检索,特别是在复杂的样本中。

让AI为生物学加速

Koina 的出现,意味着 AI 与生物学之间不再是「遥远的未来」,而是已经可以触及的现实。在这个平台的推动下,生物数据分析不再局限于传统实验,而是进入了一个可以迅速探索、验证、创新的新时代。

Koina 的方法完全独立于数据集的生物学或技术来源。该平台并非本质上局限于蛋白质组学,它可以轻松扩展到其他领域。通过邀请开发者参与 Koina,研究团队旨在营造一个协作环境,推动蛋白质组学机器学习的进步,最终惠及整个科学界。

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
为什么民众都不买房了?权威报告表明:比起贷款买房,租房每月立省40%!

为什么民众都不买房了?权威报告表明:比起贷款买房,租房每月立省40%!

回旋镖
2025-11-15 14:08:33
全美吵翻!女子假扮穷妈妈缺奶粉求救多家基督教会,屡遭拒绝后佛教和尚破戒帮了她!

全美吵翻!女子假扮穷妈妈缺奶粉求救多家基督教会,屡遭拒绝后佛教和尚破戒帮了她!

英国报姐
2025-11-15 21:40:17
一条狗命引发的人命争议:捅这么多刀,怎么对方还成了正当防卫?

一条狗命引发的人命争议:捅这么多刀,怎么对方还成了正当防卫?

七月生活情感驿站
2025-11-15 10:58:38
高市死不悔改,国防部上场,日本急忙灭火,官员恳请中国坐下谈

高市死不悔改,国防部上场,日本急忙灭火,官员恳请中国坐下谈

时时有聊
2025-11-14 20:35:36
金鸡奖六大不公平:易烊千玺没资格拿影帝,祖峰颁奖前被除名

金鸡奖六大不公平:易烊千玺没资格拿影帝,祖峰颁奖前被除名

光影新天地
2025-11-15 22:28:37
东莞一平台自曝出现挤兑,所签协议刻意遮掩“投资”属性

东莞一平台自曝出现挤兑,所签协议刻意遮掩“投资”属性

新浪财经
2025-11-13 20:35:37
钟嘉欣婚变风波升级!曝其签婚前协议被骗婚,狂接工作争抚养权

钟嘉欣婚变风波升级!曝其签婚前协议被骗婚,狂接工作争抚养权

萌神木木
2025-11-15 12:42:02
卓伟爆了一个新瓜!

卓伟爆了一个新瓜!

八卦疯叔
2025-11-15 10:16:28
高市早苗拒不撤回!中方突然改口,刚发出最后通牒,日敢插手就打

高市早苗拒不撤回!中方突然改口,刚发出最后通牒,日敢插手就打

混沌录
2025-11-14 18:50:50
盘点岛国业界10大步兵女神,哪一位是你心中的意难平?

盘点岛国业界10大步兵女神,哪一位是你心中的意难平?

素然追光
2025-11-16 00:40:03
王楚钦不敌樊振东止步半决赛,张继科点评引争议

王楚钦不敌樊振东止步半决赛,张继科点评引争议

老慃尾声体育解说
2025-11-15 20:11:08
全运会乒乓球:首个11:0诞生!王曼昱拒绝让球,樊振东3:1大逆转

全运会乒乓球:首个11:0诞生!王曼昱拒绝让球,樊振东3:1大逆转

国乒二三事
2025-11-15 07:51:35
一组关键词看日本首相高市早苗搞了什么事

一组关键词看日本首相高市早苗搞了什么事

环球网资讯
2025-11-15 20:57:18
10月经济数据全线走弱:投资、消费、出口“三驾马车”全失速

10月经济数据全线走弱:投资、消费、出口“三驾马车”全失速

知识圈
2025-11-15 16:21:51
突发!正式下课,西部倒数第一,2年战绩23胜71负,胜率24.4%

突发!正式下课,西部倒数第一,2年战绩23胜71负,胜率24.4%

球童无忌
2025-11-16 01:03:58
日本议员:受降的是中华民国,新中国没资格说话!网友:那更好了

日本议员:受降的是中华民国,新中国没资格说话!网友:那更好了

青青子衿
2025-11-15 15:51:35
中金:国内房价从2021年6月至今已下跌35%,但还未止跌

中金:国内房价从2021年6月至今已下跌35%,但还未止跌

知识圈
2025-11-15 14:38:45
川超太火爆!凉山卡马文加飞踹主裁,媒体人:不终身禁赛说不过去

川超太火爆!凉山卡马文加飞踹主裁,媒体人:不终身禁赛说不过去

奥拜尔
2025-11-15 19:31:12
郑丽文接受日媒专访倡导“一中保台”,反对大幅增加军费

郑丽文接受日媒专访倡导“一中保台”,反对大幅增加军费

海峡导报社
2025-11-15 08:03:07
孙颖莎击败朱雨玲,王曼昱击败陈梦,都没有太多悬念

孙颖莎击败朱雨玲,王曼昱击败陈梦,都没有太多悬念

子水体娱
2025-11-15 19:24:50
2025-11-16 07:07:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1151文章数 218关注度
往期回顾 全部

科技要闻

撕掉流量外衣,小米还剩什么?

头条要闻

大量日本民众围堵首相官邸 高喊:高市早苗下台

头条要闻

大量日本民众围堵首相官邸 高喊:高市早苗下台

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

钟嘉欣婚变风波升级!被骗婚?

财经要闻

小米之“惑”

汽车要闻

"冰彩沙"全配齐 红旗HS6 PHEV预售17.88万起

态度原创

本地
教育
时尚
亲子
公开课

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

教育要闻

南师附中又来一个校区?2026年中考招生格局或将巨变!

有品味的中年女人,穿衣都有4个共同点,看看你掌握了几个

亲子要闻

带走我的支架管!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版