IBM和Moderna的研究人员成功地使用量子模拟算法预测了长达60个核苷酸的mRNA序列的复杂二级蛋白质结构,这是在量子计算机上模拟的最长序列。
信使核糖核酸(mRNA)是一种将遗传信息从DNA传递到核糖体的分子。它指导细胞内的蛋白质合成,并用于创建有效的疫苗,能够引发特定的免疫反应。
大家普遍认为,蛋白质采用正确的三维构象所需的所有信息都由其氨基酸序列或“折叠”提供。
尽管mRNA只由一条链组成,但它具有由一系列折叠构成的二级蛋白质结构,这些折叠形成了特定分子的三维形状。每增加一个核苷酸,可能的折叠排列数量就会呈指数级增加。这使得在更高的规模上预测mRNA分子会呈现出什么形状的挑战变得非常困难。
IBM 和 Moderna 的实验在一项研究中进行了概述,该研究首次发表于 2024 年 IEEE 国际量子计算与工程会议,展示了量子计算如何提升传统的预测方法。传统上,这些预测通常依赖于二进制经典计算机和人工智能(AI)模型,比如谷歌的DeepMind AlphaFold。
根据一项新研究,这项研究于 5 月 9 日在预印本arXiv数据库上发布,能够在这些经典架构上运行的算法可以处理包含“数百或数千个核苷酸”的 mRNA 序列,但这只能通过排除更高复杂度的特征,比如“这种结构被称为‘伪结’。”来实现。
伪结结构是分子二级结构中复杂的扭曲和形状,能够进行比普通折叠更复杂的内部相互作用。如果不考虑它们,任何蛋白质折叠预测模型的准确性就会受到很大限制。
理解和预测mRNA分子蛋白质折叠的每一个细节对于开发更强的预测至关重要,因此,更有效的基于mRNA的疫苗也会随之而来。
科学家们希望通过结合实验与量子技术,克服最强大的超级计算机和人工智能模型本身的局限性。研究人员使用基于量子比特(计算机比特的量子等价物)的量子模拟算法进行了多次实验,以对分子进行建模。
最初仅使用 R2 Heron 量子处理单元 (QPU) 上的 80 个量子比特(总共可用 156 个),团队采用了一种基于条件价值-at-risk的变分量子算法 (CVaR-based VQA) — 这是一种量子优化算法,模拟了分析复杂交互的一些技术,例如 碰撞避免 和 金融风险评估技术 — 用来预测一个60个核苷酸长的mRNA序列的二级蛋白质结构。
根据研究,量子模拟模型的最佳记录是42个核苷酸序列。研究人员还通过应用 最近的纠错技术 来处理 量子功能产生的噪声,因此扩大了实验规模。
在新的预印本研究中,团队初步展示了实验方法在处理最多156个量子比特的mRNA序列(最多60个核苷酸)时的有效性。他们还进行了初步研究,展示了在无噪声环境下使用多达354个量子比特进行相同算法的可能性。
看似,增加用于运行算法的量子比特数量,同时扩展算法以包含额外的子例程,应该会导致更准确的模拟和预测更长序列的能力,他们表示。
然而,他们指出,这些方法需要开发更先进的技术,将这些特定问题的电路嵌入现有的量子硬件中,这表明,推动研究需要更好的算法和处理架构。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.