本文系Food Science and Human Wellness原创编译,欢迎分享,转载请授权。
Introduction
核磁共振(NMR)和质谱(MS)可为靶向分离、鉴定和代谢组学提供丰富的分子结构信息,极大地促进了从植物、微生物和海洋来源发现天然产物(NPs)的过程。在过去的几十年里,随着NMR和MS技术在食品领域的出版物数量逐年稳步增加表明上述技术在食品科学领域的多样化应用已扩展到食品质量、食品化学、食品营养、食品微生物学等广泛的食品基质中。当这2 种技术应用于代谢组学研究时,它们也具有独特的优势。因此,长期以来,NMR和MS技术的结合一直被用于新的代谢物的结构表征,特别是在NPs领域。NPs由于其复杂的骨架结构、独特的性质和多种生物活性,长期以来一直被认为是药物开发先导化合物的重要来源。传统的NPs发现过程成本高、耗时长、缺乏导向性。此外,分离的盲目性导致重复发现已知成分和生物活性丧失。功能性食品,尤其是植物性膳食补充剂,不仅提供多种营养和功能化合物(FCs),而且对人体健康具有多种生物活性益处。随着健康意识的提高和人口老龄化带来的挑战的增加,对个人健康有益的功能食品越来越受到研究人员的关注。开发天然植物源性功能食品,需要对FCs进行筛选和科学研究,对其安全性、功能性、量效关系乃至分子机制进行评价。机器学习(ML)算法是人工智能(AI)的子领域,越来越多地被用于开辟新的机会来解决FCs发现的挑战。如何快速有效地识别、筛选和挖掘FCs和NPs结合AI/ML算法也是研究的关键十字路口。现代光谱仪灵敏度的显著提高将有助于小分子化合物的挖掘,并减少数据采集所需的时间,特别是多维核磁共振。近年来,随着代谢组学、生物信息学和AI的快速发展,NPs的发现正在发生范式转变。新的基于核磁共振和质谱的鉴定和反复制策略正在出现并应用于FCs和NPs领域。例如,基于MS/MS分子网络(MN)的GNPS平台在食物相关代谢组学研究中越来越普遍。无监督(即层次聚类分析(HCA)、主成分分析和判别分析(PCA-DA)和监督ML算法(即偏最小二乘、正交投影到潜在结构(OPLS)、随机森林、支持向量机和人工神经网络)已被用于从代谢组学数据中提取信息,并产生新的生物学见解。基于目前的研究现状,本文重点总结了新兴的核磁共振和质谱技术在快速准确地识别包括FCs在内的NPs中的应用,以期为FCs的挖掘提供更好的见解和思路。
图1 基于MS和NMR技术NPs和FCs的发现简介
Results and Discussion
用于FCs和NPs化学信息分析的NMR技术
核磁共振被认为是靶向和非靶向代谢组学中阐明结构、解析FCs和NPs不可或缺的工具。基于核磁共振的复杂混合物代谢组挖掘为发现不同结构类型的NPs提供了机会。此外,核磁共振通常对结构独特性和新颖性特征敏感,对同分异构体和结构相似的化合物有很高的鉴别力,而且仪器与仪器之间的差异最小。然而,与MS相比,其局限性在于信号重叠和灵敏度较低,尤其是在复杂样品中,这意味着需要更多的样品。不过,随着高场和超高场NMR仪器、超低温探头的出现大大提高了NMR的分辨率和灵敏度。这使能够处理微克级的较小样本量,并缩短测试时间。此外,通过获取二维NMR数据集(COSY、TOCSY、HSQC、HMBC),样品1H NMR光谱中较为普遍的信号重叠问题得到了部分解决,这为阐明代谢物的结构提供了关键信息。在此,重点介绍食品和植物领域中基于核磁共振技术的新兴的定性、靶向分离和去重复策略,这些策略在食品质量评估、FCs挖掘和新颖NPs发现方面发挥着关键作用。
MixONat(见https://sourceforge.net/projects/mixonat)是一款免费发布的算法软件,用于根据13C NMR光谱数据去重复混合物。13C NMR可选择与DEPT-135和DEPT-90方法相结合,用于破译混合物的复杂性,以区分碳类型,进行预测性或实验性碳化学位移比较,同时将碳多重性过滤作为一个关键步骤。使用MixONat软件的一般程序(图 2)是将复杂的NP混合物进行13C NMR和DEPT处理,以区分CH3、CH2和CH以及C碳类型。然后,以SDF文件格式从结构数据库中收集的感兴趣的NPs与13CNMR的实验化学位移值进行匹配,并对分子量和碳类型进行过滤。最后,可在数据库中标出各种化合物的相似性得分,用于化合物注释。
图2 应用MixONat策略总体流程图
另一种基于13C NMR的去重复策略已被引入特定的代谢组学衍生工作流程(图3),用于直接鉴定混合物中的代谢物。Hubert等利用离心分离萃取(CPE)将复杂代谢物混合物的化学成分简化为一系列连续的馏分。然后利用13C NMR、自动收集和配准对这些馏分中所含的全部代谢物进行分析。通过HCA生成“化学位移簇”,以确定馏分中代谢物的化学位移相似性,并将其分配到分子结构中。目前已建立了一个内部13C NMR天然代谢物化学位移数据库,通过与文献中先前描述的与所研究提取物有关的化合物进行比较,可帮助鉴定过程。
图3 基于CPE和HCA方法的一种利用13C NMR数据的去重复策略
SMART是一种基于AI/ML的工具(http://smart.ucsd.edu/classic),用于从HSQC数据(图 4)中生成结构假设,从而将新分离的NPs与其已知类似物快速联系起来。Zhang等利用非均匀采样(NUS)和深度卷积神经网络(CNN)开发了这一高效发现NPs的策略。该技术利用神经网络架构,在一个由2054 种NPs的HSQC光谱组成的数据集上训练深度卷积网络,关键相关信号次数达83 000 次。这种模型构建了一个能够区分光谱相似性的聚类空间,其中结构相似的化合物聚集在一起,而结构不同的化合物则相距甚远。随后,通过NUS序列快速获取混合物的HSQC图谱,然后提交给上述经过训练的深度CNN卷积神经网络进行区分分析。
图4 基于HSQC分析的SMART策略的总体流程图
基于MS的FCs和NPs发现策略
分子网络(MN)由Dorrestein课题组于2012年首次提出,随后成为分析基于MS2的代谢组学数据的流行工具。它是一种质谱网络可视化策略,通过整合MS2光谱、生物信息学和计算算法而开发。MN的原理是,在相同条件下,具有相似或相同结构的分子会显示出相似或相同的MS2光谱。在比较MS2图谱中的每个离子碎片峰时,会用余弦值(0~1)计算每个图谱的相似度。谱图的相似度越高,计算出的余弦值就越大。根据计算出的余弦值,相似的光谱可以集中在一起,反之则可以单独分组。最终,所有的MS2光谱都被整合到一个可视化的MN图中。通过与已知化合物标准MS2数据库进行比对,可以从复杂样品中找出具有m/z值的已知化合物节点,从而将MS信息与样品结构特征联系起来。基于网络的非靶向代谢组学工作流程由3 个关键步骤组成:数据预处理、网络可视化和代谢物注释。在MN图中,每个节点代表一个化合物,相应的MS2图谱信息可以用节点名称、颜色、大小、形状等特征来表示。节点之间的边表示不同化合物之间的结构关系,线的粗细表示这种关系的余弦值。随着代谢组学的不断发展,越来越多基于MN的工具被开发出来。这些基于MN的工具可用于MS2数据集的处理和可视化,也可用于数据库的自动搜索,以识别具有特定结构的FCs。它们极大地促进了复杂代谢组学数据的分析和解读,使研究人员能够探索不同化合物之间的关系,深入了解它们的功能和生物学意义。
GNPS分析中基于特征的MN分子网络(FBMN)策略:在基于MS2的非靶向代谢组学样本中,经典MN可提供大量代谢物。然而,这种方法的主要瓶颈在于色谱解卷积必须进行人工后处理,而且会出现多个嵌合谱节点。FBMN利用成熟的MS处理软件包,如MZmine、XCMS、MS-DIAL或OpenMS,通过整合MS1信息(包括同位素模式和保留时间)和离子淌度分离,改进了传统的MN方法(图 5)。FBMN可以区分异构体,而这些异构体在经典MN中可能是隐蔽的,从而有助于谱图注释和相对定量信息。不过,在寻找特征的过程中存在忽略痕量代谢物的问题,进一步优化预处理参数可在一定程度上减少这一问题。
图5 经典分子网络策略和FBMN策略总体流程
GNPS分析中基于分子砌块的MN分子网络(BBMN):分子砌块作为特定的分子支架,以构建各种FCs为基础。生物体基因组包含构建、连接和修饰砌块的指令。利用MS2谱图数据识别代谢组学的基本分子砌块是提高代谢组学工作流程注释能力的一种有前途的方法,因为它有助于识别结构并根据这些分类对代谢物进行分组。这种BBMN策略由He等提出,可以通过标记保守的MS2片段来识别具有特定亚结构的化合物。GNPS分析中的离子特性MN分子网络(IIMN):在经典的MN和FBMN分析中,特定化合物的非连接加成离子是一个核心瓶颈。例如,在LC-MS离子化过程中,谱库中最常见的2 种离子([M+H]+和[M+Na]+)通常是不相连的,在MN中显示为单独的节点。因此,对于复杂的代谢物来说,基于MS2数据的MN所构建的特征是高度冗余的。离子识别分子网络(IIMN)于2021年首次提出,是一种基于规则的数据分析工作流程(图 6),展示了如何将基于MS2的光谱网络与基于MS1特征形状相似性的附加网络(源自同一分子的加成离子)合并。它利用前体离子符合保留时间、峰形和用户定义参数的MS2图谱来补充FBMN。
图6 BBMN策略和IIMN策略总体流程图
Conclusion
在本文中,总结了新出现的基于NMR和MS的高效策略及其在功能食品和NPs领域研究中的应用。事实上,核磁共振的独特优势在很大程度上可与质谱互补,且越来越多的代谢组学研究报告了两者的结合使用从而改进代谢物鉴定和化合物注释的数据整合策略。因此,通过集成平台结合使用基于NMR和MS的常规技术是一种高效的选择,可通过使用多个数据集集成来提高代谢组的覆盖率、促进功能基因组注释并建立更强大的模型。从硬件组合到计算工具(如SUMMIT MS/NMR、NMR/MS Translator和DAF discovery),一些综述讨论了将NMR和MS结合用于代谢组学的各种方法,这使得在无需分离复杂基质的情况下阐明结构和化学位移非常相似的FCs变得可行。作者认为,这一观点将有助于激发FCs的发现,并增强NPs研究领域的信心。在此,本文建议对最初提取的样品进行全面的二维NMR和MS2分析,以便以互补的方式在两种技术之间建立桥梁。另一方面,大多数基于NMR和MS的策略都涉及在计算算法中将光谱数据与数据库进行比较。FCs鉴定的准确性取决于数据库中包含的结构类型和数量,这就造成了实际限制。因此,应该指出的是,随着数据库和软件工具的扩大、整合和开发将使大规模数据分析和注释变得更加容易。
与MS方法相比,核磁共振为分子分析提供了更多的结构信息,但溶剂效应、采集时间长和信号重叠等不可忽视的局限性阻碍了新的核磁共振引导策略的发展。如何面对这些挑战,制定促进代谢物注释的新策略,是需要重点关注和解决的问题。NOAH(使用1H检测的有序采集NMR)作为一种超序列方法被提出,它在每次采集中结合了多个异核和同核相关性,在基于1H检测的同一实验中采集不同的2D NMR数据,这在很大程度上减少了NMR采集时间和成本。NUS的设计还能减少间接维度的实验次数,从而在减少数据采集实验的同时提供对全采样频谱的精确估计。
MN主要用于发现NPs,其应用已扩展到多个领域,包括药物先导物发现、临床诊断和法医分析。经典的MN和FBMN现已广泛应用于非靶向代谢组学研究、食品真伪鉴别和食品化学研究,并在准确挖掘FCs方面显示出巨大的潜力。随着色谱分离能力和质谱灵敏度的不断提高,大量的MS2数据将获得,因此数据处理和不同形式的加成离子已成为挑战。随着FCs和生物活性NPs的不断挖掘,基于MN的工具和方法目前正在经历一场小型革命。尽管新出现的基于MN的方法经过精细的算法修改后已显示出NPs鉴定的强大潜力,但需要更多的案例研究来验证,因此需要确认数据质量并提高FCs注释的准确性。尽管注释的可靠性仍需人工排序,而且数据库中的结构数量有限,注释策略已显示出过滤大型数据集的能力。今后,应继续努力开发新的策略,借助于AI/ML辅助决策支持工具和现有分子数据的发展,扩大代谢物的覆盖范围,提高FCs挖掘的数据质量。
第一作者简介
张伯斗,硕士毕业于中国药科大学中药学专业,现为中国科学院昆明植物研究所在读博士研究生。主要研究方向为构建基于质谱和核磁技术的融合体系挖掘具有重要生理功能的活性天然产物。目前以第一作者在Phytochemistry,Journal Ethnopharmacology,Food Science and Human Wellness发表SCI论文3篇。
通信作者简介
张于,博士,中国科学院特聘研究员,中国科学院昆明植物研究所博士研究生导师,专题攻关组组长,美国北卡罗莱纳大学教堂山分校药学院访问学者,云南省中青年学术和技术带头人、云南省万人计划青年拔尖、中国科学院青年创新促进会会员、中国科学院西部之光—西部青年学者,Food Science and Human Wellness和Natural Products and Bioprospecting期刊编委,主要从事天然产物化学研究工作,重点关注中药/药用/食用植物中天然产物结构、活性、作用机制以及成药性研究,目前运用质谱和核磁技术分离鉴定1 000余个天然产物结构,其中新结构200余个。目前以第一或通信作者在Protein & Cell, Organic Letters, Journal of Natural Products,Food Science and Human Wellness等权威期刊发表SCI论文70余篇,授权专利5 项;目前主持国家重点研发计划课题、国家自然科学基金、云南省应用基础研究计划重点等十余项项目,先后获云南省自然科学一等奖和广西自然科学二等奖。
The application and perspective of NMR and MS based strategies for functional compounds mining in medicinal and dietary plants
Bodou Zhanga,b, Sheng Lia, Zhenzhen Lianga, Yinling Weia,b, Jing Donga, Hongyan Wena, Lingli Guoa, Xiaojiang Haoa, Yu Zhanga,*
a State Key Laboratory of Phytochemistry and Plant Resources in West China, Kunming Institute of Botany, Chinese Academy of Sciences, Kunming 650201, China
b University of Chinese Academy of Sciences, Beijing 100049, China
*Corresponding author.
Abstract
Medicinal and dietary plants provide numerous nutritional and functional compounds and also have various potential health benefits to humanity. The specific and efficient techniques for accurate identification of nutritional compounds and functional metabolites is crucial for the development of functional foods from medicinal and dietary plants. Nuclear magnetic resonance (NMR) and mass spectrometry (MS) are indispensable and essential technologies that provide an unsurpassed wealth of untargeted identification, quantitative and qualitative analysis, and structural information in the study of food and plant products. In the past decade, the rapid development of modern analytical technology has led to the emergence of new approaches and strategies for natural products discovery. Especially the application of novel NMR- and MS-based identification and dereplication strategies aided by artificial intelligence and machine learning algorithms have brought about a significant shift in the natural products discovery process. These developments and changes in the natural products filed have given us insights into how to accurately target and mining nutritional, functional, and bioactive compounds. Thus, we have summarized recent research on novel NMR and MS based strategies and methods focusing on functional compounds, accurate identification and efficient discovery mainly in medicinal and dietary plants. This review could provide a comprehensive perspective for a better understanding of novel strategies and methods based on NMR and MS technologies, which could provide valuable insights and ideas for functional compounds mining.
Reference:
ZHANG B D, LI S, LIANG Z Z, et al. The application and perspective of NMR and MS based strategies for functional compounds mining in medicinal and dietary plants[J]. Food Science and Human Wellness, 2024, 14(1): 9250003. DOI:10.26599/FSHW.2024.9250003.
文章翻译由作者提供
编辑:王佳红;责任编辑:孙勇
封面图片:图虫创意
为贯彻落实《中共中央国务院关于全面推进美丽中国建设的意见》《关于建设美丽中国先行区的实施意见》和“健康中国2030”国家战略,全面加强农业农村生态环境保护,推进美丽乡村建设,加快农产品加工与储运产业发展,实现食品产业在生产方式、技术创新、环境保护等方面的全面升级。由 中国工程院主办, 中国工程院环境与轻纺工程学部、北京食品科学研究院、湖南省农业科学院承办, 国际食品科技联盟(IUFoST)、国际谷物科技协会(ICC)、湖南省食品科学技术学会、洞庭实验室、湖南省农产品加工与质量安全研究所、中国食品杂志社、中国工程院Engineering编辑部、湖南大学、湖南农业大学、中南林业科技大学、长沙理工大学、湘潭大学、湖南中医药大学协办的“ 2025年中国工程院工程科技学术研讨会—推进美丽乡村建设-加快农产品加工与储运产业发展暨第十二届食品科学国际年会”,将于2025年8月8-10日在中国 湖南 长沙召开。
长按或微信扫码进行注册
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.