网易首页 > 网易号 > 正文 申请入驻

AI大模型赋能生命健康行业的实践与挑战|全球开发者先锋大会

0
分享至

转载自:澎湃新闻

在生命健康领域,人工智能(AI)模型正开始大展身手。AI可以协助医生看影像报告、分析病情,也可以帮助科研人员总结海量论文、预测疾病机制、加速药物研发。随着Deepseek这样性能强劲的开源大模型面世,生命健康行业迎来“风口”,从业者可以用更低的成本开发更好的商业产品。

大模型在生命健康领域如何应用?有何机遇与挑战?2月21日,在上海全球开发者先锋大会(GDC)的“开源语言大模型与AI for Science在生命健康领域的介绍与应用”工作坊中,多名AI专家和产品开发者就这些问题展开探讨。

“开源语言大模型与AI for Science在生命健康领域的介绍与应用”工作坊现场

为什么“能聊天”的大模型也能够应用在生命科学研究、医学诊疗的各个环节?工作坊中,几位演讲者介绍了AI大模型的原理。它的核心在于模型通过学习大量真实数据,理解数据的概率分布,从而作出逼近现实的预测。

“如果要在‘我’和‘你’之间填空,应该怎么填?在武侠小说里可能‘打’出现得比较多,而在爱情小说里可能‘爱’出现得多。语言大模型可以预测在不同语境中,填哪个字的可能性最高。”上海达威科技创始人朱代辉介绍道。

在目前大模型广泛采用的Transformer架构中,输入的文本会被转化成数学向量的形式,词与词的关联概率可以用向量距离来度量。模型比较这些向量,计算出它们之间的“注意力权重”,从而确定哪些词对当前词更重要,这就是“自注意力”(Self-Attention)算法机制。

“这种机制允许模型在处理序列数据时,同时考虑所有位置的信息,动态地决定哪些信息更重要。”朱代辉说。为了让模型在不同的上下文中捕捉不同的信息,Transformer模型会将注意力权重维度分成多组同时计算,每组关注序列中的不同部分,最后的结果会被合并。这种“多头注意力”(Multi-Head Attention)机制能帮助模型从多个角度理解句子。

这些注意力权重随后会被输入“前馈神经网络”(Feed-Forward Neural Network)中进行计算。这种神经网络模型由多层对应数据特征的节点构成,它能够帮助模型对数据进行“深度学习”,发现其中更复杂的模式。

这些模块层层堆叠,产生大量参数来描述数据。通过调整,这些模型不止能够学习语言,还能够学习图像、音频乃至DNA序列、蛋白质结构等不同模态的数据,将它们进行统一表示。当参数和数据量达到一定规模时,模型就仿佛“开窍”一般,涌现出分类、预测、生成的能力。

要达到这种效果需要耗费大量的数据和算力成本。专注于应用的开发者可以选择在这些已经具备一定认知能力的通用大模型基础上进行算法和数据的调整,开发适用于特定任务的专业大模型。

联合利华数据AI总监、计算生物学博士杨荟介绍了Biobert、SCGPT、Evo等多款生命科学和医学领域的大模型,可以用于基因、蛋白质等多组学信息的整合、药物靶点发现与分子设计、医学图像分析等场景。

杨荟提到,大模型已经成为辅助生命科学和医学研究的得力助手。

“一天我看到家里的塑料袋被一些虫子分泌的物质所腐蚀,突然来了灵感,就通过Chatgpt的Deep research(深度研究)功能询问有没有昆虫分泌蛋白质降解塑料的研究。AI最后帮我找到了西班牙的一项研究,其中发现一种飞蛾幼虫能分泌两种能够降解塑料的蛋白质。”他说。

随后,杨荟通过AI提供的资料找到了这两种蛋白质在数据库中的信息。“其中一种已经被解析,而且可以看到实际结果与蛋白质结构预测AI给出的结果很接近。”

一名开发者还介绍了一款在医学和生物领域相当流行的AI产品“txyz”。这款基于Chatgpt开发的平台能够帮助用户快速查找和精读论文,或是根据论文形成准确的综合性回答,帮助科研人员快速获取知识。

AI大模型快速“理解”文献的能力还可以用于从海量论文中提取关于生命和疾病规律的关键结论,比如药物作用的靶点、疾病机制等,然后再用这些信息和其它实验数据去建立能够预测生命和疾病活动的模型。这被一些人称为生命的“数字孪生”(digital twin)。

“近年来尽管科技进步了,数据也越来越多,药物研发的成功率却在走低,主要原因是对药理机制理解的缺乏。”焕一生物的副总裁蔡俊杰告诉澎湃科技。数字孪生能够通过模拟人体对药物的反应,从病理的角度对实验结果进行预测,让药物研发少走弯路。

开源大模型性能的提升为数字孪生产品开发者带来了新的机遇。“公开数据库中有3700万篇医学文献,我们算了一下,如果调用Chatgpt的接口去提取收集里面的机制和参数等知识,要花费几千万乃至上亿美元。”蔡俊杰说,“现在有了性能同样强劲的开源模型Deepseek,就能显著降低成本。”

在医学诊断方面,AI大模型也正在帮助医生提高效率,甚至取代一部分的工作。上海科莫生医疗科技有限公司的张浩曦分享了他们开发的染色体核型分析AI平台。

在胚胎发育、细胞分裂时,DNA紧密压缩在一起,成为我们能观测到的染色体,它们的功能和形态正常很重要。“50%的自然流产是由染色体异常导致的。而因为漏检等原因,在每150个新生儿中,平均有1个染色体异常,这往往意味着畸形或者基因病,是一件很悲伤的事情。”张浩曦说。

染色体核型分析是医生排除染色体异常的主要手段。人有23对染色体,但在观测时往往不是成对出现的。在核型分析中,医生需要“看图配对”,再与正常的染色体进行对比,看看有没有缺失、重复等异常现象。

“这个过程周期长,很枯燥,费眼睛,搞得医生也很疲劳。”张浩曦说。科莫生开发了一种核型分析大模型,帮助医生进行染色体图像的自动识别、配对和分析。该产品已经拿到了四川省的二类医疗器械证。

“原先28天才能拿的染色体报告,现在在AI的辅助下1天就能出。”他说,这提高了核型检测的效率,降低了成本,放大了医院的诊疗能力。“做得快了,那么除了孕检之外,比如那些可能接触辐射的高危人群有需要的人也可以去做。”

生命科学研究要求专业性和准确性,而医学诊断更是直接关系到患者的福祉。尽管AI大模型正在各个应用场景中迅速落地,但其中还是存在着不少风险与挑战,需要开发者和政策标准制定者共同面对和克服。

在西湖大学博士研究生燕阳眼里,AI辅助诊断还是有很多风险的:“如果问一些大模型,孕妇能用什么药,它会提示四环素是可以使用的,但这个药肯定不能用。大模型不知道,是因为它没学到过。”

他介绍道,在大语言模型中,数据训练的本质是去尽可能地接近训练数据。如果数据完整、准确、质量高,那么回答的质量也就高。如果前面出现错误,就会导致后续生成中错误的累积,导致答案失真。

因此,追求更高质量的数据成为AI产品开发者共同关注的主题。燕阳认为,很多人对生命健康领域数据的认识存在误区,导致产品开发陷入瓶颈,乃至产生风险。

“有人觉得有海量数据就能训练好模型,数据越多模型性能越好,这是不对的。”他说。医院数据往往是非标准化的,比如医嘱、不同设备产生的检测结果等等,难以直接用来训练AI模型。有些数据缺乏标注,这些可能会导致模型学习到的概率分布偏离真实的医学推理逻辑。

“比如说,超过90%的胸片报告只标注异常结果,正常的话就没有标注。那AI可能会学到‘如果没有标注,则为正常’的逻辑,这显然是不对的,会导致误检率上升。”燕阳举例道。

由于缺乏更加完整的医学数据,有些医学AI研究可能会尝试数据“蒸馏”的方法,用ChatGPT等大模型生成数据,然后用这些数据来训练自己参数相对较少的模型。这样做的好处是能让小模型逼近大模型的能力,但坏处是大模型的输出本身可能存在问题。

“由于通用的大模型往往缺少医学知识,可能导致对罕见病等疾病的忽略。小模型将这些倾向作为‘事实’进行学习,可能会变得‘过度自信’且容易犯错。”他说。

燕阳认为,这些问题可以通过让数据变得更加完整和专业来解决,比如增加专家标注和更多医学知识,让AI学会“是什么”和“为什么”。还可以通过展示推理轨迹(CoT)等算法来完善AI的推理过程,把自相矛盾或者错误的逻辑剔除出去。

国内首个AI安全研究员、美国生命未来研究所的朱小虎告诉澎湃科技,在风险评估中,大语言模型已经展现出了欺骗、避免自身毁灭、传播对人有害的信息等问题。“基于专业知识的医学模型相对会好很多。但如果这些模型是以通用大模型为基座训练的话,底层的倾向也可能会传递到模型中。”他说。

欢迎转发,但请注明出处“上海经信委”

特别声明:本文经上观新闻客户端的“上观号”入驻单位授权发布,仅代表该入驻单位观点,“上观新闻”仅为信息发布平台,如您认为发布内容侵犯您的相关权益,请联系删除!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
历史不会重演,但会惊人相似:中国黄金价格极可能重走2015年老路

历史不会重演,但会惊人相似:中国黄金价格极可能重走2015年老路

王二哥老搞笑
2026-05-27 20:40:55
AMD女掌门苏姿丰直言:没人靠AI训练赚钱,GPU独大时代将结束!她给出AI下半场最反共识的判断

AMD女掌门苏姿丰直言:没人靠AI训练赚钱,GPU独大时代将结束!她给出AI下半场最反共识的判断

新浪财经
2026-05-27 22:41:52
来势汹汹!三国人马窜访台岛,郑丽文有个不好预感,解放军已上场

来势汹汹!三国人马窜访台岛,郑丽文有个不好预感,解放军已上场

怪味历史连连看
2026-05-28 00:48:00
14岁小七穿贝嫂的挂脖裙逛街,戴牙套笑容灿烂,进军美妆业受阻

14岁小七穿贝嫂的挂脖裙逛街,戴牙套笑容灿烂,进军美妆业受阻

译言
2026-05-27 09:28:14
细糠!!太通透了,这才是对孩子真正的托举!

细糠!!太通透了,这才是对孩子真正的托举!

另子维爱读史
2026-05-25 19:44:13
曹阳回应争议:潘朝伟怎么可能是关系户?中场节拍器、球商高

曹阳回应争议:潘朝伟怎么可能是关系户?中场节拍器、球商高

懂球帝
2026-05-28 06:57:07
身价暴涨不续约?松岛辉空官宣离队!桥本帆乃香回应退出亚锦赛选拔!

身价暴涨不续约?松岛辉空官宣离队!桥本帆乃香回应退出亚锦赛选拔!

最爱乒乓球
2026-05-28 05:04:22
从月销1.5万到2982辆!全新一代问界M9把BBA的饭碗端了!

从月销1.5万到2982辆!全新一代问界M9把BBA的饭碗端了!

凡兮说
2026-05-26 14:07:44
【早报】巴萨“脱贫”!超8000万欧豪购戈登!

【早报】巴萨“脱贫”!超8000万欧豪购戈登!

体坛周报
2026-05-28 08:13:18
38公里省道为何被圈进景区?游客因禁止自驾不得不花高价坐摆渡车,稻城亚丁景区回应“创收”争议

38公里省道为何被圈进景区?游客因禁止自驾不得不花高价坐摆渡车,稻城亚丁景区回应“创收”争议

极目新闻
2026-05-27 20:39:31
马斯克妹妹成自己后妈,金发碧眼身材辣,与马斯克76岁父亲生二胎

马斯克妹妹成自己后妈,金发碧眼身材辣,与马斯克76岁父亲生二胎

不似少年游
2026-05-21 22:06:23
法网女单太残酷了:随着斯塔罗杜布采娃 2-1,世界第2止步第二轮

法网女单太残酷了:随着斯塔罗杜布采娃 2-1,世界第2止步第二轮

侧身凌空斩
2026-05-28 00:01:22
比安卡再现大胆穿搭,一字皮胸衣配爆闪裤袜,坎耶复出之路坎坷

比安卡再现大胆穿搭,一字皮胸衣配爆闪裤袜,坎耶复出之路坎坷

译言
2026-05-28 06:11:21
淡江波(年仅41岁),在湖北骤然离世!“生命最后一刻还救了5个人”

淡江波(年仅41岁),在湖北骤然离世!“生命最后一刻还救了5个人”

环球网资讯
2026-05-28 08:03:22
你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

你最接近生理极限的一次经历是什么?网友分享让人目瞪口呆!

夜深爱杂谈
2026-04-09 19:39:13
马龙带一家旅游,退役官至高位,身家过亿,夏露越来越美

马龙带一家旅游,退役官至高位,身家过亿,夏露越来越美

大西体育
2026-05-27 23:46:03
东南大学青年首席教授,出任985高校院长

东南大学青年首席教授,出任985高校院长

超级数学建模
2026-05-27 22:45:07
林志玲风波影响大!遭杨紫新剧除名,综艺也被下架,底线不可碰!

林志玲风波影响大!遭杨紫新剧除名,综艺也被下架,底线不可碰!

萌神木木
2026-05-25 12:42:08
詹姆斯阵营立场曝光!湖人若不给顶薪需解释 签换是离队最优方式

詹姆斯阵营立场曝光!湖人若不给顶薪需解释 签换是离队最优方式

罗说NBA
2026-05-28 05:26:51
足协罕见表态!甘树然遭炮轰:中超裁判泥石流,回去吹城市联赛吧

足协罕见表态!甘树然遭炮轰:中超裁判泥石流,回去吹城市联赛吧

奥拜尔
2026-05-27 21:20:33
2026-05-28 08:48:49
上观新闻 incentive-icons
上观新闻
站上海,观天下
490006文章数 761769关注度
往期回顾 全部

科技要闻

拼多多股价跌10%:管理层称业绩难免波动

头条要闻

台媒:特朗普就台湾问题表态后 没人敢提“台独”了

头条要闻

台媒:特朗普就台湾问题表态后 没人敢提“台独”了

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

一线调查丨燃油车“甩卖”也难卖

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

手机
房产
本地
亲子
公开课

手机要闻

苹果开发“防抢夺锁机”功能 被抢走的iPhone将立即自动上锁

房产要闻

合生创展前总裁被查!直指房企违规放贷、利益输送等问题

本地新闻

用剪纸的方式,打开江苏扬州

亲子要闻

专家:别在小事上消耗孩子!网友:瞎扯!硬控自己情绪,满身结节

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版