网易首页 > 网易号 > 正文 申请入驻

研究人员构建临床试验数据库,为开发垂直Agent提供数据源

0
分享至

多年来,美国伊利诺伊大学香槟分校博士毕业生、Keiji.AI 公司联合创始人王子丰一直在研究将 AI 应用于临床试验,并已开展多个相关项目,包括开发用于临床试验系统评价的辅助工具 TrialMind [1] 和 LEADS [2],提升试验招募效率的 TrialGPT [3],支持生物医学数据分析的智能平台 DSWizard [4,5],以及自动生成临床试验文档的系统 InformGen [6]。

在推进这些研究的过程中,王子丰逐渐意识到,尽管制药业内对 AI 在临床试验中的应用充满期待,但仍面临诸多关键挑战。

首先,目前缺乏有效的评估手段,使得大模型难以在临床试验场景中实现可验证、可落地的应用。

其次,真正理解制药行业实践的专业人士与 AI 技术专家之间存在明显的知识壁垒,跨领域协同不足,也限制了技术转化的深度和广度。

而在构建垂直领域模型和 Agent 的过程中,人们又面临着两个根本性的问题:一是缺乏结构清晰、适合 AI 训练的高质量数据资源,二是缺乏贴近真实临床试验任务、能够系统评估模型能力的基准任务集。

业界其实有一些出售临床试验商业数据的公司比如 Citeline,但是这些数据都非常昂贵,一般大型的制药企业可能每年向他们支付数百万美元以上来获取这些信息。而公共数据比如 ClinicalTrials.gov 只包括了在美国注册的试验记录,而很多的多个国家试验记录以及发表的试验都需要被额外收集和标准化处理。

基于上述问题,王子丰等人启动了本项研究,构建了临床试验领域的大规模结构化数据库 TrialPanorama [7],汇聚了试验设计、干预手段、适应症、生物标志物、结局指标等核心要素,并对接权威医学本体,确保数据的一致性与可扩展性。在此基础上,研究团队进一步设计了一套配套的评测任务集,涵盖从文献评价到试验设计的多个关键环节,以用于系统性地评估 AI 模型在临床试验相关任务中的能力。该工作不仅为模型的训练与测试提供了高质量数据支撑,也为后续开发 AI Agent 提供数据源。

如前所述,本次研究的主要成果是构建了一个覆盖广泛、结构清晰的临床试验数据库 TrialPanorama,共收录了来自全球 15 个来源的 1,657,476 条临床试验记录以及汇总这些临床试验的超过 9,000 篇系统评价论文。该数据库系统性地整理了临床试验设计与实施的关键要素,包括研究方案、干预方式、适应症、生物标志物和结局指标等,并与标准医学本体(如 DrugBank 和 MedDRA)进行了对齐,具备良好的规范性与可扩展性。

在此基础上,研究团队还首次设计并发布了一套面向临床试验任务的大模型评测基准,涵盖系统评价和试验设计累计两个类别和八项任务,这八项任务包括研究检索、研究筛选、证据总结、试验组设计、入排标准制定、终点选择、样本量估计及完成情况评估。通过在五个当前最先进的大模型上开展实验,研究团队发现通用模型虽然具备一定的零样本能力,但其表现尚不足以胜任高风险、要求严谨的临床试验场景。

而本次工作不仅提供了一个高质量的数据基础,还构建了可用于训练、评估和推动临床试验 AI 研究的系统平台,有望为开发更具专业性和实用性的智能系统奠定坚实基础。

本次研究成果具有广泛的应用前景,预计能在以下几个方面发挥重要作用:

首先,TrialPanorama 数据库可以作为医药研发和医学事务中基于 AI 的知识发现平台。例如,人们可以借助该数据库检索某一适应症下既往的治疗手段及其结果、正在研发中的同类药物等关键信息,从而辅助制定更科学、更具前瞻性的临床试验方案。

其次,该数据库为训练大模型提供了数据基础。由于其结构清晰、覆盖全面,非常适合用于生成高质量的训练样本,推动更贴近临床场景的专用语言模型的开发。同时,研究团队发布的 benchmark 也为评估现有及未来的大模型在临床试验任务中的表现提供了统一、专业的测试框架。

最后,对于当前越来越多专注于临床试验领域的 AI Agent 系统来说,TrialPanorama 提供了结构化、标准化的数据资源,并可以通过集成模型上下文协议(MCP,Model Context Protocol)服务器实现快速接入与部署,从而助力构建高可靠性、高专业度的垂类 AI Agent,为临床研发带来赋能。

多年前,王子丰就开始研究 AI,同时做一些 AI for healthcare。一开始进入这个方向时,他觉得有很多的“low-hanging fruit”,他认为只要把大模型用上、Agent 搭起来,然后就可以开展很多临床试验的任务。但是,当他真正在项目中和医生、药厂的研发人员、销售等各类角色深度接触之后,王子丰才意识到很多现实中的核心需求,其实并没有被很好地抽象成 AI 问题然后被做 AI 的人们注意到。

这中间有很多令人反思的时刻。比如他经常看到一些很酷炫的大模型demo,但是药厂的合作方告诉他,他们可能也会去尝试一下,然而很多时候实际效果往往不能达到可用的程度,或者说由于公司的合规性要求这些工具还不能够嵌入他们的工作流。

而作为一名 AI 研究者,王子丰认为得学会放下自嗨的技术视角,真正去倾听用户的痛点,理解他们的工作流程、合规限制和实际目标,然后再回过头来重新定义问题,想办法用 AI 去解决。

同时,这个“对话”和“重构”的过程,是王子丰在本次研究之中认为最有价值、也是最难忘的部分。这不仅仅凸显了当前的一些技术挑战,更是对于跨学科协作、产品思维、沟通能力的一种锤炼。

至于创业,它对王子丰来说也是一种自然的延伸。王子丰觉得做应用研究的人去创业其实非常合适。一方面你能从一线看到很多真实又有挑战的问题,另一方面你也有机会把研究成果真正落地,帮助到药厂、医生甚至患者。这种“从问题中来,到应用中去”的过程,非常充实,也让王子丰找到了科研之外的成就感。

正因此,王子丰联合创办了 Keiji.AI,在该公司他主要负责 AI 算法和应用的开发。该公司由王子丰的博士导师 Jimeng Sun 教授领衔,团队成员主要来自美国伊利诺伊大学香槟分校的研究团队。公司致力于将研究团队多年来在 AI 医疗和临床试验领域的研究成果转化。

基于这一背景,研究团队开发了 TrialMind 平台,集成了多种 AI Agent 和工作流程,并接入研究团队自建的 TrialPanorama 数据库,支持临床试验的方案设计、队列抽取、数据分析、患者招募等关键环节的智能化加速。

目前,研究团队的客户和合作伙伴包括多家制药公司(如Takeda、Abbvie、Regeneron)、真实世界数据公司(如 Medidata、Guardant Health),以及大型 CRO(如 IQVIA)。公司正处于快速发展阶段,正在积极推进融资并扩大团队。而基于上述工作,他们正在基于本次数据库开发临床试验的垂类 AI Agent 和模型。

参考资料:

1.https://arxiv.org/abs/2406.17755

2.https://arxiv.org/abs/2501.16255

3.https://www.nature.com/articles/s41467-024-53081-z

4.https://arxiv.org/abs/2410.21591

5.https://arxiv.org/abs/2505.16100

6.https://arxiv.org/abs/2504.00934

7.https://arxiv.org/abs/2505.16097

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5连胜!伦纳德20+8,加兰15+11,感谢哈登相助,快船成西部搅局者

5连胜!伦纳德20+8,加兰15+11,感谢哈登相助,快船成西部搅局者

巴叔GO聊体育
2026-03-30 13:20:03
员工曝光张雪峰真实的人品!太感人了,感叹好人为何死的那么早?

员工曝光张雪峰真实的人品!太感人了,感叹好人为何死的那么早?

谈史论天地
2026-03-29 08:33:53
比亚迪车主集体懵了!车机高德突然没了,直接换成腾讯地图

比亚迪车主集体懵了!车机高德突然没了,直接换成腾讯地图

趣味萌宠的日常
2026-03-30 11:53:35
还记得利物浦“纹身哥”吗?梅雷莱斯退役10年,生活竟比踢球更狂

还记得利物浦“纹身哥”吗?梅雷莱斯退役10年,生活竟比踢球更狂

仰卧撑FTUer
2026-03-30 10:48:05
邵佳一:国足禁外出购物,0-7惨败后买特产太刺眼

邵佳一:国足禁外出购物,0-7惨败后买特产太刺眼

老觷系戏精北鼻
2026-03-29 22:00:10
【列国鉴】记者观察:伊朗战事持续一月,特朗普政府陷入四重困境

【列国鉴】记者观察:伊朗战事持续一月,特朗普政府陷入四重困境

新华社
2026-03-29 13:47:07
张雪峰后继有人,牢a将指导广大学子升学

张雪峰后继有人,牢a将指导广大学子升学

昊轩看世界
2026-03-29 12:07:42
张凌赫粉丝不满人民日报转发批评,引发争议

张凌赫粉丝不满人民日报转发批评,引发争议

瑛派儿老黄
2026-03-30 14:52:18
俄警告韩国勿向乌提供致命性武器

俄警告韩国勿向乌提供致命性武器

财联社
2026-03-29 09:30:26
郭麒麟白嫖网红外卖媛!

郭麒麟白嫖网红外卖媛!

八卦疯叔
2026-03-28 09:58:03
记住!兰屿,才是中国在东太平洋真正的“定海神针”!

记住!兰屿,才是中国在东太平洋真正的“定海神针”!

音乐时光的娱乐
2026-03-30 11:09:07
外媒:叙利亚过渡政府总统下周将访问德国和英国

外媒:叙利亚过渡政府总统下周将访问德国和英国

参考消息
2026-03-29 14:22:03
台湾拦不住!大陆官宣定调:厦金大桥照常施工,直通金门一步到位

台湾拦不住!大陆官宣定调:厦金大桥照常施工,直通金门一步到位

安珈使者啊
2026-03-29 09:55:55
真不打球了!生涯狂赚2亿,如今疯狂钓鱼,妥妥的人生大赢家啊

真不打球了!生涯狂赚2亿,如今疯狂钓鱼,妥妥的人生大赢家啊

球童无忌
2026-03-30 14:39:34
沈南谈张雪峰葬礼:最初大家都克制小声哭,张母大哭全场都放声哭

沈南谈张雪峰葬礼:最初大家都克制小声哭,张母大哭全场都放声哭

喜欢历史的阿繁
2026-03-29 18:56:46
国足vs喀麦隆!4231阵型首发浮现:韦世豪搭档张玉宁,剑指2连胜

国足vs喀麦隆!4231阵型首发浮现:韦世豪搭档张玉宁,剑指2连胜

球场没跑道
2026-03-29 14:40:20
招商银行2025年报出炉:实现净利润1501.81亿元,净息差收窄至1.87%

招商银行2025年报出炉:实现净利润1501.81亿元,净息差收窄至1.87%

每日经济新闻
2026-03-30 09:20:17
伊朗最高领袖最新发声

伊朗最高领袖最新发声

第一财经资讯
2026-03-30 07:29:44
中国斩钉截铁,就是要日本赔罪,军官侵馆第4天,防卫大臣行动了

中国斩钉截铁,就是要日本赔罪,军官侵馆第4天,防卫大臣行动了

老谢谈史
2026-03-29 01:20:29
人有没有糖尿病,吃饭就知道?有糖尿病的人,吃饭常有这5个表现

人有没有糖尿病,吃饭就知道?有糖尿病的人,吃饭常有这5个表现

老张健康趣谈
2026-03-30 12:49:55
2026-03-30 15:32:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16505文章数 514815关注度
往期回顾 全部

科技要闻

DeepSeek性能异常问题已解决,服务恢复

头条要闻

美国如果发动地面战 本次战事军费或突破10万亿美元

头条要闻

美国如果发动地面战 本次战事军费或突破10万亿美元

体育要闻

想进世界杯,意大利还要过他这一关

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

油价冲击,有些亚洲货币先扛不住了!

汽车要闻

理想i9要来了!外形似小号MEGA 能冲击高端纯电市场?

态度原创

教育
艺术
亲子
本地
游戏

教育要闻

关注!西城市重点中学招聘教师啦

艺术要闻

600 年前的「产亡孤魂」,藏着中国女性最痛的记忆

亲子要闻

何怡华:做胎儿心脏守护者

本地新闻

用Color Walk的方式解锁城市春日

死亡游戏里打麻将?桐姥爷和亚丝娜现身《刀剑神域》联

无障碍浏览 进入关怀版