网易首页 > 网易号 > 正文 申请入驻

研究人员构建临床试验数据库,为开发垂直Agent提供数据源

0
分享至

多年来,美国伊利诺伊大学香槟分校博士毕业生、Keiji.AI 公司联合创始人王子丰一直在研究将 AI 应用于临床试验,并已开展多个相关项目,包括开发用于临床试验系统评价的辅助工具 TrialMind [1] 和 LEADS [2],提升试验招募效率的 TrialGPT [3],支持生物医学数据分析的智能平台 DSWizard [4,5],以及自动生成临床试验文档的系统 InformGen [6]。

在推进这些研究的过程中,王子丰逐渐意识到,尽管制药业内对 AI 在临床试验中的应用充满期待,但仍面临诸多关键挑战。

首先,目前缺乏有效的评估手段,使得大模型难以在临床试验场景中实现可验证、可落地的应用。

其次,真正理解制药行业实践的专业人士与 AI 技术专家之间存在明显的知识壁垒,跨领域协同不足,也限制了技术转化的深度和广度。

而在构建垂直领域模型和 Agent 的过程中,人们又面临着两个根本性的问题:一是缺乏结构清晰、适合 AI 训练的高质量数据资源,二是缺乏贴近真实临床试验任务、能够系统评估模型能力的基准任务集。

业界其实有一些出售临床试验商业数据的公司比如 Citeline,但是这些数据都非常昂贵,一般大型的制药企业可能每年向他们支付数百万美元以上来获取这些信息。而公共数据比如 ClinicalTrials.gov 只包括了在美国注册的试验记录,而很多的多个国家试验记录以及发表的试验都需要被额外收集和标准化处理。

基于上述问题,王子丰等人启动了本项研究,构建了临床试验领域的大规模结构化数据库 TrialPanorama [7],汇聚了试验设计、干预手段、适应症、生物标志物、结局指标等核心要素,并对接权威医学本体,确保数据的一致性与可扩展性。在此基础上,研究团队进一步设计了一套配套的评测任务集,涵盖从文献评价到试验设计的多个关键环节,以用于系统性地评估 AI 模型在临床试验相关任务中的能力。该工作不仅为模型的训练与测试提供了高质量数据支撑,也为后续开发 AI Agent 提供数据源。

如前所述,本次研究的主要成果是构建了一个覆盖广泛、结构清晰的临床试验数据库 TrialPanorama,共收录了来自全球 15 个来源的 1,657,476 条临床试验记录以及汇总这些临床试验的超过 9,000 篇系统评价论文。该数据库系统性地整理了临床试验设计与实施的关键要素,包括研究方案、干预方式、适应症、生物标志物和结局指标等,并与标准医学本体(如 DrugBank 和 MedDRA)进行了对齐,具备良好的规范性与可扩展性。

在此基础上,研究团队还首次设计并发布了一套面向临床试验任务的大模型评测基准,涵盖系统评价和试验设计累计两个类别和八项任务,这八项任务包括研究检索、研究筛选、证据总结、试验组设计、入排标准制定、终点选择、样本量估计及完成情况评估。通过在五个当前最先进的大模型上开展实验,研究团队发现通用模型虽然具备一定的零样本能力,但其表现尚不足以胜任高风险、要求严谨的临床试验场景。

而本次工作不仅提供了一个高质量的数据基础,还构建了可用于训练、评估和推动临床试验 AI 研究的系统平台,有望为开发更具专业性和实用性的智能系统奠定坚实基础。

本次研究成果具有广泛的应用前景,预计能在以下几个方面发挥重要作用:

首先,TrialPanorama 数据库可以作为医药研发和医学事务中基于 AI 的知识发现平台。例如,人们可以借助该数据库检索某一适应症下既往的治疗手段及其结果、正在研发中的同类药物等关键信息,从而辅助制定更科学、更具前瞻性的临床试验方案。

其次,该数据库为训练大模型提供了数据基础。由于其结构清晰、覆盖全面,非常适合用于生成高质量的训练样本,推动更贴近临床场景的专用语言模型的开发。同时,研究团队发布的 benchmark 也为评估现有及未来的大模型在临床试验任务中的表现提供了统一、专业的测试框架。

最后,对于当前越来越多专注于临床试验领域的 AI Agent 系统来说,TrialPanorama 提供了结构化、标准化的数据资源,并可以通过集成模型上下文协议(MCP,Model Context Protocol)服务器实现快速接入与部署,从而助力构建高可靠性、高专业度的垂类 AI Agent,为临床研发带来赋能。

多年前,王子丰就开始研究 AI,同时做一些 AI for healthcare。一开始进入这个方向时,他觉得有很多的“low-hanging fruit”,他认为只要把大模型用上、Agent 搭起来,然后就可以开展很多临床试验的任务。但是,当他真正在项目中和医生、药厂的研发人员、销售等各类角色深度接触之后,王子丰才意识到很多现实中的核心需求,其实并没有被很好地抽象成 AI 问题然后被做 AI 的人们注意到。

这中间有很多令人反思的时刻。比如他经常看到一些很酷炫的大模型demo,但是药厂的合作方告诉他,他们可能也会去尝试一下,然而很多时候实际效果往往不能达到可用的程度,或者说由于公司的合规性要求这些工具还不能够嵌入他们的工作流。

而作为一名 AI 研究者,王子丰认为得学会放下自嗨的技术视角,真正去倾听用户的痛点,理解他们的工作流程、合规限制和实际目标,然后再回过头来重新定义问题,想办法用 AI 去解决。

同时,这个“对话”和“重构”的过程,是王子丰在本次研究之中认为最有价值、也是最难忘的部分。这不仅仅凸显了当前的一些技术挑战,更是对于跨学科协作、产品思维、沟通能力的一种锤炼。

至于创业,它对王子丰来说也是一种自然的延伸。王子丰觉得做应用研究的人去创业其实非常合适。一方面你能从一线看到很多真实又有挑战的问题,另一方面你也有机会把研究成果真正落地,帮助到药厂、医生甚至患者。这种“从问题中来,到应用中去”的过程,非常充实,也让王子丰找到了科研之外的成就感。

正因此,王子丰联合创办了 Keiji.AI,在该公司他主要负责 AI 算法和应用的开发。该公司由王子丰的博士导师 Jimeng Sun 教授领衔,团队成员主要来自美国伊利诺伊大学香槟分校的研究团队。公司致力于将研究团队多年来在 AI 医疗和临床试验领域的研究成果转化。

基于这一背景,研究团队开发了 TrialMind 平台,集成了多种 AI Agent 和工作流程,并接入研究团队自建的 TrialPanorama 数据库,支持临床试验的方案设计、队列抽取、数据分析、患者招募等关键环节的智能化加速。

目前,研究团队的客户和合作伙伴包括多家制药公司(如Takeda、Abbvie、Regeneron)、真实世界数据公司(如 Medidata、Guardant Health),以及大型 CRO(如 IQVIA)。公司正处于快速发展阶段,正在积极推进融资并扩大团队。而基于上述工作,他们正在基于本次数据库开发临床试验的垂类 AI Agent 和模型。

参考资料:

1.https://arxiv.org/abs/2406.17755

2.https://arxiv.org/abs/2501.16255

3.https://www.nature.com/articles/s41467-024-53081-z

4.https://arxiv.org/abs/2410.21591

5.https://arxiv.org/abs/2505.16100

6.https://arxiv.org/abs/2504.00934

7.https://arxiv.org/abs/2505.16097

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
欠了快400亿,骂了整十年,华西村硬是靠一笔意外投资活过来了

欠了快400亿,骂了整十年,华西村硬是靠一笔意外投资活过来了

小莜读史
2026-05-07 19:10:59
20岁小伙奔驰试驾70次不买,女销售:你下单,我任你处置,他买后傻眼

20岁小伙奔驰试驾70次不买,女销售:你下单,我任你处置,他买后傻眼

如烟若梦
2025-08-25 18:45:03
董路和孙继海谁的路线正确  为何拿了冠军还被戏称马戏团

董路和孙继海谁的路线正确 为何拿了冠军还被戏称马戏团

体育全天候
2026-06-03 11:49:18
一生拼命的中国80后:再不玩,就老了

一生拼命的中国80后:再不玩,就老了

视觉志
2026-06-02 14:18:48
日股大跌,韩股休市

日股大跌,韩股休市

第一财经资讯
2026-06-03 08:14:45
华为“韬定律”又让国内的赢学家们自嗨起来

华为“韬定律”又让国内的赢学家们自嗨起来

廖保平
2026-06-01 12:30:02
A股:紧急提醒2.5亿股民!从今天6月3日起,A股牛回头或接近尾声?

A股:紧急提醒2.5亿股民!从今天6月3日起,A股牛回头或接近尾声?

趋势清风侠
2026-06-03 08:14:35
神舟二十三号首场天地对话或安排!黎家盈会全粤语担任太空老师?

神舟二十三号首场天地对话或安排!黎家盈会全粤语担任太空老师?

风云圈天气
2026-06-03 09:21:27
俄罗斯官媒中文帐号终于被禁!大V司马南是他的深度合作伙伴

俄罗斯官媒中文帐号终于被禁!大V司马南是他的深度合作伙伴

霹雳炮
2026-06-02 23:18:05
江苏省人社厅、省财政厅最新通知

江苏省人社厅、省财政厅最新通知

句容日报
2026-06-03 06:32:15
只因出了一位美人,这座城市3000年未改名,并沿用至今

只因出了一位美人,这座城市3000年未改名,并沿用至今

长风文史
2026-06-01 18:58:20
帕克:在曼联没人规劝加纳乔吗?他现在600次传球有555次回传

帕克:在曼联没人规劝加纳乔吗?他现在600次传球有555次回传

懂球帝
2026-06-02 20:59:08
刘国梁到底有多狠?弃用郝帅和陈玘,用天才前途换国乒的万无一失

刘国梁到底有多狠?弃用郝帅和陈玘,用天才前途换国乒的万无一失

老玮是个手艺人
2026-03-27 14:46:10
独居老人三个月买900包盐,店家觉异常报警,警方破门后愣了

独居老人三个月买900包盐,店家觉异常报警,警方破门后愣了

灿烂夏天
2025-06-26 11:44:15
烂尾7年,成都绿地468主体结构复工,施工已达370米!

烂尾7年,成都绿地468主体结构复工,施工已达370米!

GA环球建筑
2026-06-03 12:57:31
日菲启动海域划界,赖清德不吭一声挨轰:台湾地区人尽可欺

日菲启动海域划界,赖清德不吭一声挨轰:台湾地区人尽可欺

海峡导报社
2026-06-03 09:58:07
承诺“不限次数”,就该接住顾客的“天天来”

承诺“不限次数”,就该接住顾客的“天天来”

南风不及你温柔
2026-05-16 01:02:57
6月4日,人社部关于2026年调整退休人员基本养老金的通知公布了吗

6月4日,人社部关于2026年调整退休人员基本养老金的通知公布了吗

社保小达人
2026-06-03 09:59:43
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
乐子大了!日菲联合划界,中国顺势管控台海全域

乐子大了!日菲联合划界,中国顺势管控台海全域

超级学爸蛋总
2026-06-02 20:01:39
2026-06-03 15:35:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16786文章数 514995关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

女子称凌晨入睡后银行卡多次被转账损失42万 银行回应

头条要闻

女子称凌晨入睡后银行卡多次被转账损失42万 银行回应

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

依托全域辅助驾驶布局 千里浩瀚助推吉利5月市场大热

态度原创

健康
本地
数码
时尚
公开课

违规干细胞应用,暗藏致命隐患!

本地新闻

用剪纸的方式,打开江苏扬州

数码要闻

搞内容创作需配多大内存?Puget实测16/32/64GB性能差异

休闲T恤舒适感极佳,夏天必不可少!轻轻松松拿捏日常的造型

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版