网易首页 > 网易号 > 正文 申请入驻

研究人员构建临床试验数据库,为开发垂直Agent提供数据源

0
分享至

多年来,美国伊利诺伊大学香槟分校博士毕业生、Keiji.AI 公司联合创始人王子丰一直在研究将 AI 应用于临床试验,并已开展多个相关项目,包括开发用于临床试验系统评价的辅助工具 TrialMind [1] 和 LEADS [2],提升试验招募效率的 TrialGPT [3],支持生物医学数据分析的智能平台 DSWizard [4,5],以及自动生成临床试验文档的系统 InformGen [6]。

在推进这些研究的过程中,王子丰逐渐意识到,尽管制药业内对 AI 在临床试验中的应用充满期待,但仍面临诸多关键挑战。

首先,目前缺乏有效的评估手段,使得大模型难以在临床试验场景中实现可验证、可落地的应用。

其次,真正理解制药行业实践的专业人士与 AI 技术专家之间存在明显的知识壁垒,跨领域协同不足,也限制了技术转化的深度和广度。

而在构建垂直领域模型和 Agent 的过程中,人们又面临着两个根本性的问题:一是缺乏结构清晰、适合 AI 训练的高质量数据资源,二是缺乏贴近真实临床试验任务、能够系统评估模型能力的基准任务集。

业界其实有一些出售临床试验商业数据的公司比如 Citeline,但是这些数据都非常昂贵,一般大型的制药企业可能每年向他们支付数百万美元以上来获取这些信息。而公共数据比如 ClinicalTrials.gov 只包括了在美国注册的试验记录,而很多的多个国家试验记录以及发表的试验都需要被额外收集和标准化处理。

基于上述问题,王子丰等人启动了本项研究,构建了临床试验领域的大规模结构化数据库 TrialPanorama [7],汇聚了试验设计、干预手段、适应症、生物标志物、结局指标等核心要素,并对接权威医学本体,确保数据的一致性与可扩展性。在此基础上,研究团队进一步设计了一套配套的评测任务集,涵盖从文献评价到试验设计的多个关键环节,以用于系统性地评估 AI 模型在临床试验相关任务中的能力。该工作不仅为模型的训练与测试提供了高质量数据支撑,也为后续开发 AI Agent 提供数据源。

如前所述,本次研究的主要成果是构建了一个覆盖广泛、结构清晰的临床试验数据库 TrialPanorama,共收录了来自全球 15 个来源的 1,657,476 条临床试验记录以及汇总这些临床试验的超过 9,000 篇系统评价论文。该数据库系统性地整理了临床试验设计与实施的关键要素,包括研究方案、干预方式、适应症、生物标志物和结局指标等,并与标准医学本体(如 DrugBank 和 MedDRA)进行了对齐,具备良好的规范性与可扩展性。

在此基础上,研究团队还首次设计并发布了一套面向临床试验任务的大模型评测基准,涵盖系统评价和试验设计累计两个类别和八项任务,这八项任务包括研究检索、研究筛选、证据总结、试验组设计、入排标准制定、终点选择、样本量估计及完成情况评估。通过在五个当前最先进的大模型上开展实验,研究团队发现通用模型虽然具备一定的零样本能力,但其表现尚不足以胜任高风险、要求严谨的临床试验场景。

而本次工作不仅提供了一个高质量的数据基础,还构建了可用于训练、评估和推动临床试验 AI 研究的系统平台,有望为开发更具专业性和实用性的智能系统奠定坚实基础。

本次研究成果具有广泛的应用前景,预计能在以下几个方面发挥重要作用:

首先,TrialPanorama 数据库可以作为医药研发和医学事务中基于 AI 的知识发现平台。例如,人们可以借助该数据库检索某一适应症下既往的治疗手段及其结果、正在研发中的同类药物等关键信息,从而辅助制定更科学、更具前瞻性的临床试验方案。

其次,该数据库为训练大模型提供了数据基础。由于其结构清晰、覆盖全面,非常适合用于生成高质量的训练样本,推动更贴近临床场景的专用语言模型的开发。同时,研究团队发布的 benchmark 也为评估现有及未来的大模型在临床试验任务中的表现提供了统一、专业的测试框架。

最后,对于当前越来越多专注于临床试验领域的 AI Agent 系统来说,TrialPanorama 提供了结构化、标准化的数据资源,并可以通过集成模型上下文协议(MCP,Model Context Protocol)服务器实现快速接入与部署,从而助力构建高可靠性、高专业度的垂类 AI Agent,为临床研发带来赋能。

多年前,王子丰就开始研究 AI,同时做一些 AI for healthcare。一开始进入这个方向时,他觉得有很多的“low-hanging fruit”,他认为只要把大模型用上、Agent 搭起来,然后就可以开展很多临床试验的任务。但是,当他真正在项目中和医生、药厂的研发人员、销售等各类角色深度接触之后,王子丰才意识到很多现实中的核心需求,其实并没有被很好地抽象成 AI 问题然后被做 AI 的人们注意到。

这中间有很多令人反思的时刻。比如他经常看到一些很酷炫的大模型demo,但是药厂的合作方告诉他,他们可能也会去尝试一下,然而很多时候实际效果往往不能达到可用的程度,或者说由于公司的合规性要求这些工具还不能够嵌入他们的工作流。

而作为一名 AI 研究者,王子丰认为得学会放下自嗨的技术视角,真正去倾听用户的痛点,理解他们的工作流程、合规限制和实际目标,然后再回过头来重新定义问题,想办法用 AI 去解决。

同时,这个“对话”和“重构”的过程,是王子丰在本次研究之中认为最有价值、也是最难忘的部分。这不仅仅凸显了当前的一些技术挑战,更是对于跨学科协作、产品思维、沟通能力的一种锤炼。

至于创业,它对王子丰来说也是一种自然的延伸。王子丰觉得做应用研究的人去创业其实非常合适。一方面你能从一线看到很多真实又有挑战的问题,另一方面你也有机会把研究成果真正落地,帮助到药厂、医生甚至患者。这种“从问题中来,到应用中去”的过程,非常充实,也让王子丰找到了科研之外的成就感。

正因此,王子丰联合创办了 Keiji.AI,在该公司他主要负责 AI 算法和应用的开发。该公司由王子丰的博士导师 Jimeng Sun 教授领衔,团队成员主要来自美国伊利诺伊大学香槟分校的研究团队。公司致力于将研究团队多年来在 AI 医疗和临床试验领域的研究成果转化。

基于这一背景,研究团队开发了 TrialMind 平台,集成了多种 AI Agent 和工作流程,并接入研究团队自建的 TrialPanorama 数据库,支持临床试验的方案设计、队列抽取、数据分析、患者招募等关键环节的智能化加速。

目前,研究团队的客户和合作伙伴包括多家制药公司(如Takeda、Abbvie、Regeneron)、真实世界数据公司(如 Medidata、Guardant Health),以及大型 CRO(如 IQVIA)。公司正处于快速发展阶段,正在积极推进融资并扩大团队。而基于上述工作,他们正在基于本次数据库开发临床试验的垂类 AI Agent 和模型。

参考资料:

1.https://arxiv.org/abs/2406.17755

2.https://arxiv.org/abs/2501.16255

3.https://www.nature.com/articles/s41467-024-53081-z

4.https://arxiv.org/abs/2410.21591

5.https://arxiv.org/abs/2505.16100

6.https://arxiv.org/abs/2504.00934

7.https://arxiv.org/abs/2505.16097

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

赖昌星前妻近状曝光:拒绝政府安置,独居3000平老宅,只做一件事

人生录
2026-06-01 13:52:39
中国降格参会,和美国没什么好谈的,让赫格塞思自顾自的表演去吧

中国降格参会,和美国没什么好谈的,让赫格塞思自顾自的表演去吧

漫步独行侠
2026-06-02 08:29:38
台当局对日菲启动海域划界谈判予以肯定,外交部:彻头彻尾的民族败类

台当局对日菲启动海域划界谈判予以肯定,外交部:彻头彻尾的民族败类

海峡导报社
2026-06-02 16:15:16
“根本不敢开空调”! 大量一汽大众新车狂喷粉末:4S店想“封口”,官方称“无害”遭专家反驳

“根本不敢开空调”! 大量一汽大众新车狂喷粉末:4S店想“封口”,官方称“无害”遭专家反驳

新浪财经
2026-06-02 17:38:32
肇庆男童深山走失13天奇迹生还!靠野果生存,获救紧搂救援者

肇庆男童深山走失13天奇迹生还!靠野果生存,获救紧搂救援者

奇思妙想草叶君
2026-06-02 19:15:06
94版《三国演义》司马懿饰演者魏宗万去世,享年89岁

94版《三国演义》司马懿饰演者魏宗万去世,享年89岁

新京报
2026-06-02 20:07:01
31岁乌克兰宝妈6次止步法网8强!怒批俄罗斯:昨晚我们有人被炸死

31岁乌克兰宝妈6次止步法网8强!怒批俄罗斯:昨晚我们有人被炸死

风过乡
2026-06-03 06:39:12
央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

央视再曝新毒物!长期用会致癌,已流窜至全国,不少婴儿孕妇中招

做一个合格的吃瓜群众
2026-06-02 14:36:43
炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次八百到几万

炸裂!捐精有多乱,双方直接在宾馆完成怀孕过程,一次八百到几万

就一点
2026-06-02 15:45:51
美军在波斯湾袭击一艘油轮

美军在波斯湾袭击一艘油轮

新华社
2026-06-03 06:09:03
“三哥,你尾款我不要了!”中国外贸人反杀印度老赖,招招绝了!

“三哥,你尾款我不要了!”中国外贸人反杀印度老赖,招招绝了!

墨印斋
2026-06-02 23:18:53
一公务员被指玩弄女性感情,两米多高易拉宝摆放在财政局门外,佛山市财政局回应

一公务员被指玩弄女性感情,两米多高易拉宝摆放在财政局门外,佛山市财政局回应

深圳晚报
2026-06-02 14:20:18
肠子悔青!《给阿嬷的情书》男主嫌剧组太简陋跑路,错失10亿票房,深夜痛哭再求合作

肠子悔青!《给阿嬷的情书》男主嫌剧组太简陋跑路,错失10亿票房,深夜痛哭再求合作

科学发掘
2026-06-03 07:05:34
Shams:库里与李宁10年合同总价超4亿美元,他曾拒绝更丰厚报价

Shams:库里与李宁10年合同总价超4亿美元,他曾拒绝更丰厚报价

懂球帝
2026-06-03 09:53:28
买了34层一套房 收房时得知只建到32层;开发商仲裁代理人:“当时是计划建设到34层,但盖到32层就不让盖了”

买了34层一套房 收房时得知只建到32层;开发商仲裁代理人:“当时是计划建设到34层,但盖到32层就不让盖了”

大风新闻
2026-06-03 08:06:11
运动员哪能这么白这么露?铁三女神冯竟爽再次夺冠,回击流言蜚语

运动员哪能这么白这么露?铁三女神冯竟爽再次夺冠,回击流言蜚语

杨华评论
2026-06-03 02:20:48
奚梦瑶大婚晚宴现场曝光,穿89年生日古董礼服,何猷君增高鞋出圈

奚梦瑶大婚晚宴现场曝光,穿89年生日古董礼服,何猷君增高鞋出圈

烟浔渺渺
2026-06-03 01:26:14
“爸妈,我开辅助驾驶,你们放心”:一家三口全死了,智驾1分钟

“爸妈,我开辅助驾驶,你们放心”:一家三口全死了,智驾1分钟

江山挥笔
2026-06-02 18:47:02
“豪门背景”瞒不住!网传家有矿产、北京豪宅,真实现状根本不是

“豪门背景”瞒不住!网传家有矿产、北京豪宅,真实现状根本不是

黔乡小姊妹
2026-06-03 08:11:30
王守业贪污1.6亿,2005年“双规”后却被放出,他叫嚣:我摆平了

王守业贪污1.6亿,2005年“双规”后却被放出,他叫嚣:我摆平了

帝哥说史
2026-06-02 21:40:03
2026-06-03 10:59:01
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16783文章数 514993关注度
往期回顾 全部

科技要闻

员工抗议键鼠追踪,Meta让步:可暂停30分钟

头条要闻

牛弹琴:中国一邻国正在疯狂表演 严重伤害中国人感情

头条要闻

牛弹琴:中国一邻国正在疯狂表演 严重伤害中国人感情

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

著名演员魏宗万去世!曾演活司马懿

财经要闻

左手通胀右手衰退,欧美当下的困局

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

艺术
亲子
家居
教育
本地

艺术要闻

二十年前割麦的场景

亲子要闻

可愛小豬歡樂歌

家居要闻

流线型轮廓 包容多元身形

教育要闻

小学几何题,难倒了不少的家长和学生,换个思路试试

本地新闻

用剪纸的方式,打开江苏扬州

无障碍浏览 进入关怀版