网易首页 > 网易号 > 正文 申请入驻

研究人员构建临床试验数据库,为开发垂直Agent提供数据源

0
分享至

多年来,美国伊利诺伊大学香槟分校博士毕业生、Keiji.AI 公司联合创始人王子丰一直在研究将 AI 应用于临床试验,并已开展多个相关项目,包括开发用于临床试验系统评价的辅助工具 TrialMind [1] 和 LEADS [2],提升试验招募效率的 TrialGPT [3],支持生物医学数据分析的智能平台 DSWizard [4,5],以及自动生成临床试验文档的系统 InformGen [6]。

在推进这些研究的过程中,王子丰逐渐意识到,尽管制药业内对 AI 在临床试验中的应用充满期待,但仍面临诸多关键挑战。

首先,目前缺乏有效的评估手段,使得大模型难以在临床试验场景中实现可验证、可落地的应用。

其次,真正理解制药行业实践的专业人士与 AI 技术专家之间存在明显的知识壁垒,跨领域协同不足,也限制了技术转化的深度和广度。

而在构建垂直领域模型和 Agent 的过程中,人们又面临着两个根本性的问题:一是缺乏结构清晰、适合 AI 训练的高质量数据资源,二是缺乏贴近真实临床试验任务、能够系统评估模型能力的基准任务集。

业界其实有一些出售临床试验商业数据的公司比如 Citeline,但是这些数据都非常昂贵,一般大型的制药企业可能每年向他们支付数百万美元以上来获取这些信息。而公共数据比如 ClinicalTrials.gov 只包括了在美国注册的试验记录,而很多的多个国家试验记录以及发表的试验都需要被额外收集和标准化处理。

基于上述问题,王子丰等人启动了本项研究,构建了临床试验领域的大规模结构化数据库 TrialPanorama [7],汇聚了试验设计、干预手段、适应症、生物标志物、结局指标等核心要素,并对接权威医学本体,确保数据的一致性与可扩展性。在此基础上,研究团队进一步设计了一套配套的评测任务集,涵盖从文献评价到试验设计的多个关键环节,以用于系统性地评估 AI 模型在临床试验相关任务中的能力。该工作不仅为模型的训练与测试提供了高质量数据支撑,也为后续开发 AI Agent 提供数据源。

如前所述,本次研究的主要成果是构建了一个覆盖广泛、结构清晰的临床试验数据库 TrialPanorama,共收录了来自全球 15 个来源的 1,657,476 条临床试验记录以及汇总这些临床试验的超过 9,000 篇系统评价论文。该数据库系统性地整理了临床试验设计与实施的关键要素,包括研究方案、干预方式、适应症、生物标志物和结局指标等,并与标准医学本体(如 DrugBank 和 MedDRA)进行了对齐,具备良好的规范性与可扩展性。

在此基础上,研究团队还首次设计并发布了一套面向临床试验任务的大模型评测基准,涵盖系统评价和试验设计累计两个类别和八项任务,这八项任务包括研究检索、研究筛选、证据总结、试验组设计、入排标准制定、终点选择、样本量估计及完成情况评估。通过在五个当前最先进的大模型上开展实验,研究团队发现通用模型虽然具备一定的零样本能力,但其表现尚不足以胜任高风险、要求严谨的临床试验场景。

而本次工作不仅提供了一个高质量的数据基础,还构建了可用于训练、评估和推动临床试验 AI 研究的系统平台,有望为开发更具专业性和实用性的智能系统奠定坚实基础。

本次研究成果具有广泛的应用前景,预计能在以下几个方面发挥重要作用:

首先,TrialPanorama 数据库可以作为医药研发和医学事务中基于 AI 的知识发现平台。例如,人们可以借助该数据库检索某一适应症下既往的治疗手段及其结果、正在研发中的同类药物等关键信息,从而辅助制定更科学、更具前瞻性的临床试验方案。

其次,该数据库为训练大模型提供了数据基础。由于其结构清晰、覆盖全面,非常适合用于生成高质量的训练样本,推动更贴近临床场景的专用语言模型的开发。同时,研究团队发布的 benchmark 也为评估现有及未来的大模型在临床试验任务中的表现提供了统一、专业的测试框架。

最后,对于当前越来越多专注于临床试验领域的 AI Agent 系统来说,TrialPanorama 提供了结构化、标准化的数据资源,并可以通过集成模型上下文协议(MCP,Model Context Protocol)服务器实现快速接入与部署,从而助力构建高可靠性、高专业度的垂类 AI Agent,为临床研发带来赋能。

多年前,王子丰就开始研究 AI,同时做一些 AI for healthcare。一开始进入这个方向时,他觉得有很多的“low-hanging fruit”,他认为只要把大模型用上、Agent 搭起来,然后就可以开展很多临床试验的任务。但是,当他真正在项目中和医生、药厂的研发人员、销售等各类角色深度接触之后,王子丰才意识到很多现实中的核心需求,其实并没有被很好地抽象成 AI 问题然后被做 AI 的人们注意到。

这中间有很多令人反思的时刻。比如他经常看到一些很酷炫的大模型demo,但是药厂的合作方告诉他,他们可能也会去尝试一下,然而很多时候实际效果往往不能达到可用的程度,或者说由于公司的合规性要求这些工具还不能够嵌入他们的工作流。

而作为一名 AI 研究者,王子丰认为得学会放下自嗨的技术视角,真正去倾听用户的痛点,理解他们的工作流程、合规限制和实际目标,然后再回过头来重新定义问题,想办法用 AI 去解决。

同时,这个“对话”和“重构”的过程,是王子丰在本次研究之中认为最有价值、也是最难忘的部分。这不仅仅凸显了当前的一些技术挑战,更是对于跨学科协作、产品思维、沟通能力的一种锤炼。

至于创业,它对王子丰来说也是一种自然的延伸。王子丰觉得做应用研究的人去创业其实非常合适。一方面你能从一线看到很多真实又有挑战的问题,另一方面你也有机会把研究成果真正落地,帮助到药厂、医生甚至患者。这种“从问题中来,到应用中去”的过程,非常充实,也让王子丰找到了科研之外的成就感。

正因此,王子丰联合创办了 Keiji.AI,在该公司他主要负责 AI 算法和应用的开发。该公司由王子丰的博士导师 Jimeng Sun 教授领衔,团队成员主要来自美国伊利诺伊大学香槟分校的研究团队。公司致力于将研究团队多年来在 AI 医疗和临床试验领域的研究成果转化。

基于这一背景,研究团队开发了 TrialMind 平台,集成了多种 AI Agent 和工作流程,并接入研究团队自建的 TrialPanorama 数据库,支持临床试验的方案设计、队列抽取、数据分析、患者招募等关键环节的智能化加速。

目前,研究团队的客户和合作伙伴包括多家制药公司(如Takeda、Abbvie、Regeneron)、真实世界数据公司(如 Medidata、Guardant Health),以及大型 CRO(如 IQVIA)。公司正处于快速发展阶段,正在积极推进融资并扩大团队。而基于上述工作,他们正在基于本次数据库开发临床试验的垂类 AI Agent 和模型。

参考资料:

1.https://arxiv.org/abs/2406.17755

2.https://arxiv.org/abs/2501.16255

3.https://www.nature.com/articles/s41467-024-53081-z

4.https://arxiv.org/abs/2410.21591

5.https://arxiv.org/abs/2505.16100

6.https://arxiv.org/abs/2504.00934

7.https://arxiv.org/abs/2505.16097

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
恩德里克娇妻现场观战凯尔特人击败雷霆!场边大方晒美照气质出众

恩德里克娇妻现场观战凯尔特人击败雷霆!场边大方晒美照气质出众

Emily说个球
2026-03-26 15:11:29
张雪峰经典名言 100 条(完整版)

张雪峰经典名言 100 条(完整版)

新浪财经
2026-03-25 06:17:25
张云逸与邓小平相交45年,因何事张云逸说:分别之前还能见你真好

张云逸与邓小平相交45年,因何事张云逸说:分别之前还能见你真好

大运河时空
2026-03-25 15:15:03
为什么只有革命卫队与美以干,而伊朗40万国防军沉默观战?

为什么只有革命卫队与美以干,而伊朗40万国防军沉默观战?

廖保平
2026-03-17 09:04:38
古代用长枪最厉害的四大名将,赵子龙上榜,第一名恐怕无人能敌

古代用长枪最厉害的四大名将,赵子龙上榜,第一名恐怕无人能敌

铭记历史呀
2026-03-26 11:22:56
缺钱了?景甜卖上海黄浦江200平的大平层,价格在1.35亿元

缺钱了?景甜卖上海黄浦江200平的大平层,价格在1.35亿元

椰黄娱乐
2026-03-24 11:36:57
立陶宛请求访华,当面向中方认错?中方已开出条件,做不到就免谈

立陶宛请求访华,当面向中方认错?中方已开出条件,做不到就免谈

临云史策
2026-03-25 21:59:37
张雪峰家属:周六举行追悼会!平时没胸闷、没心脏病,能放心运动吗?医生提醒

张雪峰家属:周六举行追悼会!平时没胸闷、没心脏病,能放心运动吗?医生提醒

上观新闻
2026-03-26 14:45:10
男人的生理需求能有多难忍?网友:我对我老公只有动物本能

男人的生理需求能有多难忍?网友:我对我老公只有动物本能

带你感受人间冷暖
2026-02-07 03:58:56
孙子生日,我转了8888元给儿媳,她回复2个字,我直接冻结银行卡

孙子生日,我转了8888元给儿媳,她回复2个字,我直接冻结银行卡

清茶浅谈
2025-09-07 23:32:29
史前大洪水掩盖什么真相?所有文明都曾记录,是人类共同的记忆?

史前大洪水掩盖什么真相?所有文明都曾记录,是人类共同的记忆?

历史甄有趣
2026-03-20 15:40:07
柯文哲被判重刑,黄国昌蒋万安回应,赖清德又盯上郑丽文?

柯文哲被判重刑,黄国昌蒋万安回应,赖清德又盯上郑丽文?

DS北风
2026-03-26 17:58:06
小摩:降三花智控目标价至42港元 维持“增持”评级

小摩:降三花智控目标价至42港元 维持“增持”评级

财联社
2026-03-26 16:05:03
西甲希望之星杯:巴萨5-0上海海港,皇马4球大胜维达德

西甲希望之星杯:巴萨5-0上海海港,皇马4球大胜维达德

懂球帝
2026-03-26 14:33:09
从欧尔班行为,看北约当年拒绝俄罗斯的远见

从欧尔班行为,看北约当年拒绝俄罗斯的远见

民间胡扯老哥
2026-03-23 18:53:38
谭咏麟32岁儿子近况:智性恋天菜,才貌双全,今在加拿大做工程师

谭咏麟32岁儿子近况:智性恋天菜,才貌双全,今在加拿大做工程师

白面书誏
2026-03-24 14:41:16
事关美国对伊朗动武,外媒最新爆料

事关美国对伊朗动武,外媒最新爆料

环球时报国际
2026-03-25 15:21:08
黑色星期四,黄金直线下跌,原油大幅拉升,港股暴跌,A股大跌!

黑色星期四,黄金直线下跌,原油大幅拉升,港股暴跌,A股大跌!

有范又有料
2026-03-26 16:07:15
国家机密,洲际导弹的制造方法

国家机密,洲际导弹的制造方法

远方青木
2026-03-25 23:55:16
为啥萨哈夫能放生,革命卫队发言人必须被斩首

为啥萨哈夫能放生,革命卫队发言人必须被斩首

移光幻影
2026-03-21 10:13:06
2026-03-26 19:44:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16491文章数 514797关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

房产
本地
手机
游戏
公开课

房产要闻

突发,三亚又有大批征迁补偿方案出炉!

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

手机要闻

狂揽307万!红米杀疯了:K90破150万、Turbo 5破百万,性价比赢麻

《迷你金属2》4月开启开发版测试 军事题材战略模拟

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版