![]()
作者:Paul S. Conyngham 是一位拥有机器学习背景的 AI 从业者,目前经营 AI 咨询业务。因爱犬 Rosie 罹患癌症,他以“公民科学家”的方式深度参与犬类个体化抗癌治疗实践,推动基因测序、生信分析、伦理审批、mRNA 疫苗设计及多方科研协作。此次引发广泛关注的 Rosie 案例,也让他成为 AI 与精准医疗交叉应用中的代表性实践者之一。
![]()
以下为他撰写的文章的翻译版本。
![]()
大家都在问,这是怎么做到的。这里一次说清楚。
第一部分:Rosie 的故事
2023 年 6 月:
大约三年前,Rosie 的情况开始不对劲。她的头部和腿上出现了肿胀的肿块,而且明显已经让她感到不适。在接下来的 11 个月里,一共带她去看了三次兽医。但每一次,兽医的态度都很敷衍,也始终没有作出癌症诊断。
2024 年 5 月:
到了这个时候,肿胀已经变得很严重,甚至开始出血。于是强烈要求兽医认真处理。Rosie 随后接受了手术,切除了肿胀的肿块,并做了活检。也就是在这时,癌症才终于被确诊。整整晚了 11 个月。
致命的预后摆在面前,只剩两个选择:接受现实,或者拼尽一切。
于是开始借助 ChatGPT,疯狂吸收一切能找到的知识,试图真正理解癌症,弄清楚还能做什么。与此同时,还得继续全职工作,经营一家 AI 咨询公司。
确诊之后,在最初完成一轮研究后,又和一位新的兽医讨论接下来怎么办。Rosie 最初接受的是:
化疗——非常昂贵。
标准自体免疫疗法——效果不佳。
2024 年 7 月:
为了寻找更好的治疗方案,最终选择了一家高端兽医诊所。结果非常成功,通过手术切除了很多较大的肿块。但仍然剩下一个大肿块——如果要切除它,就需要截肢。反复权衡之后,最终决定不这么做。
那家诊所很专业,但后续治疗费用根本承担不起。后来在一位朋友推荐下,找到了同样也是兽医的 Dr. Mina Ghaly。
![]()
图 1:Rose at Rosies
2024 年 8 月:
Dr. Ghaly 是整个故事里最不该被忽视的人之一。
他是唯一一个真正愿意接纳“公民科学家”的兽医。正是这位新兽医,为后面很多事情的推进提供了关键支持。差不多也是在这时,这场关于癌症药物研发的理解之旅才刚刚真正开始。此前已经知道,AlphaFold 一直被认为能加速靶向抗癌疗法的发现,所以就想弄清楚,这件事是否也适用于 Rosie 的案例。围绕这个问题,继续向 ChatGPT 深入追问,而它给出的第一步建议,是同时对 Rosie 的正常 DNA 和癌细胞 DNA 做基因组测序。
2024 年 9 月 — 2025 年 1 月:
癌症仍在持续扩散,必须尽快建立一套新的治疗方案。
ChatGPT o1 识别出 University of New South Wales(UNSW)的 Professor Martin Smith 是基因组测序方向的负责人。
最终使用的是 1 月采集的组织样本。这里所说的基因测序,并不是 23andMe 那种用口腔拭子做部分位点检测,而是完整的全基因组测序,并且对组织和提取出的 DNA 的保存方式都有严格要求。组织样本是亲自从兽医那里开车送到 Garvan Institute 的。Pavel Bitter 团队在 Garvan Institute 对 DNA 提取起到了关键作用。之后,这些 DNA 又被快递送往 UNSW 的 Ramaciotti Centre,由 Professor Martin Smith 完成测序工作。这个环节是整个深科技流程中最关键的步骤之一。要知道,仅仅几十年前,这样的工作成本还可能高达十亿美元以上,而如今价格正在快速下降,速度也大幅提高。
![]()
图 2:用于运输 Rosie 组织与 DNA/RNA 样本的干冰箱
2025 年 2 月—5 月:
拿到原始 DNA 数据之后,真正的数据分析才全面展开。Gemini、Grok 和 ChatGPT 都被用于设计数据转换流程。最后,团队在 c-KIT 基因中找到了一个突变,这正是肥大细胞癌已知的驱动因素之一。随后又借助 AlphaFold 2,对 Rosie 突变后的 c-KIT 蛋白进行了建模和理解。换作 9 年前,这一步还需要借助晶体学等高度专业化的实验技术才能完成。
![]()
图 3:使用 AlphaFold 2 渲染出的 Rosie 正常 c-KIT 蛋白 3D 模型
2025 年 6 月—7 月:
当时的目标,是利用一个配体去关闭这个 c-KIT 突变,从而阻止癌细胞无序生长。既然已经找到了潜在的致癌突变,接下来就有两条路径可以考虑:
先解释一下,什么是配体?
→ 配体就是一种能够特异性结合到更大“靶分子”(通常是蛋白质)上的分子,以实现某种功能。
(A)使用遗传算法——一种数值优化方法——去发现一个全新的配体。通过拼接更多脚本和仿真引擎,确实开发出了一个在模拟中有效的候选物。可如果真要往下走,从培养皿实验、到小鼠模型、再到犬类试验,可能还得花上好几年。考虑再三后,鉴于 Rosie 的时间已经不允许,加上新型配体的审批和风险都太高,这条路最终被放弃。不过,这个候选配体依然存在。如果未来监管环境跟得上,它也许还有机会派上用场。
(B)对一个包含 100 多万个现有配体的库进行分子对接,寻找匹配项。
连续跑了两周、筛了 100 万个候选之后,终于找到了一个匹配物。当时感觉终于找到了可能真正可行的方案,但这条路也很快开始崩塌。因为匹配到的是一个已经申请专利的现有化合物。这意味着,不管是使用还是合成它,都存在巨大的法律障碍。
后来还是联系了专利持有人,试图申请一项同情使用豁免,希望绕开现有法律路径。对方可以理解地认为风险太高,最终拒绝了。
那是一个非常低落的时刻。已经走了这么远——做了正常 DNA 和癌症 DNA 的测序,调用最先进的工具开发治疗候选物,找到了现成的已知化合物。感觉几乎把整个可能性空间都穷尽了,但结果依旧像是在说:命运不允许。
2025 年 8 月:
在花了两周优先陪伴 Rosie、尽量珍惜相处时间之后,一个想法突然冒了出来:“有没有可能,自己做一支疫苗?”
那天晚上,和 ChatGPT 反复讨论各种可能性。最后逐渐收敛到看起来最靠谱的一条路:肽类新抗原疫苗(peptide neoantigen vaccine)。
疫苗思路与配体对接是一次根本性的转向。配体对接更多是试图阻断推动癌症生长的蛋白;而疫苗,则是让免疫系统重新识别癌细胞,并主动清除它们。
随后给 Professor Martin Smith 发了邮件,他把这件事介绍给了 Dr. Deborah Burnett。Dr. Burnett 表示,自己虽然没有肽类新抗原疫苗的经验,但有 mRNA 疫苗方面的经验。这再次说明,整个过程之所以能推进,离不开人类专家与聊天机器人之间不断来回碰撞的思路流动。根据 Dr. Burnett 的建议,又回头去问 ChatGPT,得到的结论是:mRNA 路线会更快。
于是并行启动了两条流程:
• mRNA 疫苗构建开发
• mRNA 疫苗伦理审批
2025 年 9 月—10 月中旬:
疫苗开发
大约在 9 月初,一个生长非常快的肿瘤必须被切除。这正好给了 RNA 提取和测序的机会。
于是,又来了一遍:
组织冰镇保存,送到 Pavel Bitter 团队所在的 Garvan Institute;RNA 快递到 UNSW;再由 Professor Martin 团队所在的 UNSW Ramaciotti Centre 完成测序。
![]()
图 4:Rosie 的 RNA,在测序前放在 PCR 管中等待
回到数据分析阶段后,最终将范围缩小到 7 个在 mRNA 和 DNA 中都高度存在的表位(epitopes)。这组交集就是整个案例里的“冒烟枪”。因为 mRNA 表达反映的是细胞实际在生产什么蛋白,因此这 7 个靶点,是最有可能触发强烈免疫反应的候选目标。
为了让大家感受一下当时的处境,不妨试试让喜欢的大模型聊天机器人随便列出 7 个表位。只是做演示,这里给出 Gemini 随机生成的 7 个表位:
![]()
图 5:7 个示例表位。注意,它们并不是 Rosie 的。
再比如,只要把上面这些表位丢给 Gemini,让它生成一个疫苗构建体,它就能给出类似下面这样的方案。需要说明的是,这个构建体并不是唯一答案,它会随着优化目标不同而变化:
PADRE—GPGPG—WITQCFLPVFLAQP—GPGPG—GVGSPYVSRLLGICL—AAY—KVAELVHFL—AAY—FLWGPRALV—AAY—SLLMWITQC—AAY—KIFGSLAFL
完全可以拿自己喜欢的聊天机器人,试着做一个属于自己的疫苗构建体。
而在 Rosie 的实际案例里,使用的是 Gemini 2 Pro 来设计多表位疫苗构建体,加入了优化过的 linker 和 adjuvant。之后,又用 Grok 3 做了第二轮启发式优化,确保结构更稳定,同时尽量降低连接位点带来的非目标免疫原性。
免责声明:上面列出的疫苗构建体仅用于教育展示,不代表可被用于药物开发,也不构成任何治疗方案的一部分。
![]()
图 6:Rose 在 UNSW Ramaciotti for Genomics,拍摄于用于 mRNA 测序的那次手术后几天
伦理审批(2025 年 9 月—10 月中旬)
伦理审批流程几乎成了第二份全职工作。除了本职工作之外,还额外投入了约 120 小时处理各种材料。为了扛住这个负担,再次转向聊天机器人,完成了一次非常关键的战术转变:借助它们去拆解那些晦涩难懂的法律术语和模糊不清的监管语言,以拿到试验许可。
UNSW 本身具备开发疫苗的能力,但并没有针对这种“n=1”单病例试验的流程。如果从头建立一套新流程,至少要等到 2026 年中。Rosie 根本等不起。
到那时为止,之前所做的一切已经被视为非常不寻常。UNSW 和一些本地媒体在 2025 年 7 月就报道过这件事,尽管当时还没有引发全球关注。但已经有一些专家开始关注。后来,这件事成功引起了 Dr. Mari Maeda 的注意。她来自美国的 Canine Cancer Alliance,几乎可以说是全球犬类癌症领域最权威的人物之一。
Dr. Maeda 又把这件事介绍给了 University of Queensland 的 Professor Rachel Allavena。而 Professor Allavena 手里正好已有一个兼容的试验审批。Google Meet 通话里,表面上表现得很淡定,只是庆幸试验终于能推进了。实际上,挂掉电话之后,激动得狠狠干了一通胜利式挥拳,差点把 Rosie 对雷声的恐惧都吓出来。
2025 年 10 月—11 月:
试验文件全部完成后,UNSW 的 Professor Pall Thordarson 及其团队终于可以开始生产疫苗。经过 6 周的专业工作,疫苗准备好了。
2025 年 12 月:
出发的时候到了。Rosie 跳上车,一路向北。开了 10 个小时去 Queensland 准备开始治疗。但完全没料到,真正相关的校区距离 Brisbane 还要再开 4 个小时。
终于抵达 University of Queensland 的兽医学院后,一切都准备就绪:
• 一款专门设计的 mRNA 疫苗:一件精准制导武器,用来打击癌症。其整体流程由 ChatGPT o1 设计,候选开发由 Gemini Pro 2 实施,最终方案再由 Grok 3 Thinking 完成验证。
• 配套支持药物:用于削弱癌症的防御机制。没有这些药物,mRNA 疫苗往往会被肿瘤环境直接弹开,或者在真正碰到癌细胞之前就被抵消掉。
2026 年 1 月:
治疗三周后,癌变区域开始肿起来——这其实是个好迹象,叫做假性进展(pseudoprogression)。意味着 T 细胞正在大规模涌入。
六周后,其中两处癌变区域开始缩小。
2026 年 2 月:
这两处区域,尤其是 Rosie 腿部周围,看起来已经开始恢复正常。还残留着一些平整的小凸起,推测那是已经死亡的癌细胞残留形成的瘢痕组织。
不过,尽管腿部肿瘤在缩小,Rosie 臀部附近仍有一个肿块继续增长。后来这个肿块被手术切除,并再次送去做基因组分析。
2026 年 3 月:
3 月 8 日——来自这个“无反应肿瘤”的数据到了,开始分析。
3 月 10 日——早期迹象显示,这个无反应癌灶与最初为疫苗设计所针对的癌灶之间,可能存在差异。
3 月 11 日——这个故事在澳大利亚曝光。
3 月 12 日——故事在 X 上迅速引爆。
过去一周几乎是一场旋风。三年前,第一次发现 Rosie 需要帮助。之后做了所有能做的事。幸运的是,本身有机器学习背景,也幸运地赢得了一些世界级专家的信任,他们愿意相信这件事值得一试。
如果没有 AI 聊天机器人,这一切不可能以这样的速度发生。
第二部分:AI 的故事
接下来,回应一下关于“AI 到底做了什么”的争论。
这绝不是把 DNA 上传到 ChatGPT,然后输入一句“请别出错,帮忙做个疫苗”那么简单。
整个过程花了几个月时间。用到了 ChatGPT、Gemini 和 Grok——它们在不同阶段,各自承担不同任务。
AI 完成的最难部分,是核心科学工作:把原始基因组数据一步步转化成可用于制备疫苗的处方。
起点,是大约 300GB 的原始测序数据——包括 Rosie 肿瘤样本的全基因组测序、一个配对正常血液样本,以及后来补做的肿瘤 RNA 测序。最终输出,只有大约半页纸:一份编码 7 个新抗原靶点的 mRNA 疫苗构建体。
作为一个非生物学背景的人,极大依赖聊天机器人来帮助设计生信分析流程,也借助它们大量完成了流程的实现。
下面这些,是理解整个过程所涉及的核心工具。对大多数读者来说,这份清单可能只会带来更多问题。哪怕已经为这件事投入了一年多时间,也还是花了好几个月才真正理解它们。所以直接列出来:
• BWA-MEM:用于比对
• GATK Mutect2(一种贝叶斯体细胞突变模型):用于变异检测
• Ensembl VEP:用于注释
• pVACseq + NetMHCpan-4.1:一个神经网络系统,用来预测突变肽是否会与 Rosie 特定的免疫分子(DLA 等位基因)结合
后来逐渐意识到,这些本质上就是人类精准肿瘤学流程中所使用的那一类工具。
接下来,又使用 RNA 测序数据去验证 DNA 预测得到的那些靶点,确认这些突变确实正在肿瘤中被表达。只有那些得到 RNA 表达确认的表位,才被最终保留下来。它们随后构成了送去实验室合成的疫苗设计基础。
这些工具的实现和使用,很可能本来就是许多研究机构里研究生和博士后层级的工作内容。可问题在于,不应该人人都必须掌握这些复杂知识,才有资格使用这些工具。整个流程本来不该这么难。
![]()
图 7:Rose v Skippy
那么,聊天机器人到底做了什么?
它们不可或缺——但不是大家以为的那种方式。
规划与流程设计:
使用 ChatGPT 和 Gemini 搭建整个生信工作流:该用哪些工具、按什么顺序、输入和输出分别是什么。
故障排查:
工具频繁出错,而且是那种持续不断的出错——依赖冲突、参考基因组不兼容、注释格式不匹配。于是反复依靠聊天机器人协助调试。犬类基因组的注释远不如人类完善,而许多工具默认就是按人类数据设计的。几乎每一步都充满摩擦。
候选筛选与构建设计:
Grok 帮忙筛选表位候选物,之后又参与把最终确认的靶点转成 mRNA 疫苗构建体,也就是那条真正送去制备的序列,包括 linker、UTR,以及针对犬类细胞的密码子优化。
治疗方案设计:
ChatGPT 和 Gemini 帮助设计整套多模态治疗流程,反复推演药物相互作用、给药时序、免疫协同效应,以及不同治疗阶段如何分步展开。这部分围绕药理学、肿瘤免疫学和兽医肿瘤学,持续讨论了数周。
教育:
并不是生物学家。聊天机器人一步步解释:癌症在分子层面到底是什么、新抗原是什么、MHC/DLA 分子在做什么、什么叫 trunk mutation 和 branch mutation、什么是肿瘤微环境,以及这些概念为什么重要。
伦理、合规与协调:
聊天机器人还帮助撰写了约 100 页的伦理审批文件,梳理澳大利亚不同州之间的监管逻辑,并协调多所大学之间的流程。
而且,疫苗并不是单独使用的。
聊天机器人还帮助设计了一整套多模态免疫治疗策略,不只是疫苗本身,而是整个围绕疫苗展开的免疫系统作战方案:
• 一款个体化 mRNA 新抗原疫苗:编码 7 个靶点,训练 Rosie 的 T 细胞识别并杀死她特定的癌细胞
• 一种酪氨酸激酶抑制剂(TKI):针对 Rosie 的 c-KIT 突变,在基础层面持续对肿瘤施压,同时调节肿瘤微环境
• 一种 PD-1 检查点抑制剂:解除 T 细胞的“刹车”,释放它们对癌细胞的杀伤能力
网上已经看到不少评论,说真正起作用的可能只是 PD-1 抑制剂,或者只是 TKI。这种看法,实际上误解了癌症是如何运作的。肿瘤并不是安静地待在那里等着被杀死,它会主动搭建一个压制性的微环境,操控周围免疫细胞,为自己长出血供,并且躲过免疫系统的识别。
如果用《星际迷航》来打比方,肿瘤微环境就像飞船的护盾。
就算发射再多“光子鱼雷”——也就是经过 mRNA 训练的 T 细胞——只要护盾还在,一切攻击都会被挡下来。
没有任何一种单独疗法,能独自打穿癌症的“护盾”。
TKI 和 PD-1 抑制剂都在拆盾,但角度不同。
TKI 针对的是肿瘤的“后勤基础设施”。癌症需要血管来供养自己,也会主动长出新血管,这个过程叫血管生成(angiogenesis)。TKI 会阻断这一过程,让肿瘤失去营养和氧气供应。同时,它还会直接抑制驱动癌症增长信号的 c-KIT 突变。
如果用《星际迷航》的语言来讲,这就像是在关闭敌舰引擎,同时切断生命维持系统。
PD-1 抑制剂解决的是完全不同的问题。癌细胞表面会展示一种蛋白,向接近它们的、已经受过 mRNA 训练的 T 细胞发出“解除战斗”的信号,相当于命令免疫系统士兵收起武器。PD-1 抑制剂会阻断这个信号,让 T 细胞不再被欺骗、不再后退。
如果说 TKI 是从外部拆盾,那么 PD-1 抑制剂就是从内部让护盾系统失效,让肿瘤再也无法对前来攻击它的细胞“隐身”。
当两者一起启动——TKI 加上 PD-1——护盾被拆掉了,而 mRNA 训练出的 T 细胞“光子鱼雷”就能真正命中目标。
这些疗法的顺序和时机极其重要。免疫抑制治疗、TKI、PD-1 和激活免疫系统的 mRNA 疫苗,不能简单混在一起给。ChatGPT 和 Gemini 帮助反复推演药理相互作用、减量节奏,以及几周时间尺度上的分阶段推进方式。
聊天机器人没有做的事:
它们没有采集样本;没有分离或测序 DNA;没有实际制造疫苗;也没有给 Rosie 注射治疗。整个过程依然离不开大量优秀科学家,包括:
• Professor Pall Thordarson(UNSW mRNA Institute):负责制造疫苗
• Professor Rachel Allavena 与 Dr. José Granados(University of Queensland):负责实施治疗
• Professor Martin Smith:在整个生信流程中提供专家指导
总结一下:
聊天机器人让一个普通个体,在规划、教育、故障排查、合规,以及把基因组数据转成疫苗处方、再围绕它设计治疗方案这些工作上,具备了接近研究机构的行动力。但整个过程中,每一步都离不开人类专家。真正让这件事成为可能的,是两者的结合。
![]()
图 8:Rose 在悉尼一家本地餐馆附近,希望能分到一点食物
第三部分:接下来会发生什么
自从 Rosie 确诊以来,已经尽了一切所能去帮助她。可这件事后来的反应——来自外界的巨大支持,以及成千上万条来自焦急狗主人们的信息——让一件事变得非常清楚。
Rosie 接受的是一套完全个体化、且多模态的 mRNA 癌症治疗方案。
一只狗,一支疫苗,从零开始定制。
而在治疗开始 3 个月后,她已经表现出明显改善的迹象。
那反而还算是容易的部分。
一直反复在想的是:为什么走到今天,必须先变得这么痴迷、这么执着,才有机会抵达这里?
这里面有太多不必要的门槛。
有太多本来应该更容易被使用的技术和工具。
科学已经存在。
AI 也已经存在。
真正缺失的,是把它们变得“可触达”。
这些年来,常常和朋友讨论,到底应该创办一家什么样的 AI 公司。大概 3 个月前,有个朋友说了一句:
“你为什么还在问这个问题?你真正该做的,不就是帮助别人完成你为 Rosie 做过的这一切吗?”
那时并没有完全被说服。毕竟,确实做了很多,也因此争取到了更多尝试的可能,但当时还没有真正的突破。可现在,治疗进行了 3 个月,Rosie 正在好转,而社区的回应也远超想象。
所以,真正困难的部分,才刚刚开始。
过去一周,一直在和所有参与者沟通,试图弄清楚:这整套流程,到底有没有可能被做得更可扩展?
结论是:有可能。
这会是下一章节的开始。
它从一只狗开始。
但绝不会只停留在一只狗。
很快,会有更多内容分享。
Best,
Paul
云头条声明:如以上内容有误或侵犯到你公司、机构、单位或个人权益,请联系我们说明理由,我们会配合,无条件删除处理。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.