“现在我们去陌拜医生,花10秒钟介绍演示,基本上100%都会下载这个产品。”
1月中旬,在位于杭州城西的阿里健康总部,极少在媒体前露面的CTO祥志接受了《健闻咨询》的独家专访。
大概半年前,阿里健康在手机应用商城悄无声息地上线了一款名为“氢离子”的AI原生APP,主要面向医生群体,功能定位类似于美国的医疗AI独角兽——OpenEvidence。
那时候,大洋彼岸的OpenEvidence刚完成B轮融资,估值35亿美元,“医生版ChatGPT”的故事尚未完全展开。
对于以医药电商和C端用户为基本盘的阿里健康来说,这更像是一次未知的冒险——为医生提供循证医学下的决策支持,并不在其主营业务的雷达范围之内。相比之下,预问诊、医生数字分身,乃至院外场景中的AI健康管家,都能为传统的线上药品交易带来更多的商业机会和增长空间。
此后的半年时间里,阿里健康不做产品宣发,婉拒媒体采访,把“氢离子”的曝光度降到最低。他们只做了一件事——邀请不同层级的医生进行产品内测,再根据反馈迭代优化。
如果我们把视线再拉长一点,从2022年底ChatGPT引爆大语言模型的技术浪潮以来,阿里健康就似乎一直潜伏于水面之下:不搞自研大模型发布,不参与专业榜单评测、没有具体的AI产品形态,公司高管也不在公开场合谈论此事。
当其它互联网大厂和医疗创业公司以“月”为单位高调举办发布会,迭代旗舰级产品时,阿里健康的回应,仅仅是在财报中点缀几句抽象的表态。
采访当天,阿里旗下大模型产品“千问”APP的发布会也在同一园区举行。发布会一结束,休息区里全是埋头赶稿的记者,几分钟后,“千问官宣全面接入淘宝、支付宝、飞猪、高德”等阿里全系业务的消息第一时间刷爆社交网络。
喧闹之外,阿里健康一头扎进了门槛更高的医疗垂类。
事实上,在产品研发层面,“氢离子”和通义千问走得无比地近——它甚至不是基于通义的公开模型,而是两边的技术团队在最原始的通义模型之上,针对每一个具体问题,从头对接需求,商讨调优方案。
“我们做这件事,最大的挑战是用流量和互联网的思维去讨论规模的问题。”在祥志看来,医疗的本质是决策,决策的本源是医生,中国500万医生,如果只看流量,天花板一定是低的,但没有哪一家医院会天天喊自己有多少DAU(日活跃用户数)。
“关键是你能影响多少医疗行为的决策,这是今天我们最看重的事。”
基于这个核心理念,我们和祥志聊了聊阿里健康对“氢离子”的战略定位,我们想知道这个“非典型”的APP是如何在公司内部立项、讨论、最终被决策层认可;我们还聊了聊如今估值120亿美元的OpenEvidence,阿里健康能否走出差异化路径,并在中国的医疗体系里找到生态位的缝隙。
至少在这一刻,我们都是相信的。
医生愿意用,产品的拐点就到了
《健闻咨询》:能不能用最简单的三句话,介绍一下“氢离子”这款APP?
祥志:我们出去介绍产品的时候,基本还是讲人话的。第一句,这是医生版的ChatGPT,或者是医生版的DeepSeek;第二句,我们是严格医学循证下的问答产品,和通用大模型相比,我们的幻觉率要低很多;第三句,我们会说自己是为中国医生打造的,更本土化的医学循证AI。
我们希望成为“解决中国500万医生一切医学问题的医学AI”。
《健闻咨询》:现在行业里模仿OpenEvidence的产品其实还挺多的,“氢离子”有什么不一样?
祥志:本质上来说,大家想解决的问题其实是没有差异的,都是通过严格的循证医学加AI的方式,为医生的临床诊疗和科研提供帮助。但我们觉得在产品的体验上还是会有区别。
我举一个最简单的例子,国内友商,包括OpenEvidence,大家的first token,基本是在10秒钟左右。也就是说,你输入问题,大概要等10秒,模型才会蹦出第一个词。我们基本上做到了3秒钟,在输出质量接近的情况下,这是很大的不同。
另外一个维度是模型的幻觉率。比如说严重幻觉率吧,我们自己的定义是,如果模型给出了7个观点结论,其中有一半以上是错的,那就属于严重幻觉。我可以给你一个定性的结论,在严重幻觉率上,我们和OpenEvidence基本持平,比国内的竞品领先2-3倍。
《健闻咨询》:这个产品是从什么时候开始立项的,做了多久?
祥志:我们内部的立项时间是2024年的年底。当时,我们觉得这个方向蛮有意思的,就组了一个团队,花了四五个月时间做了一个DEMO。做出来以后,我们给医生去试用,收到一些反馈,验证了我们对医生的洞察和行业的判断是对的,之后就更笃定了。
项目投入持续到2025年年中的时候,我们拿着产品去和决策层汇报,讲了大致的产品逻辑、用户反馈,以及国内外的一些情况。汇报完以后,公司决策层就拍了板,觉得这件事可以当成公司的战略来干。
《健闻咨询》:去年7月就上升到公司战略级别了,为什么到今天才愿意出去讲?
祥志:因为我们觉得时机还没到。
D端的AI应用和C端不同,我们需要针对幻觉率问题反复调优。C端产品的幻觉高,大多数用户是难以辨别的。但医生有敏锐的判断能力,一个垂类大模型,答案对、证据对,还要具有时效性、权威性,且完整不能有遗漏,这是非常不容易的事情。
所以,面向医生的AI产品,容错率极低,一旦发生超过两次错误,医生就放弃使用了。
我们今天愿意出来讲,是因为通过医生端的反馈,我们确信产品效果的拐点已经到了。今天我们在线下碰到一个医生,完全不认识,也没有什么关系,我只要花10秒钟给他讲完我们的产品,演示一遍,他一定会安装,这个命中率基本是100%。还有很多三甲医院的医生使用后发来了好评,并希望我们提供更多的试用会员能给到科室同事或者朋友用。
《健闻咨询》:这10秒钟,你会怎么讲?
祥志:就很简单,医生版的ChatGPT,输完问题后,不光有答案,背后还有reference(引据),再点进去看,还有翻译,还有总结。医生基本就知道了,马上就会下载。你可以认为医生在这件事上的刚需是非常强烈的,现有的产品没法完全满足他。
《健闻咨询》:很多人会觉得做这样的产品并不难?一个好的模型底座,再加公开的文献资料,基本就能run起来。为什么你们要花那么久?
祥志:大家是这么觉得的,包括很多创业公司也是这么干的,但干着干着就会发现,这事干不下去了。
我觉得有几个关键点,首先,通用模型的幻觉率是很高的,你去看DeepSeek,如果不做任何算法优化,严重幻觉率会高达50%,那医生怎么敢用?第二个,你能不能按照临床诊疗的逻辑去做模型的调优,医生是有偏好的,一个心血管科的医生应该优先看哪几本指南,最看重哪些临床期刊。每个科室的医生要求都不同,判断逻辑不同,关注的学术期刊不同。这意味着你不光要有技术,还要和真实医生共同去建立一个符合临床偏好和评价标准的体系,这是很难的。
《健闻咨询》:所以调优的这部分,算是比较难的,也是你们的壁垒?
祥志:可以这么理解。我们内部有一个专门的医学团队,外部也有大概上百个临床医生在帮我们做这件事。每周我们都会至少请一个医生过来跟我们讲课交流,科普医学知识,然后讲产品体验,他觉得什么地方用的不好。
还有一个非常重要的环节,就是跟我们讲case。今天他发现了哪几个很好的case,好在什么地方?不好的 case,到底是哪里是有问题?他的证据列表里,哪个是应该引用的,哪个是不应该引用的。
产品越往后,医生参与的部分就越重要。
《健闻咨询》:此刻,你能给“氢离子”打几分?
祥志:我觉得70-80分吧,理想态是90分。因为AI永远不可能达到人类想要的满分。
越往后的每一分都会更难,但我们相信这件事情可以做很久很久。
长尾、个性化、信任,就是完美模型
《健闻咨询》:我其实还是比较意外的,阿里健康会去做AI医学助手这件事。这和我们的医药电商业务有什么协同性吗?
祥志:我们做这个事,主要是和持续的积累、认知有关系,也和公司使命有关系(让医疗健康普惠可及)。我们希望不止是药品的普惠可及,医学知识也应该普惠可及,解决医学资源分布不均匀,高等级证据很难获取的问题。
甚至在5-6年前,我们就研究过这个事。在没有大模型之前,我们就认为解决医生的信息获取效率是一件很有价值的事,只不过,那个时候技术还没有到。
《健闻咨询》:你们当时判断,做这件事需要什么样的技术?
祥志:有三个东西很重要。
第一是长尾的知识获取。今天真正需要被解决的医学问题都是非常长尾的,它有多个限定条件,在网上没有直接对应的答案,需要基于现有的知识来推理得出;
第二个是个性化,医生给任何一个患者看病,都需要知晓患者的个人体征、检查检验的结果、既往病史等等,把这些东西全部输入进去,才能有正确答案,缺任何一个上下文,都是有问题的;
第三个是信任,做决策的那个人,要相信那个答案。这意味着他不光要看到答案本身,还要知晓答案背后的证据。
今天大模型+rag刚好符合医生长期在循证医学体系下获取医学知识、证据的范式。
只有这三个东西加在一起,才能帮助医生提升决策效率。今天大模型的出现,我们认为,perfect。
《健闻咨询》:为什么不去做一个C端的应用呢?现在主流的问诊产品,既能服务医生,也能连接患者,对卖药的价值更大。
祥志:这个问题两年前我们就讨论过,答案是坚定选择医生端。因为我们觉得,还是要解决医疗最本质的东西。医疗最本质的东西是什么?是决策。
整个医疗体系中,医生是最重要的决策者,但是长久以来他们的痛点并没有被解决。我们认为大模型能力应该去帮助医生解决问题,这样才能延展出更多的价值。
当下这个阶段,我们觉得问诊是解决不了医疗行为的决策问题的。中国一年超过100亿次诊疗行为,背后是100亿次以医生为主体的医疗决策。开处方、下医嘱、做检查、规划手术方案,所有的决策几乎都是医生来做的。这是我们启动“氢离子”这个项目之前就想明白的一件事情。
另外一个视角是,我们觉得卷C端的人实在是太多了,已经有很多人在帮助患者了,但是没有人帮助医生,也没有技术和资源能力充足的大厂来做这件事。
那我们就做了。
《健闻咨询》:这个决定,在你们公司内部争议大吗?
祥志:前期会有讨论,但结论是笃定的。我印象中,在立项之前内部就做过各种调研,讨论对不对,到公司的管理层来去对焦,最终决定要做帮助中国医生解决一切医学问题的AI。
《健闻咨询》:国内已经有很多面向医生端的AI工具了,你真觉得这里的机会大吗?
祥志:正因为有很多,才有机会。这方面,我们还真的是做了一些非常扎实的调研。今天你去看国内林林总总的医生端的医学的AI 工具确实非常多,但我们访谈下来,至少50%以上的医生会装5到6个APP。因为这些应用,都是解决单点需求的。丁香园的用药助手在解决说明书的问题;医脉通在解决查指南的问题;PubMed解决英文文献的问题;万方、知网解决中文文献的问题。
那有没有可能,一个平台、一个工具就可以把这些问题完全解决掉,“氢离子”可以。
《健闻咨询》:你们会有比较偏重的医生用户群体吗?比如说头部医院的医生,中间层的,还是特别基层的?
祥志:我们不会做区分,每个医生的使用场景不一样。对于金字塔尖的医生,他主要聚焦在疑难杂症和科研;基层医生可能对日常诊疗有需求,因为他没见过那么多病例,对医学证据的获取也不方便。但这些医生都是我们的目标用户,只不过在运营的节奏上,可能会有优先级的差别。
我们目前的观测是,中腰部的医生,他的需求是最旺盛的,集中在部分三级医院和二级医院,甚至包括一些基层地区的社区医院。
另一方面,在当前的医疗体系中,中腰部医生实际承担着最广泛的患者诊疗工作。如果他们能通过氢离子,用更高效的交互方式获取更高质量的临床证据,比如国内外顶刊的科研成果、基于循证逻辑的病理分析、更多的病例参考,最终让基层医生的诊断结果和头部三甲医院的主治相当,帮助医生群体水平整体提升一点点,也能让大多数患者获益。
《健闻咨询》:所以你们的运营策略是绕过医院,直接找到医生?
祥志:对。我们觉得当下这个阶段,跳出医院,直接解决医生的知识证据获取问题,效率是最高的,也是最容易规模化的。
当然今天阿里健康也做了很多医院和医疗信息化方面的投资和布局。我们也相信未来有那么一天,我们会把这件事情部署到医院的工作流之内,这只是一个节奏的问题。
《健闻咨询》:最近,张文宏有一个观点,说过度迷信AI的诊断结论,会弱化医生的能力。你对此怎么看?
祥志:我们的观点也是接近的。我们不认为医生无脑地去接受AI给出的答案,是一件好事。求索医学的证据,通过证据去判断对错,这对于医生来说是很重要的。从产品的设计思路上,我们也希望医生更多去关注结论背后的东西。
从目前内测的情况来看,我可能没法说具体数字,但试用我们产品的用户里,点到reference里面去看的比例是相当高的。我们自己给这款产品的定位,就是跟医生站在一起,辅助医生去做判断,帮助医生去成长。
三年不考虑商业化,大厂最奢侈的情话
《健闻咨询》:OpenEvidence最近它的估值也超过了100亿美金。很多人会觉得,它的商业模式需要在医生端实现付费,这在国内很难实现。你怎么看?
祥志:这是一个误区,OpenEvidence 的核心商业模式并不是医生收费,而是面向药企的数字化的营销,这是他最大头的收入。
为什么药企愿意为此买单,是因为药企需要找到一个方式和渠道,把科学的临床证据传递给医生,并且让医生相信。以前,药企是花大力气给医生开会、培训,今天医学AI助手的出现,本身就是一个分发平台,所以它天然符合药企的诉求。
《健闻咨询》:所以在你们未来的商业模式设计中,也是把药企作为最后的支付方?
祥志:现阶段我们不考虑商业化,但这确实是以后可以探索的方向。原来搜索里面去卖医疗广告这件事情,我们认为是不健康的。因为一旦你是一个流量逻辑,就必然是卖广告。卖广告这件事健不健康,正不正确,取决于用户有没有辨识能力。普通老百姓分辨不了,但医生可以,这也是我们最早决定做医生端应用,从商业模式出发的一个核心考虑。
当然我们也不排除会有一些订阅的收费项目,但我们第一天就已经想好了,这不是“氢离子”最重要的商业模式。
《健闻咨询》:但药企付费也会有排他性,比如同一通用名下的几款药品,如果其中某个厂家投了广告,是不是会影响到模型给出答案的公允?
祥志:怎么设计商业模式,是竞价,还是纯品牌广告,其实有很多选择。今天海外同类产品主要在做品牌广告,就是做品牌曝光,并没有把某个客户的证据插到答案里面去影响用户。即使这样,它也能做到1.5亿美金的收入。
我觉得这至少是未来一个可行的方向。而且我们认为这件事情,在国内创新药大爆发、打击医疗反腐的大环境下,空间会更大。
《健闻咨询》:“氢离子”未来会怎么和阿里健康去融合?
祥志:我们现在是把它当成一个面向医生的,完全独立于医药电商的业务在做。我们希望他首先要长大,要成为我们dream的那个样子。
《健闻咨询》:但刚才你也说了,“氢离子”是公司的战略级产品,一个战略级产品难道完全不考虑和收入占比超过95%的主营业务的结合吗?
祥志:从长远来看,“氢离子”一定是公司战略级的产品。一个解决中国500万医生一切医学问题的AI工具, 社会价值和商业价值的想象力都是巨大的。真的把医生服务好以后,也一定可以有连接患者的能力。
另外,我们做业务的一个逻辑或者说方法论,是当你讲连接的时候,一定是1+1大于2的。什么叫1+1大于2?你必须得两个都是1才行。这个是个大业务,那个也是个大业务,他俩联合起来,产生某种合力。
《健闻咨询》:那老板给你的KPI是什么?
祥志:现阶段,不考虑任何的商业化,就是要把医生服务好。如果非要有一个KPI的话,就是三年时间内,所有的中国医生都在用我们这样一个产品,他碰到的任何医学问题,都能想到找“氢离子”来解决。
《健闻咨询》:想过未来三年的最大危机是什么吗?比如当通用大模型足够强大的时候,把你们给吞掉了?
祥志:这个问题我还是非常仔细地去考虑过。从竞争上,我们从来不认为那些通用的平台跟我们是竞争关系。我们从业务的逻辑上去讲,通用平台看的是DAU,和我们的逻辑不同,我们就是扎扎实实先解决中国500万医生的医学问题,这就代表了大家在医疗方向上的优化思路是不一样的。
《健闻咨询》:也可能是某个更有资源,更擅长运营的医疗垂类企业,借助通用大模型的能力,来终结你们。
祥志:我们对自己还是有很强的信心。我们认为,把这件事干成大概需要这么几个硬件条件。第一是技术,今天我们背靠通义千问,大概率是领先的;第二是内容,我们从6年前做医学知识图谱,3年前做医疗大模型,内容积累也有了;第三是有钱,有卡,有团队;第四是药企端的生态资源。
这几个核心要素一盘,我们觉得“氢离子”杀出来的确定性是非常高的。
(本文来自第一财经)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.