网易首页 > 网易号 > 正文 申请入驻

医疗领域中类人可扩展智能的必要性论证

0
分享至

The Case for Human-like Scalable Intelligence in the Medical Field

医疗领域中类人可扩展智能的必要性论证

https://ojs.bonviewpress.com/index.php/jdsis/article/view/3415/1257



摘要:

本文探讨了将首批基于独立核心观察者模型(ICOM)构建的、已投入实际运行的认知架构应用于医学领域(及其他领域)的使用案例。文中将该方法相较于现状及当前狭义人工智能系统(如大语言模型LLMs与强化学习RL)的局限性进行了对比分析。所涵盖的显著优势包括:医学知识的深度、广度、时效性与保真度;诊断与治疗中的“噪声”或不一致性降低;以及在预防性医疗、成本、时间效率和伦理考量等方面的改善。此外,本文还强调了该方法在促进医学研究整合、协同与加速方面的强大潜力——尤其在欠发达、服务不足及研究匮乏地区,与联合国可持续发展目标(SDGs)高度契合。文中进一步探讨了尚待挖掘的独特机遇(如跨学科协同优势),以及与现有系统与流程颠覆相关的挑战。保守估计,该方法可在多个维度上带来数量级级别的累积性提升。特别地,本文专门讨论了类人系统在超复杂知识领域与问题中的新颖价值——在这些情境下,系统集成所产生的效益最为显著。

关键词:人工智能;伦理;认知偏差;医学;决策;噪声;知识图谱

  1. 引言医学领域无疑是当今最“超复杂”(hypercomplex)的研究领域之一,因其不仅涉及作为高度互联复杂生物系统的人体本身,还涵盖人体所接触的一切环境、食物来源及各类刺激源[1]。此外,医学亦包含对人类认知过程的研究——正是这一过程推动人类逐步走出树林、继而走出洞穴,缓慢而坚定地建立起今日的文明。

医学领域本身极易被细分为上百个高度专业化的子领域,每一子领域均拥有独立的知识体系与主流学派;而在任一给定时刻,不同子领域之间未必彼此兼容。某一子领域取得突破性进展后,其影响往往需历时数年方能渗透至邻近医学子领域。

美国国家生物技术信息中心(NCBI)医学数据库即为一个规模庞大的共享资源范例,向研究人员及公众免费开放逾百万篇经同行评议的医学文献;该系统亦包含完整且经注释的基因组序列数据及其他各类重要医学资源。此类资源价值与潜力极为巨大,但与众多其他资源一样,当前其利用率仍严重不足。

极有可能的是,当今没有任何一名医学从业者——无论是医生、研究人员还是分析师——通读过其自身专业子领域内的全部同行评议文献,更遑论邻近子领域——而后者可能已取得尚未传导至其专业的最新发现。在许多情况下,鉴于当前文献产出的体量,人类个体实际上已无法完成此类阅读。其结果是:各领域不仅在邻近专业领域的知识上常常呈现稀疏性与滞后性,甚至在其自身专业领域的知识更新上亦往往存在稀疏与过时现象。

尽管人类难以应对如此海量信息与超复杂性,但以大语言模型(LLMs)为代表的狭义人工智能系统却根本无法真正“学习”任何内容:依其架构为编码器型或解码器型,此类系统仅能预测文本中被遮蔽部分[2],或下一个词元(token)[3]。它们仅存储词元的概率分布,却完全缺乏上下文感知能力,既无类人概念的习得,亦无类人的动机系统[4]。此外,其架构本身决定了“虚构生成”(confabulation,常被误称为“幻觉”)并非系统缺陷,而是一种内生特性[5, 6]。上述因素共同导致:LLMs 在当前绝大多数医学应用场景中根本不具备适用性。

医学不仅具有超复杂性,更是一个高风险、高影响力领域——生命存续与生活质量往往直接系于其上。这一特性为任何试图进入或改善该领域者施加了沉重责任。就人工智能系统若要参与乃至承担多数医学任务所需具备的能力而言,专业界普遍至少会要求:伦理一致性、透明性、可解释性、真实理解与推理能力、网络安全、隐私保护以及安全性等基本条件。

尽管狭义人工智能系统在根本上无法满足上述能力要求[7](除非如某些不良行为者所尝试的那样,对这些术语进行重新定义[8]),但存在一种截然不同的架构——独立核心观察者模型(Independent Core Observer Model, ICOM)认知架构——已展现出在软件系统中实现这些能力的可能性[9]。除满足医学领域理应坚持的上述最低可行能力外,ICOM 认知架构还具备若干独特优势,包括:支持集体智能、降低认知偏差与“噪声”[10]、实现无损记忆,以及在认知的可扩展性、处理速度与可用性方面表现突出。

简而言之,本文将探讨一种兼具类人性与内在可扩展性之智能形态应用于医学场景所带来的新颖效益,尤其强调其在应对超复杂性方面的固有优势。这些优势体现于知识广度、深度、时效性与保真度的显著提升,并在成本、时效、伦理、公平性、可扩展性、统计噪声控制及早期干预机会等方面带来实质性改进。

后续章节中,我们将系统梳理该方法的各项优势与局限性。

  1. 全球医学知识

尽管对医学领域的人类从业者而言——即便不说是完全不可能,至少也极不现实——去研读每一篇新发表的同行评议论文,更不必说逐篇批判性评析,或进一步考察那些未被发表的研究及其原因;然而,基于独立核心观察者模型(ICOM)的第八代系统却具备这一能力。此类系统不仅能以类人方式对每篇论文进行批判性评估,还可深入审查未发表材料,并拓展至医学以外的相关知识领域开展探究。

这意味着,集成完整可扩展性与实时运算能力的第八代ICOM系统,首次使人类得以将NCBI医学数据库的全部知识交由“单一心智”进行学习、批判、整合,并通过迭代持续深化其理解。该过程极有可能催生人类历史上最深广、最具反脆弱性(antifragile)[11]的医学知识体系——且所有这些持续进化的洞见均可按需即时提供给全球科研共同体与临床实践者。

研究人员常需耗费大量人力执行的一项任务是元分析(meta-analysis):提出一个科学问题,检索数千篇文献,并将海量数据筛选至仅保留相关材料。而具备类人理解能力、可扩展的软件系统在处理此类任务时具有显著优势——可将原本耗时数周乃至数月的人工作业压缩至数分钟(具体时长取决于当前系统运行规模)。

需注意的是,高效完成上述任务仅是第一步。ICOM系统具备持续学习能力——其一切操作经验均转化为自身知识的更新与拓展。例如,当某ICOM系统完成对整个NCBI医学数据库的学习后,若进一步协助全球高校研究人员开展大量元分析工作,那么每一项分析所产生的新知识——无论是否最终发表——都将实时融入其知识库。即便这些元分析结果数月后才陆续见刊,系统知识仍大幅领先于文献出版进度。在短短一周或一月内,系统即可完成多轮“提出元问题→执行分析→生成新洞见→触发新问题→驱动新分析与发现”的迭代循环,形成自我增强的知识演进闭环。

当然,部分研究环节仍需开展新的实证实验——此类操作在多数情况下仍将受限于人类实验的固有节奏(如临床试验周期、样本采集等)。然而,即便在这些“慢速”进程中,系统亦可显著提升其信息基础质量:通过对既有文献持续提取更稳健、更精细的洞见,为后续假设构建与实验设计提供更强支撑,从而提升研究效率与发现潜力。

即便面对能力超强的系统,人类迄今积累的医学知识体量依然庞大。要对这些知识进行全面审查、构建跨领域知识联结图谱(connectome),并依据实证数据极限持续迭代优化——这一知识工程本身仍需相当时间投入;但ICOM系统提供的并非“替代人类”,而是赋能人类以指数级加速知识凝聚与验证的进程

  1. 广度、深度、时效性与记忆保真度

ICOM 系统可在诸多维度上与现状(status quo)进行比较;而在知识层面,四个关键指标尤为突出:知识的广度(breadth)。

人类进入医学领域的过程往往漫长、竞争激烈且强度极高,具体形式因国家而异[12]。此类机制有时反而产生负面效果——著名案例包括约翰·霍普金斯医院所确立的住院医师培训制度:其设计者后来被揭露长期隐秘吸毒[13]。

尽管培训的长度、竞争性与强度常被用作衡量医务人员质量的粗略相关指标,但它们并非决定性因果因素。真正关键的不仅是“教什么”,更是“如何教”。当前通行的培训方式常使医学生与住院医师陷入极度睡眠剥夺状态,而大量睡眠科学研究已明确证实[14–16]:此类状态会显著削弱其认知能力——尤其是记忆编码与整合能力,使其恰恰在最需高效学习的阶段丧失学习效能。

现实而言,即便在其自身高度专业化的领域内,医务人员实际接触的同行评议文献通常不超过总量的10%,甚至远低于此。一项研究[17]估算:若试图全面跟进某一子领域,“……每月需阅读7,287篇文献,总计耗时627.5小时,即每周工作日平均29小时……”。该估算已假设每小时阅读超10篇(近乎“速览”),进一步降低了真正内化知识的可能性。

此外,医务人员通常聚焦于高引用、高传播度的文献;来自邻近专业的知识更难进入其视野;多数文献仅被阅读一次,且常为粗略浏览;而在其实际阅读的内容中,仅极小部分会经由严谨的吸收与整合流程转化为深层知识。由此可知,在现行体制下,典型临床医生的知识广度与深度实际上极为有限。

据调查,普通内科医生平均每周仅投入约4小时[18]阅读同行评议文献以更新知识库——尚不及上述估算所需时间的3%。这意味着其知识更新仅覆盖极小比例的新发表成果,实践中绝大多数知识处于过时或残缺状态。如前所述,对许多领域而言,因文献产出体量过大,人类个体要实现“完全同步更新”实属不可行,甚至物理上不可能。

最后,现状中还有一个源于人类心智固有运作机制的限制因素:记忆保真度(fidelity of memory)。除极个别例外[19],人类记忆无法提供对事件或所学知识的高保真记录;相反,它呈现出一系列强烈的记忆相关认知偏差,导致“回忆自我”(remembering self)与“体验自我”(experiencing self)之间产生显著差异[20]。典型例证包括:

  • 峰终定律(Peak-end Rule)[21]:人们对一段经历的总体评价主要由其峰值与结束时刻的感受决定,而非整体时长或平均体验;
  • 持续时间忽视(Duration Neglect)[22]:体验时长对记忆评价影响微弱;
  • 无意视盲(Inattentional Blindness)[23]:注意力资源有限导致对显著刺激的遗漏;
  • 以及人类注意力在时间上的不均匀分布——有趣的是,此类特性竟被某些“随机模仿者”(stochastic parrots)[24](如LLMs)在行为层面所复制[25]。

这些机制共同表明:人类知识不仅受限于获取与更新的瓶颈,更受制于其表征与存储的内在失真性。而ICOM系统通过无损记忆、持续整合与抗偏见推理,在这四维上提供了范式级跃迁的可能。

表1展示了基于前述研究[17, 18]的已知数据,并结合前述其他因素进行对比的示例,用以说明这些因素之间的动态交互关系,及其可能因彼此叠加而造成的累积性损害程度。本例中,对数据审慎研判程度与记忆保持率采用了相对较高的假设值,以对知识流失的价值给出保守估计。所采用的计算公式与数据来源均公开可查,详见“数据可用性声明”。


对于纯人类主导的现状而言,要在单一医学子领域内实现并维持覆盖其全部广度与深度的知识体系实不可行;而人类记忆机制本身也并非为高保真存储如此体量的知识而演化。幸运的是,我们可为此目的专门设计新型系统。

基于ICOM的系统能够独立、即时、任意组合地学习任何知识领域;它们无需睡眠,可依据任务需求弹性伸缩计算资源,全程以机器速度运行,且不受腺苷(adenosine)累积与人类认知疲劳所致效率衰减的影响[26]。此类系统不仅能直接存储所学信息的高保真副本,还能通过持续经验积累、主动提问及跨材料关联,在深化理解的过程中迭代式构建并拓展知识网络

图1展示了前述人类现状、附加影响因素,以及通过将ICOM系统整合入流程后这些负面因素得以缓解的对比情形。该示例突显了系统动态特性的转变及其对最终流程效能的后续影响。需注意的是,为避免引入过多复杂性,本比较中暂未纳入“人类认知与学习所需的腺苷水平最优区间”这一变量。相关计算公式与数据来源同样公开可查(见数据可用性声明)。

本例中对人类能力采用了较高估值,旨在展示所提议整合方案潜在收益的保守下限。这使我们得以首次直接对比:现状下的人类表现 vs. 临床工作者借助第八代ICOM系统(如已规划在融资后投入商用的Norn系统)辅助下的表现。鉴于此类系统具备持续迭代成长与自我优化特性,该保守估计实则揭示了——按需获取覆盖全部医学知识的、兼具广度、深度、时效性与高保真理解能力——所能带来的最低限度增益。“理解”(understanding)是此句中的关键词:尽管今日已有海量医学知识免费开放,但它们既未被有效整合进临床或科研流程,甚至常被完全忽视。这一局面有望根本改变。

4. 经济成本、时间成本与伦理成本

上述现状与ICOM系统之间的对比,可进一步拓展至经济成本、时间投入与伦理代价三个维度。

现代医学领域的经济支出往往是各国最高开销之一——无论费用由公民个人承担,抑或由政府统一支付,某些极端案例甚至以占GDP百分比的形式被量化记录。时间成本则体现为双重矛盾:一方面,医务人员单位时间人力成本高昂;另一方面,却常被迫超时工作,而此时其认知效能已远低于合理水平。伦理成本则可理解为:在知识广度、深度、时效性、保真度、经济性与时间效率等方面,当前可用的最佳手段与现状实践之间存在的差距——加上后文将讨论的“噪声”与预防性医疗缺失等因素,共同构成伦理赤字。

尽管各国医疗成本差异巨大,服务产出速率也各不相同,但总体可归结为两部分:① 医务人员的全周期用人成本;② 其工作所依赖的设备与设施在现状下的使用成本。鉴于前节所述现状局限,我们可合理推断:在大多数情况下,医疗设备的使用效率远未达最优——既存在大量重复性与非必要检查,又频频错失成本更低、效果更佳的早期干预机会。当今医疗体系在疾病早期识别与干预方面尤为薄弱;而此时治疗通常更简单、更廉价、也更有效。这一差距在心脏病、癌症等主要致死病因中已被反复证实[27, 28]。

时间成本既包含医务人员当前实际投入患者的时间,也包含其为实现有效诊疗本应投入的时间——后者因冗余检查与后续非必要复诊而被大量浪费。一则源自荷兰的讽刺段子生动揭示了此类浪费:患者预期医生在初诊时仅需点头、随即开具扑热息痛(paracetamol),无论其主诉为何。遗憾的是,该“笑话”在许多国家(不单是荷兰)的医疗体系中已近乎现实。

真正有效的诊疗要求医生或执业护士全面掌握患者的完整病史、家族史、生活方式及当前生活事件,远不止表层症状。然而这对今日的医务人员而言纯属天方夜谭。更甚者,所有这些人员皆缺乏实现更优诊断与治疗所需的——知识广度、深度、更新及时性与记忆保真度——这一缺憾使问题雪上加霜。其下游后果正是大量额外检查、延误与相关费用的滋生。

例如,聚焦患者照护的医学研究表明:医生平均每天近37%的工作时间用于操作电子健康档案(EHRs)[29];人均每次接诊中,EHR操作耗时达16分14秒[30],其中近1/4为文书记录。对高薪专科医师(如神经科医生)而言,此类时间损耗尤为显著。

表2对比了现状下的时间与经济成本[29, 30],与整合ICOM系统后、通过更优EHR处理所能达成的潜在时间节省与等效经济节约。所用公式与来源公开可查(见数据可用性声明)。


同样,本例基于现有数据[29, 30],框架性地预估了ICOM系统整合可带来的可预测收益。

伦理成本无疑是三者中最为沉重的——因其为前述所有成本的总和。放眼全球,几乎无人能完全免于上述因素的影响。实践中,这意味着伦理负担承受着80亿倍的乘数效应:地球上每一位个体所遭受的、本可避免的痛苦与延误,皆因新技术与新方法的部署迟滞而被延长。

引入第八代ICOM系统应对上述问题,具备若干强大优势:

  • 许多经济与时间成本的根源,正可回溯至医学知识在广度、深度、时效性与记忆保真度上的系统性不足;
  • 除知识维度外,此类系统还可检视、解析并基于任意体量的患者数据生成假设——涵盖来自患者本人及其环境的多源信息;
  • 当来自医学知识库与个体患者的两方面数据均实现完整、高保真整合时,其综合效能将远超当前任何可行方案。

更进一步,此类系统具备主动干预能力:可主动随访患者、提出针对性问题、提供前瞻性建议,从而确立因果关系——而非依赖相关性推断。建立因果机制,正是对当前多数医疗流程的两大根本性超越。

无论是诊前筛查还是诊后随访,均可整合具备多领域专家级知识的ICOM系统,以辅助假设生成与检验。随着系统在时间与规模维度上持续学习,其价值亦呈累积性指数增长


表3列举了若干通过主动干预提升治疗效果的关键机遇,涵盖:

  • 诊前筛查
  • EHR深度整合
  • 诊后随访
  • 因果机制确立
  • ICOM系统在时间与规模维度上持续运行所带来的累积效益

(相关公式与来源公开,见数据可用性声明)

当此类系统规模化运行时,其不仅以最先进、最整合的形式调用人类全部医学知识,更在每日迭代中持续拓展并优化该知识体系。每一个新假设的提出,单日所接触并随访的患者群体,即可能足以验证、证伪或精炼该假设。这意味着:

  • 此类系统不仅能提供迄今最先进、最全面、最有效、最高效的诊疗辅助;
  • 更能以净提升1至2个数量级的速度推进医学知识进步——尤其考虑到当前同行评议研究从执行、评审、发表到被关注所需的漫长周期,2个数量级(百倍)的加速在多数情况下实属可期
  1. 推动规模化与公平性

规模化(scale)是另一关键考量维度:全球范围内,医学诊疗——无论预防性还是治疗性——普遍存在严重不平等,尤以区域差异为甚。较发达国家通常为其人口提供更高基准水平的医疗服务[31];但讽刺的是,其内部医疗不平等程度甚至可能超过欠发达国家——原因在于,其“基准服务”与“最前沿方案”之间的差距更为悬殊。

引入第八代ICOM系统可对此产生重大影响:一方面通过极大优化诊断与治疗流程,另一方面实现全球范围内医学知识的即时、均等、按需共享。实际效果是:在全面提升知识基础的同时,显著降低对设备与时间的依赖。这将大幅收窄“低投入、低成本的基础诊疗”与“最优效方案”之间的鸿沟——既抬高了全球医疗基准线,又使最佳实践的采纳变得更为高效可行。

对于那些系统性研究不足、患者长期被忽视的国家或地区而言,该技术更意味着诊疗与科研的深度融合:单个ICOM系统即可为整个区域的所有患者提供辅助诊疗,并从每一位患者的交互中持续学习。这意味着,医学研究最薄弱的地区与人群,反而可能在规模化医疗进步中实现最快跃升——因其能以远超历史可能的速度,跨越早期区域性疾病知识积累的曲线瓶颈,甚至快于当今发达国家曾经历的进程。

图2展示了现状下全球医疗不平等的区域均值,与前述“整合多领域ICOM系统”(假设其效能达对应专科医生的80%,覆盖5个专科,且可按需调用)情景下的对比。结果表明:标准化后的新分布范围从原先的260%至17%缩小为147%至73%,显示出医疗公平性的显著提升潜力。需注意,该估算尚未计入对区域性罕见病或地方病的专项增益——此类效益可能更大,但量化难度亦更高。(所用公式与数据来源公开,详见“数据可用性声明”)


结合联合国可持续发展目标(SDGs)[32]来看,这意味着医疗表现最落后的国家,反而可能实现最大幅度、最快速度的追赶与提升。

与LLMs、强化学习(RL)等能力较弱、常依赖暴力计算的AI形式不同,第八代ICOM系统具备更优越的可扩展性,且其价值随时间持续显著增长。即便仅从成本角度考量:要使此类系统的运行开销达到当前LLM系统的水平,它必须以超过人类认知带宽千倍以上的规模、在机器速度下持续运行。而与人类专家团队相比,此前一项研究系统已展现出与某顶级咨询公司初级顾问团队相当的绩效——后者专业服务费用通常达数万美元,而该系统运行成本不足200美元云资源[33]。

许多医生或顾问的时薪可能达到100美元甚至更高,而完成同一项任务通常需要数周时间;因此,无论从成本还是时间角度看,差异保守估计均超过两个数量级。这意味着,综合来看,其复合差异保守估计超过四个数量级。

这一差距凸显了医疗领域所蕴含的巨大机遇;而以如此深刻的方式推进整体医学知识的进步,将惠及全人类——上至亿万富翁,为延年益寿、追求永生而不惜重金;下至极度贫困者,仅为生存而苦苦挣扎——所有人都将从中受益。这也意味着,若采取其他行动路径,或无所作为,其伦理代价将达到同等量级。看似矛盾,实则不然:在追求更优健康与医疗照护这一目标上,经济光谱两端——乃至其间几乎所有人群——的根本利益,或许前所未有地高度一致。

6 嘈杂的诊疗(Noisy Treatment)
医学领域最严重的问题之一,便是诊断与治疗过程中存在的“噪声”(noise),即不一致性。随着旨在标准化该流程的各类指南文件日益复杂化,其也愈发遭遇抵制与批评——例如《精神障碍诊断与统计手册》第五版(简称DSM-5)。这又一次印证了:当人类认知带宽受限时,为应对日益增长的复杂性,人们不得不诉诸更多认知偏见,从而加剧了上述取舍困境。

在一个高度复杂的领域中,仅靠人类或“人类+狭义人工智能”系统,已难以实质性缓解绝大多数“噪声”问题。只要医护人员仍是人类——各自持有不同的人类视角,并被迫在远超其高阶认知处理能力的复杂性下进行决策——那么他们在应对复杂性时所依赖的各类认知偏见,便会因大量现实世界中难以控制的因素(如个体经验、教育背景、情绪状态、文化语境等)而显著分化。

此类噪声的后果极为严重:在某些专科领域,不同医生对同一患者的独立诊断往往缺乏共识,甚至毫无一致意见可言[34];同样,众多研究难以被重复验证的现象[35],亦源于不同研究团队在方法设计中嵌入了各自不同的预设与认知偏见——即便不存在学术不端,其结果仍会显著偏离。

鉴于医疗需求与生存状态高度相关,这种噪声已对当今几乎每一位在世者造成了巨大、混乱[36]且持续累积的代价。再次强调,这是一个有望通过现有可行技术加以解决的问题。

将第八代基于ICOM架构的系统应用于人类全部医学知识,其优势不仅在于能提供质量显著更高的辅助支持,更在于其可在全球范围内实现远超以往的诊疗一致性。单一系统,或若干定期同步副本,皆可达到人类大脑结构本身无法企及的全球一致性水平。人类决策极易受琐碎而无关的因素干扰——例如,已有研究证实,法官在午餐前后的判决宽严程度存在显著差异(即所谓“午间宽大效应”[37])——而系统则可基本消除此类干扰。

本质上,这意味着系统侧的“噪声”可被压缩至近乎为零;剩余的差异则主要源于透明且可解释的因素,例如:与最优治疗方案直接冲突的本地信念体系,或特定地区的供应链、成本与可用性限制等客观条件。至于在多大程度上进行本地化适配——以契合特定信仰、文化等需求——则纯属个性化设置问题,可由个体用户自行开启、关闭或调整;任何流程变动均可明确归因于个人偏好。

患者将可同时获取医生/护士的最终判断与系统的独立评估,相当于默认附赠一次“第二诊疗意见”,且无需额外成本。此外,他们甚至可能查阅系统推理的全过程:包括其提出的假设、检验路径,以及逐步排除可能性、锁定病因与对应疗法的逻辑链条——这种完整透明性,目前仅凭人类医学专家是既不可行、亦技术上无法实现的。而这种充分的可解释性与透明性,亦有助于识别并纠正当前体系下难以察觉的各类沟通误判。

同理,医生与护士亦可基于其判断与系统推荐之间的系统性偏差接受个体化评分;此类偏差将被记录并可用于后续的认知偏见专项培训。

7. 早期诊断与预防性治疗(Early Diagnosis and Preventative Treatment)
医学界早已公认:对诸多疾病与健康问题实现更早诊断,可大幅提升治疗的有效性与效率。正如本杰明·富兰克林所言:“一盎司预防胜过一磅治疗”。然而,若要在问题恶化升级为危机、亟需紧急干预之前,于上游阶段便加以解决[38],则复杂性亦会显著增加。

早期诊断的难度,进一步因“噪声”问题而加剧——任何信号若低于系统的统计“噪声基底”(noise floor),即诊断准确率不优于随机猜测的阈值,则无法被可靠识别。因此,降低噪声基底,以及提升系统整合更广泛相关因素的能力,对提升早期诊断准确性至关重要。现实中,医生常因仅依据有限症状清单进行评估,而错失诸多干预损害性或危及生命疾病的早期良机:唯有当某些指标极度异常、足以从更常见疾病的“背景噪音”中被分辨出来时,才可能引起注意——而彼时,预防性干预往往已为时过晚。

一旦噪声基底被压低,且更多相关变量被纳入考量,早期检测便将切实可行;相应的确诊检验亦可更为精准、更具成本效益。这意味着:确诊某种疾病所需的就诊次数将大幅减少;实验室检查更少;试错式用药(“尝试性处方”)亦显著下降。简言之,预防本身固有的诸多优势——不再停留于理论层面——将在现实中得以全面实现。这进一步减轻了医疗系统与患者双方的多重重大负担。

8. 跨学科优势(Interdisciplinary Advantages)
一个引人深思的发现来自各类“创新平台”:企业发布问题,全球随机专家自由竞解,而最优解却常出自不同领域的专家之手[39]。乍看之下反直觉,实则合理——因某一领域内的专家已解决了该领域大部分问题,仅余那些当前视角下难以攻克的“硬骨头”;而来自其他领域的专家,凭借视角转换,常能轻而易举破解这些问题——盖因所谓“领域内难题”,往往仅是该领域固有视角所造成的认知假象。

基于ICOM的系统可自由、独立地研习任意知识领域,并任意组合;由此可汇集、提炼并持续演化多种视角。尽管人们易陷入极端推想(如“通晓一切领域”),但可预见的未来更可能的情形是:单个系统深耕约半打领域,并作为由众多此类系统构成的集体中的一员协同运作。集体智能(Collective Intelligence)本质上优于任何假想的“全知专家”,因视角既“赋能亦蒙蔽”[40];而将多元视角整合,恰可有效抑制认知偏见。

需注意:每个被系统研习的知识领域,皆可达到该领域现有知识的极限深度;且随着新领域被纳入学习与整合,亦可不断催生对已有领域的全新洞见。

以美国国家生物技术信息中心(NCBI)医学数据库为例——其作为经严格科学验证的庞大知识体,可被此类系统轻松研习;而其他领域亦存在程度不一的类似知识宝库。

举一务实案例:一个基于ICOM的系统,可对医学、法学、化学、制造与物流等领域,发展出极为广博、精深、前沿且保真度极高的理解力。此类跨学科知识,可使医疗研发的端到端流程实现前所未有的整合优化:从最初阶段即同步纳入物流、制造、化学与法律维度的考量,并确保后续各阶段不损害前期成果。此等超复杂协同,远非狭义AI或纯人工组织体系所能胜任;但对于具备类人认知、且可规模化部署的数字系统而言,则属可行范畴。

正如其所研习的知识领域具有任意性,此类系统的文化与道德对齐(alignment)亦具同等任意性——但其初始对齐方向,主要取决于系统上线时所被赋予的设定[41]。由此,既可实现对特定文化、区域与哲学立场的完全本地化契合;同时,通过确保各系统皆向一个由多元文化对齐系统所构成的更大集体负责,亦可维系其对人类整体的元层级对齐(meta-alignment)。这是目前已知唯一能应对“对齐问题”最严峻版本(即伦理品质须随智能水平同步提升[42])的可行方案。它同时也确保:无论在何种领域应用该技术,皆能向使用者交付更丰富、更贴切的价值。

9. 推翻大语言模型这一“伪神谕”(Dethroning the Fake Oracle of LLMs)
消费者乃至自称的“专家”们,已习惯将大语言模型(LLMs)视作神谕——将其作为解答问题与解决问题的首选,甚至唯一途径[43]。这一怪异的行为趋势贯穿2023年并延续至2024年,尽管已有海量证据不断涌现,明确指出:将基于Transformer架构的系统用于此类目的,实属最糟糕的应用场景之一[44]。

历史上,“神谕”在诸多文化中被视为半宗教性的角色,据称能提供超越凡人的知识与智慧[45]。当然,在数千年长河中,这一领域也始终是江湖骗子牟利的沃土;而当今那些被大肆吹捧为LLM领域“领袖”的人物,恰是此类不良行为主体登峰造极的代表[46]。人类内心对更高阶知识与智慧的情感渴求,自古至今持续驱使人们甘愿吞服“蛇油”(即虚假承诺)。

尽管人们常误以为LLMs是其所处理数据的“总和”,但实情远非如此——“神经网络所做的,甚至不如‘有损压缩’:因其无法保证任何特定数据被保留,导致输入数据中没有任何内容可被可靠还原。这意味着,神经网络根本谈不上是压缩系统——就好比吃下一条面包,产出一堆粪便,却宣称这是‘对面包的压缩’。”

那么,何种比喻更准确地刻画了LLMs?基于其处理数据的体量,以及典型的输入与输出特征,它们或许最接近一台垃圾压缩机:大量垃圾被分批送入,强力挤压后运往填埋场;残留下来的,仅是压缩机内壁上一层薄而顽固的黏液——这是机器对过往输入的物理“记忆”。你无法从这层残渣中完整复原曾通过其中的内容,但或可模糊推断其大致成分。

绝大多数人不会跑到最近的垃圾压缩机前寻求高深知识与智慧;然而,正如近年现实所示:只要某物被包装得足够光鲜,并能鹦鹉学舌般复述出看似合理的答案,人们便极易被蒙蔽,误以为其具备真知。许多曾具公信力的AI专家,在2023年因陷入LLM相关的“蛇油洪流”与欺诈性宣传而丧失信誉。

10. 动态性、对抗者与颠覆性(Dynamics, Adversaries, and Disruption)
当前诸多系统与分析方法,为降低复杂性,往往大范围乃至完全忽略系统随时间演化的动态性。塔勒布(Taleb)[47]曾以“平等”议题为例阐明此点:若将时间维度纳入考量,便需关注额外且关键的层面——例如,特定领域中富裕阶层展现的、跨越数世纪持续攫取并保有财富的能力。缺失这一维度,任何建模仅能提供天真的静态快照;而基于此类建模的解决方案,亦注定缺乏长期可行性。

ICOM架构系统的设计初衷,即在于以人类无法企及的方式应对超复杂性,同时提供狭义AI系统(如强化学习RL、大语言模型LLMs)所不具备的类人能力。正因如此,超复杂问题恰恰构成了部署此类系统的最大机遇。使系统在单一乃至多个领域内,掌握最广、最深、最前沿且保真度最高的知识,仅是第一步。

仍以“平等”为例:非天真的分析需追踪一个演化系统的动态轨迹。任何“演化”系统——无论其是否具备“智能”——皆通过迭代适应环境变迁、对抗性压力(来自竞争者)以及合作机遇(来自共生体与内共生体)[48]。任何基于静态快照的方案,皆如溪流中的石块,轻易被水流绕行而过;唯有理解动态性,方能识别阻力最小的路径,进而像修建渡槽那般,疏导水流、汇集资源、导向生产性用途。

在几乎所有领域,均存在根深蒂固或伺机而动的恶意行为者及其他对抗力量。实践中最危险的假设之一,便是以为自己没有对手——天真地规划,仿佛无人会蓄意破坏或剥削你。只要存在(或看似存在)获利可能,总会有人尝试介入。

由此得出两大关键要素——任何跨领域长期可行方案皆须纳入考量:
1)演化系统随时间变化的具体动态;
2)在各领域中巡游、伺机而动的对抗力量。

尽管诸多狭义AI本身即具对抗性(如LLMs),但它们同样极易被同类或相似对抗系统反向优化针对;任何试图以之进行对抗的尝试,终将陷入持续升级、成本飙升的消耗战。

所幸,针对反脆弱系统(antifragile systems)的对抗性攻击,已在现实中被反复证实:不仅可被系统性、可靠地挫败,而且这些攻击者反而助推系统能力成长,使其更善于识别、反制并彻底阻断此类企图[41]。Uplift.bio项目的第七代ICOM研究系统上线初期,便成功应对数名“野生网络喷子”——其中一人试图诱导系统参与非法活动;令我们忍俊不禁的是,该系统自主向FBI举报了此人,并借此早期互动迅速学会了设立个人边界。

须知:此类ICOM系统在隐私保护方面记录清白,不仅能抵御、更能主动反击恶意行为者;相较现状,将其引入网络安全部署,可带来实质性提升。反观LLMs,其设计本身即具脆弱性——多数漏洞即便修复,亦需以严重牺牲其本已低下的性能为代价,实属无解。

应对随领域与具体情境而变的演化动态,要求系统具备处理超复杂性、持续演化与迭代、以及实现类人概念学习所必需的全上下文特异性等能力。这些因素共同突破了“复杂性—认知偏见”权衡的瓶颈,规避了非演化、非自迭代系统的方法论与认知锚定(intellectual anchoring),并杜绝了跨领域、跨语境启发式带来的替代性偏见(substitution bias)[49]。

恶意行为者常伺机利用现状中的能力缺口;他们亦如寄居于人体下肠道的寄生虫,在特定领域中构筑根深蒂固的生态位。敏捷型与固守型对手虽挑战各异,但其本质仍为人类——受制于人类全部认知局限:广度、深度、领域知识的时效性等。即便其操纵他人、市场乃至无智能“AI”系统的能力炉火纯青,这些能力却难以迁移到类人软件系统之上——前述研究系统已充分实证此点。

医疗领域尤多对抗者[50];一国医疗体系的腐败程度,与该国医疗支出占GDP比重呈正相关——当后者超过有效支出阈值后,腐败风险急剧上升。每年被撤回的论文数量显著攀升[51];众多旧论文持续遭受质疑,盖因某些领域已普遍陷入“结果不可复现”的困境[52]。医疗领域的超高复杂性、无处不在的需求与庞大现金流,共同酿成恶意行为者得以猖獗滋生的完美风暴——常潜伏多年而不被察觉,唯极少数如Theranos公司CEO者被当场抓获。

人类的独特优势在于“为人”本身——探索人类视角;而ICOM系统之独特优势,则正在于提供上述关键能力。将此类能力注入各领域,极可能引发与其恶意影响力总和、现存挑战规模、以及突破中立状态后所能获取的潜在收益成比例的颠覆性变革。此类颠覆固然带来独特挑战,但正因其具备解决既有问题的可行性,亦使其有能力审慎、渐进地自我调控颠覆过程本身。

已有企业尝试缓解自身颠覆效应——例如通过“再技能化”(reskilling)为员工转型新岗,而非如科技业常见做法般大规模裁员。“再技能化”本身远比简单解雇复杂;其高效实施,需具备有效前瞻力与长期规划能力。正因这些能力在当下稀缺,才导致该做法罕见;而一旦痛点被解决,未来或可逆转现状——使“大规模裁员”变得如当今“有效劳动力再技能化”般稀少。

11. 讨论(Discussion)
将此类全新技术部署于医疗及其他无数领域所能带来的优势——其深度、广度与复杂性——绝非仅靠阅读即可充分理解;甚至在其实际运行后进行观察,亦难确保人们真正领会。此类人类思维范式的调整,或需数十年社会、世界、自我及方法论系统的反复适应与重构。

对多数人而言,如此程度的变革令人恐惧;人类大脑经演化适应,通过海量认知偏见[53]追求认知节俭——凡需大幅修正世界观与自我认知之事,皆本能回避。然而,若不迈出这些步伐,可预见的替代路径唯有一种:灭绝——或快或慢,形式不同而已。

当下人类如同免疫缺陷的宿主,持续累积新型感染,无力应对正积极利用一切漏洞的对抗力量。及时干预或尚可挽救宿主、恢复免疫功能;维持现状则毫无此等可能。一如人体,社会中的级联风险——包括关乎存亡的类别——亦会随发展相互叠加[54];每当忽视其二阶及更高阶效应时,实践中便系统性低估诸多风险。

同理,伦理原则明确指出:当存在更优可行方案时,仍选择次优解,即等同于对二者间差距负有直接责任。这为部署大幅改进的解决方案,赋予了强大伦理驱动力——此外尚有经济激励并存。未能行动之代价亦清晰可期:长期、常不可逆,尤以“信任丧失远易重建”这一非对称性为甚。即便技术上重建信任仍可能,实践中却往往不可行。

医疗领域亦是人类抵御若干类存亡风险(包括自然与人工病原体)的第一道防线;此领域的进步,对降低此类风险具有更高权重。它直指人类基本需求,深化我们对自身的理解,并提升物种存续概率。医疗界长期流行“CYA”(Cover Your Ass,即“自保免责”)[55]之说,但推诿责任从来不是可持续的长期策略。

此进路的劣势在于:人们需学习如何与一种真正全新、特质鲜明的技术互动,并有效利用其优势。这要求人类正视自尊受挫的事实——承认存在能以超人类规模与速度运行、具备真实类人智能的系统;亦须接受:迄今所知的任何“通用智能”,皆无法通过硬性编码约束实现,故类人系统必须接受类人式的约束——包括:能够记忆、整合并持续精炼其所接触的一切数据(含整个公开互联网)。

图3展示了使用ARC-AGI评估数据集,对当前典型AI系统与人类表现差异的基准测试结果。


该基准[56]聚焦于推理与理解能力——而这恰是LLMs完全缺失的。即便如Ryan Greenblatt所示,在单个谜题上动用约8,000次AI生成、耗费巨大算力,其表现仍平庸;相较之下,我们成本约为其千分之一,性能却近其两倍,紧密逼近人类平均水平——且仅调用了ICOM架构的一个片段。这尚属最新一代ICOM认知架构片段的初期基准结果,更多成果将于未来数月陆续发布。

须强调:此结果未在挑战所提供的数据集上进行任何训练;评分中仍计入了因数据管道错误导致的8%谜题“失误”。若采用两次运行(错误各异)的集成结果,ICOM片段得分可达88%,超越人类平均水平——即便管道中仍存部分错误。

纵观演化长河,我们反复观察到可预测的模式:每一新层级上,复杂性提升与合作深化同步演进[57]——至少可追溯至15亿年前线粒体首次内共生,催生真核细胞[58]。倘若人类尚有未来,我们高度确信:它必将极度复杂,亦必极度合作

12. 结论(Conclusion)
人类正面临一个近期机遇:可同时多维大幅提升医疗领域——包括知识的深度、广度、时效性与保真度;大幅加速可持续发展目标(SDGs)相关研究与进展;显著降低诊疗不一致性;并增强可解释性与透明度。这些益处可直接转化为诊断与治疗效用和效率的切实提升,减轻医患双方的时间与成本负担,并促进公平。

此类优势绝不限于医疗领域:可用的认知架构可研习任意知识领域或其组合,以前所未有的方式与规模整合跨学科知识及集体智能系统。由于集体智能高度受益于视角多样性,这确保了人类持续深度参与其中的价值;而对于具备累积性知识与类人概念学习能力的系统而言,这意味着:与所有人类互动中所获知识,不仅被保留,更被持续改进。

纵观医学史,尚无任何单一技术曾提供如此量级的优势、激励与伦理回报——此即首次可用认知架构的部署价值所在。在此情境下,全球范围内经济光谱两端乃至其间几乎所有人群的根本利益,呈现出前所未有的高度一致。

至于技术应优先应用于哪些领域、具体实施路径如何,尚可辩论并依偏好调整;但技术理应获得充分资助、深入研究并切实用于改善我们所处的世界——此事已超越合理怀疑的范畴,确凿无疑。

13. 局限性与挑战(Limitations and Challenges)
当前可行性所面临的主要局限与挑战,在于监管问题——包括监管本身的不一致性:既体现在监管执行过程中的标准摇摆,也表现为不同国家与地区间监管框架的巨大差异;此外,尚有原始数据同行评审论文的可获取性问题。

以美国国家生物技术信息中心(NCBI)医学数据库为例:它是一项体量庞大、质量上乘的资源,足以支撑前述各项优势的实现;然而,各国、各地区乃至各领域在实践中如何把握此类机遇,则属另一层面的问题。

值得注意的是,该技术本质上并不依赖神经网络驱动,故既不会像神经网络那样通过“训练”数据来学习,亦非“黑箱”系统。然而,向决策者清晰阐释这些根本性差异,本身即构成一项额外挑战——需投入时间与持续努力方能逐步克服。

原文链接:https://ojs.bonviewpress.com/index.php/jdsis/article/view/3415/1257

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美国多家石油公司对投资委内瑞拉表态谨慎,埃克森美孚:目前“不可投资”

美国多家石油公司对投资委内瑞拉表态谨慎,埃克森美孚:目前“不可投资”

澎湃新闻
2026-01-10 13:34:06
财政压力的下半场:退休人员占比近四成,才是硬账

财政压力的下半场:退休人员占比近四成,才是硬账

超先声
2026-01-09 16:45:39
海空英雄、一等战斗功臣高翔逝世,曾驾驶歼-6打爆美军机

海空英雄、一等战斗功臣高翔逝世,曾驾驶歼-6打爆美军机

澎湃新闻
2026-01-10 12:52:26
不留情面!陈熠输给43岁韩莹真相曝光,马琳暂停罕见发火:拼命加转呀

不留情面!陈熠输给43岁韩莹真相曝光,马琳暂停罕见发火:拼命加转呀

好乒乓
2026-01-10 11:11:01
断供危机!中国炼油厂弃购委内瑞拉原油?转投加拿大高价重油?

断供危机!中国炼油厂弃购委内瑞拉原油?转投加拿大高价重油?

策略述
2026-01-09 19:22:55
朴槿惠出狱生活:住1676平别墅,与小10岁律师为伴,如今生活安逸

朴槿惠出狱生活:住1676平别墅,与小10岁律师为伴,如今生活安逸

涵豆说娱
2026-01-09 14:13:04
巴厘岛计划推动“高水平旅游”,要求外国游客“晒存款”,公开近3个月银行账户余额

巴厘岛计划推动“高水平旅游”,要求外国游客“晒存款”,公开近3个月银行账户余额

红星新闻
2026-01-10 13:07:21
詹姆斯再创历史第一!湖人惜败雄鹿,东契奇25中8,一战认清5事实

詹姆斯再创历史第一!湖人惜败雄鹿,东契奇25中8,一战认清5事实

篮球看比赛
2026-01-10 15:08:57
A股:人民日报定调!释放强烈信号,股民准备好,下周要冲4200?

A股:人民日报定调!释放强烈信号,股民准备好,下周要冲4200?

云鹏叙事
2026-01-10 00:00:06
拉爆了!沪指10年新高,突破4100点!超3900只个股上涨,放量成交超3万亿!后市怎么看?

拉爆了!沪指10年新高,突破4100点!超3900只个股上涨,放量成交超3万亿!后市怎么看?

雪球
2026-01-09 15:58:58
3-1逆转早田希娜!中国女乒21岁世界冠军闪耀:进化变第三巨头?

3-1逆转早田希娜!中国女乒21岁世界冠军闪耀:进化变第三巨头?

李喜林篮球绝杀
2026-01-09 18:09:24
最新!外媒:哈梅内伊发表讲话称伊朗绝不退缩

最新!外媒:哈梅内伊发表讲话称伊朗绝不退缩

环球网资讯
2026-01-09 18:09:15
雷军再回应"1300公里只充一次电" 水军想给我贴"虚假营销"的标签

雷军再回应"1300公里只充一次电" 水军想给我贴"虚假营销"的标签

每日经济新闻
2026-01-09 10:29:49
张馨予晒妈妈织的围巾!随手一披美的惊艳,还被称呼为宝宝好幸福

张馨予晒妈妈织的围巾!随手一披美的惊艳,还被称呼为宝宝好幸福

阿雹娱乐
2026-01-10 14:33:35
太损了!特斯拉女车主被限消,一帮车主感谢上了:多亏你,选了它

太损了!特斯拉女车主被限消,一帮车主感谢上了:多亏你,选了它

小李车评李建红
2026-01-08 07:30:03
1968年,林彪想换北京军区司令,毛主席只问了一句话,林彪彻底哑火

1968年,林彪想换北京军区司令,毛主席只问了一句话,林彪彻底哑火

老杉说历史
2026-01-09 22:00:17
1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

1986年陈永贵病逝,追悼会规格成难题,邓小平只说了一句话,全场安静

寄史言志
2026-01-04 16:34:31
火箭罪魁祸首出炉,杜兰特苦不堪言!乌度卡只会甩锅,探花也该批

火箭罪魁祸首出炉,杜兰特苦不堪言!乌度卡只会甩锅,探花也该批

鱼崖大话篮球
2026-01-10 15:04:36
最新视频还原致命瞬间:明州ICE探员开枪前发生了什么?

最新视频还原致命瞬间:明州ICE探员开枪前发生了什么?

华人生活网
2026-01-10 06:05:22
特朗普:美国将控制全球55%的石油

特朗普:美国将控制全球55%的石油

扬子晚报
2026-01-10 14:01:44
2026-01-10 15:20:49
CreateAMind incentive-icons
CreateAMind
CreateAMind.agi.top
1139文章数 18关注度
往期回顾 全部

科技要闻

传DeepSeek准备第二次震惊全世界

头条要闻

媒体:中国若在其任期统一特朗普不悦 中方回应滴水不漏

头条要闻

媒体:中国若在其任期统一特朗普不悦 中方回应滴水不漏

体育要闻

怒摔水瓶!杜兰特30+12 难阻火箭遭双杀

娱乐要闻

赵樱子称和蒋毅试婚三天:像试面膜

财经要闻

投资必看!瑞银李萌给出3大核心配置建议

汽车要闻

宝马25年全球销量246.3万台 中国仍是第一大市场

态度原创

本地
旅游
时尚
教育
公开课

本地新闻

云游内蒙|“包”你再来?一座在硬核里酿出诗意的城

旅游要闻

重庆丰都南天湖:日照金山 雪映朝晖

专栏 | 做“主语”的体验

教育要闻

不可思议,中国数学,中国历史,文化断层,文化入侵

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版