网易首页 > 网易号 > 正文 申请入驻

MIT对大模型数理原理的强有力证明

0
分享至

来源:清熙

笔者去年整理的,迎来了最强有力的实践证明!

原理回顾

笔者在“GPT4技术原理”系列文章梳理出来大模型数理认知框架如下图:

海量的文本或者多模态语料组成了大模型需要认知的外部世界的基本信息;嵌入构建高维概率化的语言空间,用来建模语言文字图像以及音视频,并对连续变量做离散化;

预训练以重整化群流的方式进行,在不同尺度上提炼语料数据中的信息概率分布;重整化群流的每一步流动(自回归预测逼近训练语料概率分布),都沿着最优输运的成本最低方向进行;

重整化群在不动点附近因新语料带来微扰而发生对称性破缺,滑入不同的相空间;不同的相空间,对应某种意义上的范畴,可形象化为信息的结晶;这是大模型从语料中学到的内部世界模型

在外部感官输入下(被提示置于某种上下文),大模型内部将限定在相应的高维语言概率空间的子空间内推理;推理是在子空间中采样,类比时跨范畴采样

采样不断进行,基于内部概率化了的世界模型(预训练获得的先验),针对感官输入(提示),做变分推断,最小化自由能,获取最佳采样分布q*,作为对导致感官输入的外部后验的预测。

可总结为:1、重整化从海量语料中提取出范畴,2、持续重整化驱动范畴解构重组结晶,3、生成过程于范畴中采样做变分推理。

笔者在文中针对重整化、范畴与transformer之间的关系做了详细的阐述:

重整化本质是尺度从小到大粗粒度化概率分布的过程,而深度神经网络擅长学习小尺度结构逐级到认知全局特征,而大模型的Transformer 则可以逆重整化流,逐尺度重建微观概率分布,从而完成生成。

这里的范畴是Transformer视角下的高维概率向量编织起来的事物之间的各种复杂的关系。从海量的预训练数据集中提纯出来,对大量的分段线性核函数参数化后的表达。这些关系,关系的关系,关系的关系的关系,本质上,在范畴论概念下,就是对事物的米田嵌入

最新实证

麻省理工学院 Markus J. Buehler 教授最近在《机器学习:科学与技术》发文【文献1】,展示了一种先进的 AI 方法:集成生成式知识提取、基于图的表征和多模态智能图推理。惊人地揭示了生物组织和贝多芬的“第九交响曲”之间的复杂性与秩序的共同模式。

该工作使用受范畴论启发的方法开发的作为中心机制,教模型理解科学中的抽象结构和它们之间的符号关系,通过关注对象及其交互,而不是它们的具体内容,来理解和统一不同的系统。

我们知道,范畴论中,对象可以是任何东西,从数字到更抽象的实体,如结构或过程,对应上文笔者讲的“事物”;形态则是定义这些对象之间关系的箭头或函数,对应上文中的“米田嵌入”。

Buehler 教授通过范畴对象和形态教会 AI 模型系统地推理复杂的科学概念和行为。通过形态引入的符号关系清楚地表明,AI不仅仅是在进行类比,而是在进行更深入的推理,以映射不同领域的抽象结构。

这也回应了近期大模型究竟会不会推理的业界大辩论。当大模型生成的时候,已经不是那个简单的 next token prediction, 而是基于丰富范畴的推理、推理、推理,重要的事情得说三遍。Ilya Sutskever最新访谈提到的「扩大正确的Scaling」,应该指推理的Scaling law。

其实是苹果学者想当然合成了语料;字节豆包大模型团队大规模实验发现大模型无法抽象出一般物理规则,从实验看并无法判断是否局部触发了scaling law。

Buehler 教授通过这个方式,分析了 1000 篇有关生物材料的科学论文,并将其转化为表征形式的知识图谱。

该图谱揭示了不同信息是如何连接的,并可找到与概念联系在一起的相关想法和关键点组。该图无标度,高度关联,可有效用于图推理

教AI系统思考基于图的数据,以帮助它们构建更好的世界模型表征,并提高思考和探索新想法的能力,以实现超出人类认知的高维新发现:回答复杂的问题,发现当前知识中的差距,提出新的材料设计,预测材料的行为方式,还能够将以前从未连接过的概念联系起来。

生物材料和“第九交响曲”之间出乎意料的相似之处:两者都遵循复杂性模式,生物材料中的细胞以复杂但有组织的方式相互作用以形成功能,贝多芬的第九交响曲则以创造一种复杂但连贯的音乐体验为目标安排音符和主题。

通过追踪联系进行图遍历,能够找到以前尚未建立的概念之间的联系,或未理解为以任何已知方式相关的概念。使用生成式 AI 模型的复杂推理可以提供更深入的见解,产生新的信息连接,从而产生新知识,甚至促进新想法的发现。

探索复杂的图遍历为分析提供广阔的空间,既可以确定单个最可能的路径,也可以对多个路径进行采样。图形是通过合并所有节点来构建的,即使它们来自不同的路径。整体图具有明显不同的拓扑结构,并在边缘编码的概念及其关系之间提供了新颖的联系。表明了非常灵活的图可以被构建并最终用于推理


图表征了相应领域知识的本体结构,可用于支持该特定科学研究中的推理,例如提出有关材料特性的假设或预测组合不同材料的可能结果,还可以帮助识别知识差距,提出新的研究领域,并促进对材料科学或不同学科之间复杂相互关系的理解。
学者在一项实验中,基于来自瓦西里·康定斯基 (Wassily Kandinsky) 的画作《构图 VII》中的抽象图案的灵感,AI 提出了一种新的基于菌丝体的复合材料:这种材料结合了一组创新的概念,包括混乱与秩序的平衡、可调节的特性、孔隙率、机械强度和复杂的图案化学功能。

基于宏大的人类知识提取出来丰富范畴,形成众多领域的本体知识结构,这是大模型通过预训练已经构建的内部世界模型;提高推理采样的机制,通过训练达成学习推理的scaling law,是大模型下一步努力提升的方向。

相比传统方法,新的大模型机理,具备更高维度的新颖性、对能力和技术细节的探索,可以通过揭示隐藏的联系建立更广泛有用的创新框架。AI 知识图驱动的跨学科研究可能会成为科学和哲学探索的有力工具。

文献1: Accelerating scientific discovery with generative knowledge extraction, graph-based representation, and multimodal intelligent graph reasoning https://iopscience.iop.org/article/10.1088/2632-2153/ad7228

数据 与 代码:https://github.com/lamm-mit/GraphReasoning

阅读最新前沿科技研究报告,欢迎访问欧米伽研究所的“未来知识库”

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。


截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗第7轮导弹洗地开始,美航母基地遭殃,以色列先发制人成笑话

伊朗第7轮导弹洗地开始,美航母基地遭殃,以色列先发制人成笑话

黑鹰观军事
2026-02-28 22:32:24
丢脸丢到海外! 2023年,中国夫妻在日本旅游, 海滩上抓683只说要吃

丢脸丢到海外! 2023年,中国夫妻在日本旅游, 海滩上抓683只说要吃

万象硬核本尊
2026-02-27 18:28:04
B组排名:中国男篮2胜2负交锋劣势仍列第三 日韩前二中国台北垫底

B组排名:中国男篮2胜2负交锋劣势仍列第三 日韩前二中国台北垫底

醉卧浮生
2026-03-01 18:04:22
32万彩礼不让碰后续:彩礼已花完,女方全村社死,自曝另有隐情

32万彩礼不让碰后续:彩礼已花完,女方全村社死,自曝另有隐情

离离言几许
2026-02-28 18:06:09
上海浦东机场多架航班返航!中国旅客:我已经哭过了,感到后怕;中东机场改签排队数百米,国内三大航可免费退改签

上海浦东机场多架航班返航!中国旅客:我已经哭过了,感到后怕;中东机场改签排队数百米,国内三大航可免费退改签

大象新闻
2026-03-01 14:45:10
美国CIA只用不到100万美元,就将伊朗的国运改写了足足70多年

美国CIA只用不到100万美元,就将伊朗的国运改写了足足70多年

爆角追踪
2026-03-01 14:57:47
伊朗代表直接警告美方:我建议你保持礼貌!

伊朗代表直接警告美方:我建议你保持礼貌!

看看新闻Knews
2026-03-01 17:11:05
哈梅内伊身亡,布达诺夫:俄罗斯会接受美国为乌克兰提供的安全保证 | 狼叔看世界

哈梅内伊身亡,布达诺夫:俄罗斯会接受美国为乌克兰提供的安全保证 | 狼叔看世界

狼叔看世界
2026-03-01 11:40:52
沈逸“美国不敢打伊朗”遭群嘲:国内某些专家,为何总是制造笑柄

沈逸“美国不敢打伊朗”遭群嘲:国内某些专家,为何总是制造笑柄

影像温度
2026-03-01 15:26:25
美荷两国曾同时发声,对中国独立研发的光刻机技术给予了强烈批评

美荷两国曾同时发声,对中国独立研发的光刻机技术给予了强烈批评

来科点谱
2026-02-27 07:32:59
嘴炮失效,忠诚崩塌:从马杜罗到哈梅内伊,看现代战争的真相

嘴炮失效,忠诚崩塌:从马杜罗到哈梅内伊,看现代战争的真相

非勇时评
2026-03-01 12:38:27
陆军总司令遇难,最高领袖已被炸?伊朗报复,第一支援兵出现

陆军总司令遇难,最高领袖已被炸?伊朗报复,第一支援兵出现

吴欣纯Deborah
2026-03-01 12:28:11
迪拜夜空爆炸声不断!在迪深圳人亲历

迪拜夜空爆炸声不断!在迪深圳人亲历

深圳晚报
2026-03-01 18:38:25
女子回湖北婆家过年,车被妯娌砸稀烂,报警后绝不和解,结局爽了

女子回湖北婆家过年,车被妯娌砸稀烂,报警后绝不和解,结局爽了

不写散文诗
2026-02-28 17:19:21
美伊开战,却被中国卫星盯死!“天眼”24小时扫描,美军零秘密

美伊开战,却被中国卫星盯死!“天眼”24小时扫描,美军零秘密

书纪文谭
2026-02-28 19:28:21
5分钟4犯仍男篮功臣!末节超远三分绝平值千金 赵继伟14分钟13分

5分钟4犯仍男篮功臣!末节超远三分绝平值千金 赵继伟14分钟13分

颜小白的篮球梦
2026-03-01 17:55:55
切断霍尔木兹海峡后会发生什么?专家:布伦特原油可能率先突破80美元

切断霍尔木兹海峡后会发生什么?专家:布伦特原油可能率先突破80美元

财联社
2026-03-01 11:29:10
男篮100-93力克中国台北4坏消息!赵睿+王浩然辣眼,攻守一塌糊涂

男篮100-93力克中国台北4坏消息!赵睿+王浩然辣眼,攻守一塌糊涂

篮球资讯达人
2026-03-01 17:54:20
特朗普:美国正在“大规模”打击伊朗 消息人士:伊朗遇难者身份将令人震惊

特朗普:美国正在“大规模”打击伊朗 消息人士:伊朗遇难者身份将令人震惊

环球网资讯
2026-02-28 16:16:05
网友预测明天早上10点半 deepseek 发布V4 模型,首次没给英伟达权限,选择与华为合作

网友预测明天早上10点半 deepseek 发布V4 模型,首次没给英伟达权限,选择与华为合作

风向观察
2026-03-01 17:11:32
2026-03-01 19:07:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4552文章数 37413关注度
往期回顾 全部

科技要闻

小米超跑概念车全球首秀!杀入顶豪俱乐部

头条要闻

普京就哈梅内伊遇害表示哀悼:一次无耻杀害

头条要闻

普京就哈梅内伊遇害表示哀悼:一次无耻杀害

体育要闻

火箭输给热火:乌度卡又输斯波教练

娱乐要闻

《江山为聘》:吴谨言陈哲远燃炸朝堂

财经要闻

中东局势升级 如何影响A股、黄金和原油

汽车要闻

理想汽车2月交付26421辆 历史累计交付超159万辆

态度原创

数码
健康
房产
本地
公开课

数码要闻

小米首款追踪器!小米Tag海外正式发布 兼容iOS 120元起

转头就晕的耳石症,能开车上班吗?

房产要闻

滨江九小也来了!集齐海侨北+哈罗、寰岛...江东教育要炸了!

本地新闻

津南好·四时总相宜

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版