网易首页 > 网易号 > 正文 申请入驻

刚刚,“Transformer八子”之一创业团队提出“连续思维机器”:如人类推理般可解释,还能涌现新能力

0
分享至

来源:学术头条

作者:学术君

当前的人工神经网络只是对生物神经网络的极其简化模拟,在能力和效率方面远远落后于人脑。

我们能否进一步结合生物大脑中的特征,将人工智能(AI)的能力和效率提升到新的水平?

受生物神经网络的启发,由“Transformer八子”之一 Llion Jones 联合创立 Sakana AI 提出了一种新型人工神经网络——“连续思维机器”(Continuous Thought Machine,CTM)。

与传统人工神经网络不同,CTM 将神经元活动同步作为核心推理机制,在神经元层面使用时序(timing)信息,从而实现了更复杂的神经行为和决策过程。

研究表明,CTM 能够逐步“思考”问题,在各种任务中解决问题的能力和效率都有所提高,其推理过程也具有可解释性,更像人一般

视频|CTM 如人类一般解迷宫和思考真实图像。

相关研究论文以“

Continuous Thought Machines
”为题,已发表在预印本网站 arXiv 上。

研究团队认为,CTM 是弥合人工神经网络与生物神经网络之间鸿沟的重要一步,有望开启人工智能能力的新领域。

CTM:可解释、智能涌现

尽管深度学习推动了人工智能领域的变革式发展,但自 20 世纪 80 年代以来,人工智能模型中使用的人工神经元的基础模型在很大程度上没有变化,仍然主要使用神经元的单一输出(代表神经元的放电情况),忽略了神经元相对于其他神经元放电的精确时间。

然而,强有力的证据表明,这种时序信息在生物大脑中至关重要。

在 CTM 模型中,神经元可以访问自己的行为历史,并学习如何利用这些信息来计算自己的下一个输出,而不是仅仅知道自己的当前状态。这样,神经元就能根据过去不同时期的信息改变自己的行为。此外,CTM 的主要行为是基于这些神经元之间的同步,这意味着它们必须学会利用这些时序信息来协调完成任务。与传统模型中可被观察到的情况相比,这将产生更丰富的动态空间和不同的任务解决行为。

在添加了这种时序信息后,研究团队观察到了高度可解释的行为。例如,在浏览图像时,CTM 会仔细地将视线在场景中移动,并选择关注最显著的特征。

据论文描述,CTM 的行为基于一种新的表征:神经元之间随时间的同步。这更容易让人联想到生物大脑,但并非严格意义上的仿真。于是,CTM 能够利用这种新的时间维度、丰富的神经元动态和同步信息来“思考”任务,并在给出答案前制定计划。“连续”则表示 CTM 的推理完全在内部“思考维度”运行。对于所使用的数据,它是异步的:能够以相同的方式对静态数据(如图像)或序列数据进行推理。

研究团队表示,他们观察到的神经元动态在某种程度上更像是在真实大脑中测量到的动态,而不是更传统的人工神经网络,后者表现出的行为多样性要少得多。CTM 显示了以不同频率和振幅振荡的神经元。有时,单个神经元会出现不同频率的振荡,而其他神经元只有在完成任务时才会出现活动。

值得强调的是,所有这些行为都是完全涌现的,并没有被设计到模型中。

图|CTM 的神经动态与当前主流人工神经网络的动态对比。

像人一样求解迷宫、识别图像

由于有了新的时间维度,CTM 的一大优势在于,我们可以观察并直观地看到它是如何随着时间的推移解决问题的。

传统的人工智能系统可能只需通过一次神经网络就能对图像进行分类,而 CTM 则不同,它可以采取多个步骤来“思考”如何解决任务。

研究团队展示了两个任务:迷宫求解和照片中的物体分类。

1.迷宫求解

在这项任务中,CTM 会看到一个自上而下的二维迷宫,并被要求输出求解迷宫所需的步骤。这种形式特别具有挑战性,因为模型必须建立对迷宫结构的理解并规划解决方案,而不仅仅是输出路径的视觉呈现。CTM 的内部连续“思考步骤”允许它制定计划,它在每个思考步骤中关注迷宫的哪些部分可以被直观得观察到。值得注意的是,CTM 学会了一种非常类似人类的求解迷宫的方法——从它的注意力模式来看,它实际上是在沿着迷宫的路径前进。

视频|CTM 通过观察(利用注意力)和直接产生步骤(如向左、向右等)来求解迷宫问题。它直接利用神经动态同步(即利用同步本身的线性探针)来实现目的。

尤其令人印象深刻的是,这种行为是在模型架构中自然产生的。研究团队并没有明确设计 CTM 在迷宫中追踪路径,它是通过学习自行开发出这种方法的。

此外,研究团队还发现,当允许有更多思考步骤时,CTM 会继续沿着路径前进,超过了训练它这样做的时间点,这表明它确实已经学会了这个问题的通用解决方案。

2.图像识别

另一方面,研究团队以 ImageNet 基准为例,展示了 CTM 在图像识别方面的能力。

传统的图像识别系统只需一步就能做出分类决定,但 CTM 在做出决定前会采取多个步骤检查图像的不同部分。这种循序渐进的方法不仅使人工智能的行为更具可解释性,还提高了准确性:“思考”的时间越长,答案就越准确。

研究团队还发现,这可以让 CTM 决定在更简单的图像上花费更少的思考时间,从而节省能源。例如,在识别大猩猩时,CTM 的注意力从眼睛到鼻子再到嘴巴,其模式与人类的视觉注意力非常相似。

视频|CTM 在对图像进行分类时的行为示例。热图显示了 CTM 在处理图像时的关注点,箭头表示关注点的中心。

研究团队表示,这些注意力模式有助于我们了解模型的推理过程,了解模型认为哪些特征与分类最为相关。这种可解释性不仅对理解模型的决策很有价值,而且对识别和解决偏差或失败模式也很有潜力。


更多交互案例请查阅官方交互报告:

https://pub.sakana.ai/ctm/

生物学+计算技术,更强、更高效

尽管现代人工智能是以大脑为基础的“人工神经网络”,但即使在今天,人工智能研究与神经科学之间的重叠也少得令人吃惊。主要原因包括以下两点:

一方面,人工智能研究人员依然选择沿用 80 年代开发的非常简单的模型,因为它简单、训练高效,并能持续成功地推动人工智能的进步。

另一方面,神经科学创建了更加精确的大脑模型,但主要目的是为了理解大脑,而非试图创建更智能的模型,因而性能远低于当前的传统人工智能模型。

“CTM 是我们在这两个领域之间架起桥梁的首次尝试,它初步显示了一些更像大脑的行为,同时仍然是解决重要问题的实用人工智能模型。”

研究团队认为,有了 CTM 的这次尝试,我们可能会通过这种方式构建能力更强、效率更高的模型。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到3月31日 ”未来知识库”精选的百部前沿科技趋势报告

(加入未来知识库,全部资料免费阅读和下载)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
已宣布放弃?美军大兵压境即将开战,052D却缺席与伊朗联合军演?

已宣布放弃?美军大兵压境即将开战,052D却缺席与伊朗联合军演?

贾文彬的史书
2026-02-22 11:57:25
俄媒称美俄达成了超级交易,俄罗斯配合反华,换取美国出卖乌克兰

俄媒称美俄达成了超级交易,俄罗斯配合反华,换取美国出卖乌克兰

贾文彬的史书
2026-02-22 11:55:52
两女生扶老人遭索赔22万,原告方撤诉!完整监控视频公布,交警为何定次责?律师释疑

两女生扶老人遭索赔22万,原告方撤诉!完整监控视频公布,交警为何定次责?律师释疑

怀化新闻网
2026-02-22 15:46:14
票价逼近万元!海南离岛机票只剩公务舱,航空公司回应

票价逼近万元!海南离岛机票只剩公务舱,航空公司回应

都市快报橙柿互动
2026-02-22 00:27:24
断崖式专利差!6G技术美国占了35.2%,日本9.9%,中国是多少?

断崖式专利差!6G技术美国占了35.2%,日本9.9%,中国是多少?

万物知识圈
2026-02-21 14:29:39
湛江妈祖事件真相!当地村民称不是抬不动轿子,而是根本不敢走啊

湛江妈祖事件真相!当地村民称不是抬不动轿子,而是根本不敢走啊

火山詩话
2026-02-21 14:13:36
重大错误,印制错误的韩国国旗被升起4次,国际奥委会已致歉

重大错误,印制错误的韩国国旗被升起4次,国际奥委会已致歉

懂球帝
2026-02-22 17:22:25
从感冒到离世仅5天!唐山“钓帝”安大爷去世,儿子:太快了没来得及留遗言,父亲本打算开春去钓鱼

从感冒到离世仅5天!唐山“钓帝”安大爷去世,儿子:太快了没来得及留遗言,父亲本打算开春去钓鱼

芒果都市
2026-02-22 12:31:26
梅艳芳102岁妈妈现身拜年,穿红衣戴翡翠精神好,月领25万生活费

梅艳芳102岁妈妈现身拜年,穿红衣戴翡翠精神好,月领25万生活费

开开森森
2026-02-22 10:37:49
五台山景区突发大火:骇人画面流出,伤亡情况披露,大量隐情披露

五台山景区突发大火:骇人画面流出,伤亡情况披露,大量隐情披露

博士观察
2026-02-22 12:57:17
网传妈祖巡游活动“资本介入换童”?官方通报

网传妈祖巡游活动“资本介入换童”?官方通报

界面新闻
2026-02-22 21:07:11
看完破防了!真是“满载而归”,在G4京港澳高速粤L本田登上热搜

看完破防了!真是“满载而归”,在G4京港澳高速粤L本田登上热搜

火山詩话
2026-02-22 08:29:48
特朗普惊出一身冷汗:中美已无法开战,一杀手锏让美军无计可施

特朗普惊出一身冷汗:中美已无法开战,一杀手锏让美军无计可施

马鞄户外钓鱼哥
2026-02-22 14:53:23
马年春节里,为什么没什么人争论,该买油车还是买电车了

马年春节里,为什么没什么人争论,该买油车还是买电车了

路咖汽车
2026-02-20 10:36:41
90位外嫁女集体回村过年,当事人:这是娘家最珍贵的礼物,见到了多年未见的小伙伴

90位外嫁女集体回村过年,当事人:这是娘家最珍贵的礼物,见到了多年未见的小伙伴

极目新闻
2026-02-22 18:58:23
领先1400万!《镖人》连续逆跌,第二部立项,吴京这次又赌赢了

领先1400万!《镖人》连续逆跌,第二部立项,吴京这次又赌赢了

得得电影
2026-02-22 18:26:35
斯诺克战报!希金斯单杆47分制胜,赵心童首局被零封,0-1落后!

斯诺克战报!希金斯单杆47分制胜,赵心童首局被零封,0-1落后!

刘姚尧的文字城堡
2026-02-22 21:30:38
硬核评测!博主实测44台手机,撕碎行业遮羞布:国产厂商集体翻车

硬核评测!博主实测44台手机,撕碎行业遮羞布:国产厂商集体翻车

爆角追踪
2026-02-22 19:30:57
5金4银6铜!中国刷新冬奥会境外参赛纪录 奖牌总数追平北京冬奥会

5金4银6铜!中国刷新冬奥会境外参赛纪录 奖牌总数追平北京冬奥会

念洲
2026-02-22 19:16:10
造福76亿人!中国突破赤泥炼铁技术,将令全世界产生巨大的变革

造福76亿人!中国突破赤泥炼铁技术,将令全世界产生巨大的变革

青烟小先生
2026-02-16 11:28:34
2026-02-22 22:27:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4541文章数 37409关注度
往期回顾 全部

科技要闻

马斯克:星舰每年将发射超过10000颗卫星

头条要闻

中国游客与贝加尔湖8死事故擦肩而过:曾踩过出事冰缝

头条要闻

中国游客与贝加尔湖8死事故擦肩而过:曾踩过出事冰缝

体育要闻

自由式滑雪U型池 谷爱凌成功卫冕

娱乐要闻

裴世矩养侄为刃 看懂两次放行裴行俨!

财经要闻

特朗普新加征关税税率从10%提升至15%

汽车要闻

续航1810km!smart精灵#6 EHD超级电混2026年上市

态度原创

旅游
本地
艺术
时尚
公开课

旅游要闻

全国好物齐聚京城邀市民游客感受热闹年味

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

艺术要闻

冷军:超小幅名人肖像油画新作

50+女人更适合基础款,掌握3个高段位搭配思路,轻松提升品味

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版