网易首页 > 网易号 > 正文 申请入驻

刚刚,“Transformer八子”之一创业团队提出“连续思维机器”:如人类推理般可解释,还能涌现新能力

0
分享至

来源:学术头条

作者:学术君

当前的人工神经网络只是对生物神经网络的极其简化模拟,在能力和效率方面远远落后于人脑。

我们能否进一步结合生物大脑中的特征,将人工智能(AI)的能力和效率提升到新的水平?

受生物神经网络的启发,由“Transformer八子”之一 Llion Jones 联合创立 Sakana AI 提出了一种新型人工神经网络——“连续思维机器”(Continuous Thought Machine,CTM)。

与传统人工神经网络不同,CTM 将神经元活动同步作为核心推理机制,在神经元层面使用时序(timing)信息,从而实现了更复杂的神经行为和决策过程。

研究表明,CTM 能够逐步“思考”问题,在各种任务中解决问题的能力和效率都有所提高,其推理过程也具有可解释性,更像人一般

视频|CTM 如人类一般解迷宫和思考真实图像。

相关研究论文以“

Continuous Thought Machines
”为题,已发表在预印本网站 arXiv 上。

研究团队认为,CTM 是弥合人工神经网络与生物神经网络之间鸿沟的重要一步,有望开启人工智能能力的新领域。

CTM:可解释、智能涌现

尽管深度学习推动了人工智能领域的变革式发展,但自 20 世纪 80 年代以来,人工智能模型中使用的人工神经元的基础模型在很大程度上没有变化,仍然主要使用神经元的单一输出(代表神经元的放电情况),忽略了神经元相对于其他神经元放电的精确时间。

然而,强有力的证据表明,这种时序信息在生物大脑中至关重要。

在 CTM 模型中,神经元可以访问自己的行为历史,并学习如何利用这些信息来计算自己的下一个输出,而不是仅仅知道自己的当前状态。这样,神经元就能根据过去不同时期的信息改变自己的行为。此外,CTM 的主要行为是基于这些神经元之间的同步,这意味着它们必须学会利用这些时序信息来协调完成任务。与传统模型中可被观察到的情况相比,这将产生更丰富的动态空间和不同的任务解决行为。

在添加了这种时序信息后,研究团队观察到了高度可解释的行为。例如,在浏览图像时,CTM 会仔细地将视线在场景中移动,并选择关注最显著的特征。

据论文描述,CTM 的行为基于一种新的表征:神经元之间随时间的同步。这更容易让人联想到生物大脑,但并非严格意义上的仿真。于是,CTM 能够利用这种新的时间维度、丰富的神经元动态和同步信息来“思考”任务,并在给出答案前制定计划。“连续”则表示 CTM 的推理完全在内部“思考维度”运行。对于所使用的数据,它是异步的:能够以相同的方式对静态数据(如图像)或序列数据进行推理。

研究团队表示,他们观察到的神经元动态在某种程度上更像是在真实大脑中测量到的动态,而不是更传统的人工神经网络,后者表现出的行为多样性要少得多。CTM 显示了以不同频率和振幅振荡的神经元。有时,单个神经元会出现不同频率的振荡,而其他神经元只有在完成任务时才会出现活动。

值得强调的是,所有这些行为都是完全涌现的,并没有被设计到模型中。

图|CTM 的神经动态与当前主流人工神经网络的动态对比。

像人一样求解迷宫、识别图像

由于有了新的时间维度,CTM 的一大优势在于,我们可以观察并直观地看到它是如何随着时间的推移解决问题的。

传统的人工智能系统可能只需通过一次神经网络就能对图像进行分类,而 CTM 则不同,它可以采取多个步骤来“思考”如何解决任务。

研究团队展示了两个任务:迷宫求解和照片中的物体分类。

1.迷宫求解

在这项任务中,CTM 会看到一个自上而下的二维迷宫,并被要求输出求解迷宫所需的步骤。这种形式特别具有挑战性,因为模型必须建立对迷宫结构的理解并规划解决方案,而不仅仅是输出路径的视觉呈现。CTM 的内部连续“思考步骤”允许它制定计划,它在每个思考步骤中关注迷宫的哪些部分可以被直观得观察到。值得注意的是,CTM 学会了一种非常类似人类的求解迷宫的方法——从它的注意力模式来看,它实际上是在沿着迷宫的路径前进。

视频|CTM 通过观察(利用注意力)和直接产生步骤(如向左、向右等)来求解迷宫问题。它直接利用神经动态同步(即利用同步本身的线性探针)来实现目的。

尤其令人印象深刻的是,这种行为是在模型架构中自然产生的。研究团队并没有明确设计 CTM 在迷宫中追踪路径,它是通过学习自行开发出这种方法的。

此外,研究团队还发现,当允许有更多思考步骤时,CTM 会继续沿着路径前进,超过了训练它这样做的时间点,这表明它确实已经学会了这个问题的通用解决方案。

2.图像识别

另一方面,研究团队以 ImageNet 基准为例,展示了 CTM 在图像识别方面的能力。

传统的图像识别系统只需一步就能做出分类决定,但 CTM 在做出决定前会采取多个步骤检查图像的不同部分。这种循序渐进的方法不仅使人工智能的行为更具可解释性,还提高了准确性:“思考”的时间越长,答案就越准确。

研究团队还发现,这可以让 CTM 决定在更简单的图像上花费更少的思考时间,从而节省能源。例如,在识别大猩猩时,CTM 的注意力从眼睛到鼻子再到嘴巴,其模式与人类的视觉注意力非常相似。

视频|CTM 在对图像进行分类时的行为示例。热图显示了 CTM 在处理图像时的关注点,箭头表示关注点的中心。

研究团队表示,这些注意力模式有助于我们了解模型的推理过程,了解模型认为哪些特征与分类最为相关。这种可解释性不仅对理解模型的决策很有价值,而且对识别和解决偏差或失败模式也很有潜力。


更多交互案例请查阅官方交互报告:

https://pub.sakana.ai/ctm/

生物学+计算技术,更强、更高效

尽管现代人工智能是以大脑为基础的“人工神经网络”,但即使在今天,人工智能研究与神经科学之间的重叠也少得令人吃惊。主要原因包括以下两点:

一方面,人工智能研究人员依然选择沿用 80 年代开发的非常简单的模型,因为它简单、训练高效,并能持续成功地推动人工智能的进步。

另一方面,神经科学创建了更加精确的大脑模型,但主要目的是为了理解大脑,而非试图创建更智能的模型,因而性能远低于当前的传统人工智能模型。

“CTM 是我们在这两个领域之间架起桥梁的首次尝试,它初步显示了一些更像大脑的行为,同时仍然是解决重要问题的实用人工智能模型。”

研究团队认为,有了 CTM 的这次尝试,我们可能会通过这种方式构建能力更强、效率更高的模型。

阅读最新前沿科技趋势报告,请访问欧米伽研究所的“未来知识库”

https://wx.zsxq.com/group/454854145828

未来知识库是“ 欧米伽 未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。 欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。

截止到3月31日 ”未来知识库”精选的百部前沿科技趋势报告

(加入未来知识库,全部资料免费阅读和下载)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
广厦101-93击败上海!两队差距不大,王博此前用人太固执。

广厦101-93击败上海!两队差距不大,王博此前用人太固执。

体育一点就通
2026-06-03 05:13:00
老人精通一绝技,四年拿下二十六女,背后真相令人震惊

老人精通一绝技,四年拿下二十六女,背后真相令人震惊

雾岛夜话
2025-06-02 17:30:56
罗马诺:老佛爷胜选后皇马会连续官宣

罗马诺:老佛爷胜选后皇马会连续官宣

懂球帝
2026-06-03 03:29:16
重磅!松岛辉空离队后签约!与张本智和成队友!王楚钦林诗栋危险了!

重磅!松岛辉空离队后签约!与张本智和成队友!王楚钦林诗栋危险了!

好乒乓
2026-06-02 16:01:38
他连粥都不会煮,我才看清了婚姻里的那些事

他连粥都不会煮,我才看清了婚姻里的那些事

一隅安稳
2026-06-02 02:01:47
炸锅了!6 月 1 日准时通车!青岛最美自驾公路重启,自驾党集体沸腾

炸锅了!6 月 1 日准时通车!青岛最美自驾公路重启,自驾党集体沸腾

荷兰豆爱健康
2026-06-02 18:30:38
韩国“鸟叔”已被移交检察机关

韩国“鸟叔”已被移交检察机关

都市快报橙柿互动
2026-06-02 12:04:32
比赖清德还狂!若2028年她当台湾地区领导人,解放军出手武力统台

比赖清德还狂!若2028年她当台湾地区领导人,解放军出手武力统台

阿讯说天下
2026-05-26 13:40:22
两个乌克兰姑娘,在广州找到了第二个家

两个乌克兰姑娘,在广州找到了第二个家

捣蛋窝
2026-06-02 13:25:06
台湾最新民调:赖清德支持率回升,支持“台独”比例下降,不简单

台湾最新民调:赖清德支持率回升,支持“台独”比例下降,不简单

清欢百味
2026-06-02 15:22:14
纳斯达克金龙中国指数收涨1.83%,报6805.68点

纳斯达克金龙中国指数收涨1.83%,报6805.68点

每日经济新闻
2026-06-03 05:31:05
身价过百亿,坐拥北京一条街,出门私人飞机,京圈内的富婆都有谁

身价过百亿,坐拥北京一条街,出门私人飞机,京圈内的富婆都有谁

历史伟人录
2026-04-28 17:50:14
徐志胜女友正脸首曝光!恋爱五年见家长,网友:这夫妻相绝了

徐志胜女友正脸首曝光!恋爱五年见家长,网友:这夫妻相绝了

阿废冷眼观察所
2026-06-02 18:51:14
最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

最高院:提供 “口交” “肛交”等进入式性服务,是否属卖淫行为?

周军律师聊案子
2026-04-21 09:50:16
“人间异类”陈瑾:20年不吃米饭,跟哥哥相约一生不婚不育

“人间异类”陈瑾:20年不吃米饭,跟哥哥相约一生不婚不育

观察者小海风
2026-06-02 13:43:18
上海交大研究证实:糖尿病人每周饿两天,效果竟不输降糖药?

上海交大研究证实:糖尿病人每周饿两天,效果竟不输降糖药?

白宸侃片
2026-06-02 13:40:28
游客吃潮汕火锅嫌“口太淡”要挟写“5000字差评”要免单,火锅店最新回应:高峰期排队上千桌,为顾全大局妥协

游客吃潮汕火锅嫌“口太淡”要挟写“5000字差评”要免单,火锅店最新回应:高峰期排队上千桌,为顾全大局妥协

洪观新闻
2026-06-02 13:19:43
四川资中一小区6户业主玻璃窗被弹珠击穿 警方回应:初步判断有人用弹弓打鸟 | 云求助

四川资中一小区6户业主玻璃窗被弹珠击穿 警方回应:初步判断有人用弹弓打鸟 | 云求助

封面新闻
2026-06-02 21:10:06
中美关税大战:主要成果不是中国胜了, 而是美国再无手段控制中国

中美关税大战:主要成果不是中国胜了, 而是美国再无手段控制中国

傲傲讲历史
2026-06-03 04:05:36
宝妈吐槽女儿同学来家玩没有边界感,很晚也不回家,评论区炸锅!

宝妈吐槽女儿同学来家玩没有边界感,很晚也不回家,评论区炸锅!

另子维爱读史
2026-06-02 20:59:16
2026-06-03 06:23:00
人工智能学家 incentive-icons
人工智能学家
人工智能领域权威媒体
4787文章数 37472关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

头条要闻

演员魏宗万去世 曾在94版《三国演义》中饰演"司马懿"

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君补办婚礼超幸福

财经要闻

智元和宇树的“暗战”愈演愈烈

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

本地
教育
数码
手机
旅游

本地新闻

用剪纸的方式,打开江苏扬州

教育要闻

今天是6月3日,农历四月十八。距离高考还有四天,专属于你的考前祝福一定要收下

数码要闻

HPB散热加持!三星HBM5预计2028年实现量产

手机要闻

华为凌霄子母路由Q7电线版星闪电竞专链功能首批支持机型公布

旅游要闻

北京位列全球数字旅游引领型城市榜首

无障碍浏览 进入关怀版