网易首页 > 网易号 > 正文 申请入驻

大脑如何理解视觉信息?LLM嵌入实现场景语义的可逆解码

0
分享至



不知诸位是否好奇过:当我们看一张复杂的照片,脑子里到底「想」了些什么?是单个物体的名字排列,还是一段连贯的、像句子一样的「场景理解」?

这些复杂的、高级的语义维度长久以来缺乏一个统一、可量化的表征格式。美国明尼苏达大学(University of Minnesota)与加拿大蒙特利尔大学(Université de Montréal)等提出了一个有趣的方法:把人类为图片写的自然语言说明(caption)送进 LLM ,取其句子嵌入(embedding),所得的向量应该能很好地对应人脑在看同一图像时的高阶视觉表征(higher-level visual cortex)。

他们的研究以「High-level visual representations in the human brain are aligned with large language models」为题,于 2025 年 8 月 7 日刊登在《Nature Machine Intelligence》。



论文链接:https://www.nature.com/articles/s42256-025-01072-0

大脑中的思考

为了实现他们的假设,研究者们结合了参与者在观看数千幅自然场景时收集的功能性磁共振成像(fMRI)数据,以及多变量编码和解码分析和 ANN 建模。

在建模上,他们把这些文本说明输入到基于 Transformer 的句子编码器(以 MPNet 为代表)得到句子嵌入;随后用表征相似性分析(RSA)与线性编码模型,把 LLM 嵌入和视觉皮层的多体素(voxel)激活模式进行比较与预测。



图 1:LLM 嵌入映射捕捉自然场景的视觉响应。

现在有了语言表征与脑表征,需要关注的就是:这俩之间到底能达到多高的匹配程度?

分析显示,句子级嵌入在高阶视觉皮层(腹侧语义相关区与顶叶等网络)与脑活动之间存在显著相关性(significant correspondence)。也就是说,语言向量不是随便一堆词的叠加,而能捕捉到大脑在编码场景语义时关心的那类信息。

既然如此,研究者们推测,是否就可以通过大脑活动反推出文字描述呢?

信号解码

研究团队进一步训练线性模型,把 fMRI 的多体素模式预测为 LLM 嵌入,并通过最近邻检索的方法把预测嵌入映射回最接近的 caption。结果显示,基于 LLM 嵌入的解码在许多高阶视觉区域上达到了显著的预测质量(并接近参与者间一致性的上限),能够重建出与图像语义相符的描述。



图 2:基于 LLM 的线性预测和脑活动解码。

LLM 表示在表征脑活动方面的成功表明,仅使用简单线性方法从视觉诱发的脑活动中准确推断出参与者所见的文本描述大致可行。为了重建场景描述,研究者们还使用了词典查找方法在一个包含 310 万描述的大语料库上重复测试,并获得了非常准确的参与者所见的文本描述。

经过不同的测试,团队先后确认了 LLMs 的能力是否不仅仅依赖于对象类别信息来与高级视觉皮层表示对齐;哪些方面促使 LLM 嵌入与脑数据一致;图注中词语之间的上下文信息是否关系到 LLM 嵌入与大脑的表征匹配。这些测试均代表着 LLMs 可以整合场景描述中重要的复杂信息,以匹配大脑活动。

用语言格式解码视觉

这篇工作把若干条重要线索连成一幅图:首先,它为「高阶视觉表征」的可量化描述提供了一个实用的格式(LLM 嵌入);其次,它展示了跨模态监督(text supervision)对学习接近人脑表征的视觉网络有显著价值;最后,它为临床研究等打开了多条未来路径。

这项研究有点像给视觉科学家和语言科学家办了场联谊会:大家各自把自己最会说的话换成向量,然后惊讶地发现——原来彼此讲的东西差不多。

研究结果表明,LLM 嵌入提供了一种灵活的表示格式,为应用现代分析工具来处理感觉区域中的高度抽象信息开辟了新的研究途径。研究者预测 LLM 嵌入(以及诸如从视觉输入中提取此类嵌入这种 ANN 模型)将为视觉计算神经科学和神经 AI 开辟新的方向并带来新的见解。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
研究发现:高血压的人若经常喝白酒,不用多长时间,或有5变化

研究发现:高血压的人若经常喝白酒,不用多长时间,或有5变化

蜉蝣说
2026-01-15 11:02:52
一涉刑资产劳斯莱斯库里南拍出528.6万,高出评估价57.6万元

一涉刑资产劳斯莱斯库里南拍出528.6万,高出评估价57.6万元

极目新闻
2026-01-27 17:24:56
加拿大是怎么被特鲁多在9年里“玩崩”的?

加拿大是怎么被特鲁多在9年里“玩崩”的?

萧遥笙
2026-01-15 12:25:03
国务院:免去李旭的新疆生产建设兵团副司令员、中国新建集团公司副总经理职务

国务院:免去李旭的新疆生产建设兵团副司令员、中国新建集团公司副总经理职务

中国能源网
2026-01-26 17:36:06
奥塔门迪:战皇马唯一的目标是取胜,攻防两端都要有完美表现

奥塔门迪:战皇马唯一的目标是取胜,攻防两端都要有完美表现

懂球帝
2026-01-27 23:16:03
外资撤不走,中国拦不住,如今的中国广东,制造早已不是代工

外资撤不走,中国拦不住,如今的中国广东,制造早已不是代工

甜柠聊史
2026-01-23 14:01:57
3500万卖出22岁希望之星:瓜帅前锋人手太多,只好放弃培养他

3500万卖出22岁希望之星:瓜帅前锋人手太多,只好放弃培养他

里芃芃体育
2026-01-27 05:00:03
西宫美娘娘真美,气质真的好

西宫美娘娘真美,气质真的好

素然追光
2025-12-31 00:26:05
带老婆全裸闹红毯!「肯爷崩溃道歉了」 认脑部严重损伤:不想活下去

带老婆全裸闹红毯!「肯爷崩溃道歉了」 认脑部严重损伤:不想活下去

ETtoday星光云
2026-01-27 10:58:05
最早下月入华!马斯克谈特斯拉FSD功能巨大提升:司机可在开车时玩手机、睡觉

最早下月入华!马斯克谈特斯拉FSD功能巨大提升:司机可在开车时玩手机、睡觉

快科技
2026-01-26 16:04:06
高市早苗惹的祸!日民众排队送别大熊猫,超31万人想见最后一面

高市早苗惹的祸!日民众排队送别大熊猫,超31万人想见最后一面

军武咖
2026-01-27 14:33:50
中国科学院大学星际航行学院成立!领导班子亮相

中国科学院大学星际航行学院成立!领导班子亮相

每日经济新闻
2026-01-27 10:27:06
我1.3万退休金带外孙8年,看到女婿手机备注后,果断收拾行李回家

我1.3万退休金带外孙8年,看到女婿手机备注后,果断收拾行李回家

兰姐说故事
2025-05-30 17:10:03
沿海城市都在人口流入,山东人口为何流出?

沿海城市都在人口流入,山东人口为何流出?

虔青
2026-01-26 11:17:23
宇航员登月回归后精神失常,死前坦言:人类不应踏足远方

宇航员登月回归后精神失常,死前坦言:人类不应踏足远方

清茶浅谈
2024-12-20 22:30:46
年底开始喜事临门,哪3大生肖有贵人帮扶,意外收获不断

年底开始喜事临门,哪3大生肖有贵人帮扶,意外收获不断

人閒情事
2026-01-27 18:28:31
不当跟班!斯塔默豪赌独立外交:在特朗普眼皮子底下与中国握手

不当跟班!斯塔默豪赌独立外交:在特朗普眼皮子底下与中国握手

青春染指红颜梦
2026-01-27 21:25:22
国籍争议不到1年,人民日报公开点名谷爱凌,邓亚萍的话有人信了

国籍争议不到1年,人民日报公开点名谷爱凌,邓亚萍的话有人信了

阅微札记
2025-12-22 14:28:33
个人能力确实相当不错,但火箭锋线新星还是打得有些不太合理?

个人能力确实相当不错,但火箭锋线新星还是打得有些不太合理?

稻谷与小麦
2026-01-27 22:57:15
张钧宁操到「体脂剩13%」下床靠手搬脚! 柯汶利霸气护爱:她整部片都美

张钧宁操到「体脂剩13%」下床靠手搬脚! 柯汶利霸气护爱:她整部片都美

ETtoday星光云
2026-01-27 18:42:06
2026-01-28 04:32:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1219文章数 223关注度
往期回顾 全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

美报告称中国是其19世纪以来面对过的最强大国家

头条要闻

美报告称中国是其19世纪以来面对过的最强大国家

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮风波持续发酵,曝多个商务被取消

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

家居
时尚
旅游
手机
游戏

家居要闻

现代古典 中性又显韵味

这些韩系穿搭最适合普通人!多穿深色、衣服基础,简洁耐看

旅游要闻

红灯笼映北海:皇家园林里的年味,藏着中国人的精神原乡!

手机要闻

苹果连发4版系统:从iPhone 5s到iOS 26,果粉福音来了!

LPL春季赛:决绝让一追二,AL三局击溃IG,大家的排名都不变

无障碍浏览 进入关怀版