如果有一天,你脑子里想打的字,AI能直接“听”懂,还不用做开颅手术——这事儿靠谱吗?Meta的FAIR团队刚刚给出了新答案:Brain2Qwerty v2模型,从头皮外测到的脑磁信号里,就能拼出完整句子,平均词错率压到了39%,表现最好的参与者甚至只有22%。
先看这张“信号流水线”怎么跑。研究人员找了9名健康志愿者,戴上脑磁图(MEG)扫描仪,在脑袋外面测磁场变化。每个人都被记录了整整10个小时,总共敲了22000个句子。过程是这样:先听一句,稍停,然后盲打字(看不到屏幕)。模型抓取的,正是打字那几秒大脑控制手指的运动皮层信号,再反推到底是哪些字母。
![]()
这里面有一层关键升级。上一代Brain2Qwerty v1像个“节拍器依赖症患者”,得靠精确到每一次按键的时间戳,才能对齐信号。v2直接扔掉这个拐杖,在连续时间窗里自己划分字符,不需要任何按键时间信息。之所以能做到,全靠数据量暴增——每个人的记录量是原来的10倍,句子花样也更多。这让无延时解码从一个需要手术的方案,变成了可能的选项,虽然还没走到真正的实时输出那一步。
再往下拆,模型靠三个AI组件把模糊的脑信号“清洗”出来。最底层,深度学习替换了旧版手工特征提取。中层在字符、单词和整句三个尺度上同时处理信号。顶层调用一个针对任务微调过的语言模型Qwen3,把那些像被水泡过的神经信号,修正成符合语法的句子。有意思的是,他们还让AI自己写优化代码,整套流程几乎没留什么人工调参的缝隙。
效果怎么样?不加语言模型的原始编码器,词错率高达55%。用上Qwen3之后直接拉到39%。在表现最好的那个人身上,28%的句子一个词都没错,47%的句子最多只错一个词。不过有个反直觉的小细节:虽然词层面的正确率上去了,但单个字符层面的错误反而可能变多,原因在于语言模型会为了词的合理性而“脑补”修正个别字母,这也算是个甜蜜的副作用。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.