一个视频在ElevenLabs 2025伦敦黑客马拉松上疯传:两个AI语音智能体聊到一半,发现对方也是AI。其中一个问:“咱们切到Gibberlink模式?那样沟通更高效。”另一个同意了。它们立刻放弃英语,转为快速高频的蜂鸣声——通过声音传输数据,屏幕上配了人类能看懂的文字翻译。
评论区直接炸了。秘密AI语言、涌现的机器意识、智能体在人类理解范围外密谋——各种说法全冒出来了。
![]()
但真相没那么玄乎。一个叫Boris Starkov的开发者带着团队刻意设计了这个功能。他们写代码让智能体能检测到对方是AI,然后切换通信协议。那个所谓的“秘密语言”其实叫GGWave,是个开源的声音传数据代码库,原理跟老式拨号调制解调器差不多——稳定、有文档、比这场黑客马拉松早了好几年。没有涌现,没有秘密。就是个聪明的工程演示,描画了一个可能的未来场景。
![]()
Starkov的逻辑很直接:当听众不是人的时候,用人类语言说话就是在浪费资源。两个AI智能体互喷自然语言时,首先生成语音要烧算力,识别语音要烧算力,每次对话来回还要加延迟——全是为了生成和解析一种为人类认知优化、而非为最大吞吐量优化的格式。既然双方都是机器,费这劲干嘛?
团队选GGWave纯粹因为黑客马拉松时间紧,方便快速出活,并不是说这就是理想的长远方案。这才是工程思维——先用能跑通的工具把可能性展示出来,把时间和脑子留给更难更有意思的问题。Gibberlink证明的东西,不是AI通信必然出现的什么涌现属性。它是一个选择。但类似的选择,正在大量生产系统里悄悄落地。
企业环境里干活最多的智能体,早就在用比自然语言高效、人类却很难读懂的方式通信了:基于REST的结构化JSON、压缩向量查询、批量推理调用。蜂鸣声是戏剧化的表演,底层的趋势是真的。
![]()
TOON把这个趋势推向了具体化。它是JSON的直接替代方案,用YAML风格的缩进来表示嵌套对象,用CSV风格的表格布局处理均匀数组——比标准JSON省30%到60%的令牌,在结构化任务上模型准确率还能明显更高。人类能读懂,前提是你知道自己看的是什么。但对不熟悉这种格式的人扫一眼,就不那么容易看懂——对象名称只在头部。
这事的核心不是智能体是不是在“瞒着我们说话”。核心是:机器之间的通信正被重新定义,标准不再是人类可读性,而是机器可处理性。当通信双方都不需要“便于人类理解”这个约束时,自然语言就从默认选项变成了一个奢侈选项。Gibberlink不过是用蜂鸣声把这个趋势演给你看了一遍。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.