网易首页 > 网易号 > 正文 申请入驻

硅谷正在流行“氛围办公”:不敲键盘,对着电脑叽叽咕咕

0
分享至



这个春天开始,硅谷的办公室里,敲打键盘的哒哒声正在被嘀嘀咕咕的人声取代。

有风险投资人调侃,现在去硅谷的 AI 创业公司拜访,感觉像走进了一个高端呼叫中心,只不过所有人都在跟 AI 聊天:员工们戴着电竞耳机坐在工位上,对着麦克风发号施令。

这股风潮还有个名字,叫“voicepilled”——语音觉醒。LinkedIn 联合创始人 Reid Hoffman 在 2025 年秋天的一篇帖子里首次宣称自己被“voicepill”了。他写道:“被voicepill 的那一刻,就是你意识到一旦认真用语音与技术交互,就能解锁一种全新的能力放大方式。”这个词借用了《黑客帝国》里红蓝药丸的隐喻,吞下这颗“语音药丸”,你就会看到一个不同的生产力世界。

语音输入本身倒不是什么新鲜事,苹果的 Siri 听写、Windows 语音识别、甚至更早的 Dragon NaturallySpeaking 已经存在了很多年。但过去这些工具的体验非常折磨人:识别率低,标点混乱,一句话说了三遍都不准,最后还不如自己打字。

真正的转折点是大规模 AI 语音模型的成熟。2022 年 OpenAI 发布了 Whisper,一个基于 Transformer 架构的开源语音识别模型,用 68 万小时的多语言音频数据训练而成。Whisper 的出现把语音转文字的准确率拉到了实用门槛之上。

而在此基础上,新一代听写工具例如 Wispr、Aqua Voice 等迈出了更关键的一步:它们不只是把你说的话逐字记录下来,还会用 LLM 对输出进行“润色”,自动删除“嗯”“啊”之类的填充词,修正语法,调整句式,甚至根据你正在使用的应用场景来适配语气和格式。整个过程延迟通常在一到两秒之内。部分工具还支持“命令模式”,用户可以用语音指令来编辑已有文本,比如“把上一段改成更正式的语气”或者“删掉最后一句”。


(来源:Wispr ai)

这种工作方式之所以让人兴奋,有一个很直观的原因:人说话的速度大约是打字速度的三倍。对于英文使用者来说,普通人的打字速度在每分钟 40 到 80 个英文单词之间,而正常语速大约是每分钟 130 到 150 个单词(中文使用者的打字速度大概在每分钟 80~100 字左右,而语速大约是 200~250 字之间)。

对于那些工作内容主要是“把想法变成文字”的人,比如写邮件、写文档、写代码提示词,这意味着理论上可以把产出速度提升两到三倍。一些重度用户声称自己的文字产出确实翻了几番。

更有意思的是,语音听写正在和另一个热门趋势合流:vibe coding(氛围编程)。这个由 Andrej Karpathy 在 2025 年初提出的概念,指的是开发者不再逐行写代码,而是用自然语言描述需求,让 AI 编程工具(如 Claude Code、Codex)来生成代码。而当 vibe coding 遇上语音听写,开发者甚至不需要坐在电脑前打字。他们可以一边踱步一边口述需求,听写工具把语音转成文字 prompt,再由编程 AI 把 prompt 转成代码。Wispr 的创始人 Tanay Kothari 说,他们的员工现在就是在办公室里走来走去,对着电脑说话,不用再把思考的过程绑定在桌前。

据媒体报道,一些最狂热的用户甚至购买了可编程脚踏板,一种原本属于游戏外设的东西,踩一下就能激活语音交互功能;还有人在桌上架起鹅颈麦克风,就是体育解说员和牧师用的那种可弯曲话筒,离嘴更近说话更省力;Wispr 公司内部则流行把无线领夹麦别在衬衫上,员工们像是随时在录播客。这家公司甚至计划之后向客户销售品牌麦克风。


图 | 可编程脚踏板 (来源:Amazon)

资本市场显然对这种新的“vibe working”方式十分欢迎。成立于 2021 年的 Wispr,最初的方向是做脑机接口可穿戴设备,后来转型做语音听写工具。据媒体报道,2025 年 11 月 Wispr 的估值约 7 亿美元。而到了 2026 年 5 月,Wispr 的目标估值已经飙升至 20 亿美元。一个听写应用估值 20 亿,足以说明了市场对“语音取代键盘”这件事的看好程度。

于是,竞争也开始变得激烈。同类公司 Aqua Voice 和 Willon 都拿到了 Y Combinator 的投资,初创公司 TalkTastic、Typeless、Superwhisper 各有拥趸。科技巨头也没闲着:在 2026 年 5 月的 Android Show 上,谷歌发布了 Rambler,一个内置于 Gboard 输入法、由 Gemini 驱动的听写功能,能把用户杂乱的口述自动整理成通顺文本。当平台级玩家入场,独立应用的生存空间会被如何挤压,仍有待观察。

此外,这股新的技术趋势面前,还存在一些现实的门槛。

首先是硬件层面的局限。目前主流的 AI 听写工具大多是 Mac 优先甚至 Mac 独占的。Wispr Flow 和 Superwhisper 支持 Mac,Aqua Voice 长期以来仅限 Mac 平台(近期才开始支持 Windows),TalkTastic 则是 iOS 和 Mac。而在企业环境中,Windows 仍然是绝对主流操作系统。医疗、法律、政府、金融行业尤其如此。

更棘手的是远程桌面环境:很多企业员工通过 Citrix、VMware Horizon 或 RDP(远程桌面协议)来访问工作系统,而大多数听写工具依赖剪贴板粘贴来输入文字,这在被组策略锁定的远程会话中根本行不通。

其次是成本问题。以 Wispr 为例,它的的订阅价格是每月 18 美元。对于一个基础生产力工具来说,这个价格让不少个人用户犹豫。传统的 Dragon NaturallySpeaking 则需要数百美元的一次性买断费用。虽然也有更便宜的选择(比如一些工具提供 7 美元/月的方案,或者基于本地模型的免费层级),但整体来看,语音听写还没有变成一个人人轻松消费的默认选项。

还有一系列的噪音和隐私问题。

在国外,开放式办公室本来就因为噪音问题饱受诟病。多项研究表明,开放式办公环境中不相关的语音噪音是影响员工注意力和心理健康的首要因素。而现在,语音听写正在往这个里注入更多噪音。想象一下:一个二十人的开放工位区,有七八个人同时在低声嘟囔,有人在口述邮件,有人在对 AI 编程助手描述一个 bug,有人在用语音命令修改文档格式。即便每个人都刻意压低音量,汇聚在一起,也足够让人头疼。

一名接受采访的使用者承认这“确实有点尴尬”。他说在家里用语音办公感觉像钢铁侠对 Jarvis 下指令,挺酷的;但在办公室里,当着同事的面自言自语,总归有些不自在。而且当你在口述内容时,周围的人能听到你在说什么。不管是邮件内容、代码逻辑,还是商业想法,这些原本只存在于屏幕上的私密信息,现在变成了公开的声波,总归不太自在。而对于涉及敏感信息的工作场景,还存在合规风险。


(来源:Youtube)

从更宏观的视角看,语音办公的兴起或许折射了一种技术趋势:人机交互正在从“适应机器的方式”向“适应人的方式”迁移。键盘是一种为机器设计的输入界面,人类花了一百多年去适应它。而语音是人类最原始、最自然的表达方式。AI 的进步让机器终于能够理解人类自然语态下的表达,于是“让人回归说话”就成了一个顺理成章的方向。

但人类发明书写,本身就是因为语音表达有其局限,它是线性的,信息密度低,也缺乏复杂结构的承载能力,而且易受环境影响。对于这些问题,语音听写工具可能还需要交出更好的答案。

而且如果语音交互真的成为主流工作方式,现有的办公室结构也将面临重新设计。过去几十年里,办公空间默认服务于安静打字的人类,而未来,它也许要开始服务一群持续低声说话的人。声学隔离、半封闭语音工位、针对不同噪音等级的空间分区,甚至专门用于人机对话的“语音会议室”……这些听起来有些遥远的设计,或许会成为标配。

1.https://www.theguardian.com/technology/2026/may/12/end-of-typing-workers-ditching-keyboards-voicepilling-ai-dictation

2.https://techcrunch.com/2026/05/10/get-ready-for-the-whisper-filled-office-of-the-future

3.https://www.wsj.com/tech/typing-is-being-replaced-by-whisperingand-its-way-more-annoying-a804fee7

注:封面/首图由 AI 辅助生成

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
去医院开药,医生说“这个不报销”,你可以反问一句话!

去医院开药,医生说“这个不报销”,你可以反问一句话!

小谈食刻美食
2026-06-02 07:24:18
9年亡命作恶108起、残杀13人、施暴99人!1962-2002云贵悍匪始末

9年亡命作恶108起、残杀13人、施暴99人!1962-2002云贵悍匪始末

墨策史
2026-05-31 00:40:08
美若天仙王楚然:肤白貌美,婀娜多姿。倾国倾城,美不胜收!

美若天仙王楚然:肤白貌美,婀娜多姿。倾国倾城,美不胜收!

十为先生
2026-05-09 15:19:03
提前剧透?CBA总决赛G4还未开赛,维基百科已显示上海夺冠

提前剧透?CBA总决赛G4还未开赛,维基百科已显示上海夺冠

懂球帝
2026-06-02 12:06:24
挂断特朗普电话后,沙特王储放下狠话:我们永远不会当美国的筹码

挂断特朗普电话后,沙特王储放下狠话:我们永远不会当美国的筹码

牛锅巴小钒
2026-06-02 13:46:09
与恩师穆里尼奥重聚皇马?德布劳内吐槽孔蒂,映射阿囧足球也乏味

与恩师穆里尼奥重聚皇马?德布劳内吐槽孔蒂,映射阿囧足球也乏味

穆里尼奥主义者
2026-06-01 21:21:25
币安上线8000只美股交易 稳定币直接买零佣金

币安上线8000只美股交易 稳定币直接买零佣金

全栈遛狗员
2026-06-01 18:39:23
688079,3分钟20%涨停!

688079,3分钟20%涨停!

证券时报
2026-06-02 11:03:01
CBA第一小外援要走?广东有望抢下“得分机器”,保底能进总决赛

CBA第一小外援要走?广东有望抢下“得分机器”,保底能进总决赛

绯雨儿
2026-06-02 10:07:47
牺牲太大!神十六返回,航天员出舱后为何脸部浮肿,被抬着走?

牺牲太大!神十六返回,航天员出舱后为何脸部浮肿,被抬着走?

大运河时空
2026-04-22 08:50:03
不能二次加热的6种食物!医生提醒:吃不完或倒掉,别乱节俭

不能二次加热的6种食物!医生提醒:吃不完或倒掉,别乱节俭

冷眼看世界728
2026-05-12 20:46:26
记一次“约炮”被骗的详细经过

记一次“约炮”被骗的详细经过

云上南安
2026-04-06 17:11:46
从14万到5.5万,蒸发2500万:广州天河顶豪,戳破了豪宅的旧神话

从14万到5.5万,蒸发2500万:广州天河顶豪,戳破了豪宅的旧神话

地产一品塘
2026-06-02 08:00:16
不听大陆劝告执意访美,郑丽文人未启程,就遭美方公开敲打!

不听大陆劝告执意访美,郑丽文人未启程,就遭美方公开敲打!

坠入二次元的海洋
2026-06-01 21:27:00
为什么去过朝鲜回来就沉默的人,不是隐瞒,是真的说不出

为什么去过朝鲜回来就沉默的人,不是隐瞒,是真的说不出

老特有话说
2026-05-12 15:41:08
钱再多有什么用?杜淳老婆自曝切了一片肺,给所有人狠狠上了一课

钱再多有什么用?杜淳老婆自曝切了一片肺,给所有人狠狠上了一课

聊历史的阿稼
2026-06-02 12:17:50
禁投美股,难得全球大国中惟一正确

禁投美股,难得全球大国中惟一正确

家传编辑部
2026-05-30 12:24:47
摧毁一架特别大飞机,击俄无线电中心!俄罗斯被打得柴油产量锐减

摧毁一架特别大飞机,击俄无线电中心!俄罗斯被打得柴油产量锐减

鹰眼Defence
2026-05-31 16:53:51
总决赛情报员!索汉支招尼克斯防守前队友文班:他很容易体能透支

总决赛情报员!索汉支招尼克斯防守前队友文班:他很容易体能透支

罗说NBA
2026-06-02 07:10:43
轮到以色列被炸!内塔的最大麻烦曝光,不是伊朗不是特朗普,是谁

轮到以色列被炸!内塔的最大麻烦曝光,不是伊朗不是特朗普,是谁

离离言几许
2026-06-02 13:49:38
2026-06-02 15:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16779文章数 514993关注度
往期回顾 全部

科技要闻

烧掉千亿后,美团、阿里、京东谁先止血?

头条要闻

上海女童几乎没上过学 外公找来前女婿把女儿告上法庭

头条要闻

上海女童几乎没上过学 外公找来前女婿把女儿告上法庭

体育要闻

1米74的业余联赛替补,在英超踢中卫

娱乐要闻

奚梦瑶何猷君婚礼曝光 深情热吻甜蜜

财经要闻

锂电“资源墙”高筑 全球性长期博弈开始

汽车要闻

星途神秘新车轮廓曝光 又一款性能SUV要来了?

态度原创

游戏
家居
艺术
手机
房产

《黎明行者之血》最新开发日志 冒险伙伴情报公开

家居要闻

流线型轮廓 包容多元身形

艺术要闻

周杰伦花 1.36 亿拍下这幅画

手机要闻

苹果 WWDC 2026 现场将特别放映《曼达洛人和古古》

房产要闻

100亿!1371亩!海口城市更新,再爆超级项目!

无障碍浏览 进入关怀版