网易首页 > 网易号 > 正文 申请入驻

AI语音输入法时代,我从腱鞘炎变成了咽喉炎

0
分享至


作者 | Kino

编辑 | 赖捷

AI语音输入真的香。我单方面宣布,它可能才是AI时代办公王者。

自从用上它,我已经不想再用键盘打字,不想再用已经有腱鞘炎的手指去编写冗长的Prompt。

就拿用AI写文章报告来说,要真正让大模型生成一篇像样的稿子,Prompt不可能只有一两句话,而是需要非常详细的指令——主题、结构、情绪、段落大意等等等,动不动三四百字,还要不断修正补充,键盘输入起来非常辛苦。

但直接用语音一顿密集输入,或许能让你的效率加倍——毕竟说话比打字快,能表达更密集的信息。关键是如今的AI大模型,还能根据场景,修正出错的表达和无用的口水词,把它变得连贯有逻辑。


也难怪今年以来,AI语音输入法赛道突然就卷了起来。

国内有豆包输入法、微信输入法、千问输入法、闪电说,还有讯飞、百度、搜狗等传统输入法巨头的AI升级版。

国外则有WisprFlow、Typless、Superwhisper。

以后键盘侠会变少,语音侠会变多。

“AI新榜”也密集体验测试了市面上所有主流产品,发现语音交互+AI真是一个被严重低估的效率组合,建议看到这篇文章的朋友赶紧去尝试,打开新天地。


实测主流AI语音输入法,

它们分别适合哪些人群?

主流AI语音输入法,使用方法大同小异——下载安装到电脑,并授予语音权限,然后只要按下电脑的Fn键(或设置的其它快捷键)就能切换到AI语音输入。


上面这张图,是我在电脑端下载某输入法后,直接用它向网页端的DeepSeek大模型说话,我用的是苹果电脑,正常距离,以耳语的音量说话,它也能识别得非常精确,在Codex、Workbuddy等智能体客户端中也能使用。

以下是我经过实测后,各家产品的体验结果。


可以看出,目前大多数AI语音输入法产品的能力高度重合:基本都有AI智能润色、去除口水词、结构化输出、全局使用、场景感知等能力。差异主要在于识别准确率、响应速度、AI润色质量、使用稳定性、是否支持本地化/离线使用,以及是否有AI助手协同等。

那么,不同行业和需求的朋友具体该怎么选呢?表格里,我们已经列出各家的优劣点,大家可以依据自身工作属性,重点参考关注以下关键点。

识别的准确度和响应速度。它往往决定了最核心的体验。尤其是AI科技从业者,可能需要经常中英文混说,在一句话中文里夹杂英文产品名、模型名、公司名和行业黑话。在这一点上,目前各大产品差别不大,但随着使用的深入,那些拥有更多数据更多用户的产品显然有更大优势。

AI润色的边界感。基本上所有AI语音输入法都支持智能润色,但有些会比较克制,只是删掉口水词、修正重复;有些会更主动地改写,甚至替用户补全意图。前者更适合需要保留个体表达风格的人,后者更适合偏效率的场景,比如商务沟通、写提示词等。


部分产品会给用户提供选择

全局可用的稳定性。这是AI语音输入法真正好用的前提,它应该像系统级能力一样,跨应用也能稳定可用。

场景感知能力。比如我在写邮件时,AI会倾向于把语气处理得更正式、更商务;我在聊天窗口里回复消息时,它又会输出更短、更自然的表达;如果我正在写一段提示词,它会尝试把原本混乱的描述整理成结构更清晰的需求。

隐私和本地化能力。对普通用户来说,把语音上传到云端换取更好的识别和润色,可以接受。但对于律师、医生、金融从业者、企业管理者、研发人员来说,这是一个无法接受的风险,如果口述内容涉及合同、病历、客户信息、内部会议,那就一定要优先选择支持本地识别、离线运行的输入法。

当然,目前AI语音输入法产品的短板也很集中。语速过快、音量过低、环境过于嘈杂时,识别准确率都会下降,这个问题不是某一款产品独有的,而是当前语音交互普遍存在的。

更现实的问题是办公环境。在家办公或者有独立办公室时,非常好用,但在开放式办公室里,把自己的思考过程彻底暴露给同事,可能有点尴尬和社死,如果整个办公室的人都开始对着电脑口述需求,噪音也打扰他人。

所以,AI语音输入法到底值不值得用?要看场景。

如果你每天需要用AI对话、写作、编程,它确实能显著提升效率,让你更快、更自然、更完整地把需求说出来,语音信息密度更高。

但如果你主要在开放式办公室工作,又很在意周围人的目光,那语音输入法仍然不会完全替代键盘。


Vibe Working时代正在到来

AI语音输入市场已爆发

AI语音输入,未来或许会占据我们大部分工作生活场景。

曾经我觉得,打字比语音输入更有逻辑,因为打字天然迫使我慢下来,边写边整理思路。但现在的AI语音输入法,能够在输入环节把我不连贯、缺乏结构的口头表达,优化成清晰的提示词,再发给AI助手,这注定会改变很多办公习惯。

难怪硅谷继Vibe Coding后,现在又开始流行起用AI语音输入,流行起Vibe Working。领英联合创始人Reid Hoffman还提出了一个叫“Voicepilled”的概念,他认为人机交互下一次重大飞跃是用语音和AI交互。

“Voicepilled”这个词,借用了经典科幻电影《黑客帝国》里“吞下红药丸”(redpilled)的隐喻,指的是某种突然看清现实的时刻。放在人机交互语境里,“Voicepilled”同样描述的是一种顿悟:当你真正开始用语音和AI交流,才恍然大悟之前敲键盘过得都是什么苦日子

我们日常说话时会停顿、改口、重复、补充,梦到哪句说哪句,还往往夹杂着很多填充词,比如“嗯”“啊”“那个”。过去,这些口语表达中的混乱和瑕疵会成为语音识别的障碍,如果用传统的语音转文字,会充斥着大量无效的文本,输入方是节省了打字时间,却辛苦了接受信息的人,他可能是你的老板、你的甲方、你的对象……

但在大模型介入后,AI不再只是机械地把声音转成字幕,而是能理解用户真正想表达什么,再把松散的口头表达整理成更清晰、更有结构感的文本,以便被AI读取,所以它不再是单纯的输入法,更像一个表达中间层。

硅谷职场中正兴起一种新景象:上班时,一群人对着电脑屏幕自言自语。大家戴着耳机,对着AI助手口述需求、撰写文档、下达复杂指令,甚至用语音辅助编程。原本安静的办公空间,越来越像一个“高级呼叫中心”,照这样发展下去,腱鞘炎可能好了,嗓子的压力却更大了。

资本市场也在押注这一赛道。根据经济观察报等媒体不完全统计,截至2026年第一季度末,全球在语音AI领域的初创公司,累计融资总额已经突破70亿美元大关。

主打海外市场的语音听写应用WisprFlow是这一趋势的代表产品之一。2026年5月,WisprFlow完成新一轮2500万美元融资。融资后,其累计融资额达到8100万美元,目标估值接近20亿美元。在短短半年时间内,WisprFlow公司的估值实现了近三倍的飙升。

WisprFlow官方做过一次内部测试:成熟用户使用语音输入的速度,是键盘党的4倍;Typeless的用户报告里这个数字是3-5倍,豆包官方给出的“错误率比传统输入法低20%-50%”也指向同一个结论。


国外博主用语音功能操控电脑

总结起来,AI语音输入至少有三大优势。

首先,人类的思维速度约每分钟400字,而打字仅有40字,更多的信息输入理论上会让AI跑出更好的结果。

其次,传统打字迫使我们在拼写和格式等微观决策上停顿,从而割裂思维流。AI语音交互不仅是听写,更是通过大模型将我们口语化的、零碎的“碎碎念”,实时重构为逻辑严密的文本,实现了真正的人机无缝协同。

最后,现在的AI语音输入工具,核心能力不只是“听清你说了什么”,而是开始理解“你真正想说什么”。语音识别模型负责把声音转成初步文本,大语言模型则负责进一步清理、纠错、润色、分段和重组逻辑。也正因为有了这一层语义处理,语音输入才开始从“转写工具”变成“表达工具”。

你可以不必把每句话提前想好,也不必在开口前就组织成完整书面语。只要大致说出想法,AI就能生成一段可发送、可发布的文本。

键盘输入,要求人们一开始就把思路转化成相对规整的文字,语音输入则允许人们先以更自然、更低压力的方式把想法倒出来,再交给AI做后续整理,这才是更符合人性的输入方式,这种差异也会明显影响工作效率。

当然,如果你不想由AI帮你整理语音,想体现自己的主动性,也完全可以提前在脑海中构思好自己要说的话,然后把它有条理有结构地表达出来,并且让AI语音输入法不要修改,某种程度上,这也锻炼了我们的演讲和表达能力。

键盘不会完全消失。对于复杂排版、表格处理、代码细节修改、图像和视频软件操作来说,键盘和鼠标仍然更高效可控。

但AI语音输入,注定是下一代人机交互的入口。一个全民用语音交互的未来,或许并不遥远。


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
巴西记者:日本什么时候突然成威胁了?说日本比巴西强的人省省吧

巴西记者:日本什么时候突然成威胁了?说日本比巴西强的人省省吧

云隐南山
2026-06-29 19:53:02
确定了,火箭队弗雷德·范弗利特就其2500万美元合同做出决定

确定了,火箭队弗雷德·范弗利特就其2500万美元合同做出决定

好火子
2026-06-29 22:26:37
1-0绝杀!世界杯又一黑马诞生:全场狂欢庆祝,改写96年新历史

1-0绝杀!世界杯又一黑马诞生:全场狂欢庆祝,改写96年新历史

体坛小李
2026-06-29 08:22:25
善恶终有报!“港独分子”陈方安生,弟弟自杀女儿去世,晚景凄凉

善恶终有报!“港独分子”陈方安生,弟弟自杀女儿去世,晚景凄凉

莫地方
2026-06-29 01:10:03
天津津门虎赛后冲突升级,主裁判黄翼主动爆粗口!足协该怎么办?

天津津门虎赛后冲突升级,主裁判黄翼主动爆粗口!足协该怎么办?

兰亭墨未干
2026-06-29 19:09:27
像被“啃”了一圈!30岁女子长期喝饮料提神,满口长出“可乐牙”

像被“啃”了一圈!30岁女子长期喝饮料提神,满口长出“可乐牙”

南方都市报
2026-06-29 08:16:16
西太平洋中俄轰炸机编队遭美日拦截,歼16迎战F35

西太平洋中俄轰炸机编队遭美日拦截,歼16迎战F35

夏末moent
2026-06-28 18:41:47
76岁希拉里传跨界绯闻?对象是49岁莱昂纳多,游艇同框是算计?

76岁希拉里传跨界绯闻?对象是49岁莱昂纳多,游艇同框是算计?

绿茵八卦君
2026-06-20 19:45:04
央视直播大满贯时间表:6月30日CCTV5+直播国乒!孙颖莎4小时双赛

央视直播大满贯时间表:6月30日CCTV5+直播国乒!孙颖莎4小时双赛

宝哥精彩赛事
2026-06-29 19:09:57
以当前的实力,一旦中日打起来,结局会怎样?美俄看法一致

以当前的实力,一旦中日打起来,结局会怎样?美俄看法一致

迷彩前沿
2026-05-29 12:52:40
国防科技大学校长调整

国防科技大学校长调整

中国青年报
2026-06-29 22:14:21
“喂到他娶媳妇为止”,网友:孩子奶奶发型,早已预示了家教水平

“喂到他娶媳妇为止”,网友:孩子奶奶发型,早已预示了家教水平

世界圈
2026-06-09 08:32:26
杨紫致谢以为父母没来?二楼那两个局促挥手的背影,看哭多少人!

杨紫致谢以为父母没来?二楼那两个局促挥手的背影,看哭多少人!

动物奇奇怪怪
2026-06-29 11:12:58
父母的“迷信”不除,非法矫治就仍有市场

父母的“迷信”不除,非法矫治就仍有市场

南方都市报
2026-06-29 23:24:14
WTT美国大满贯首轮,蒯曼剃光头孙颖莎横扫,国乒主力全过关

WTT美国大满贯首轮,蒯曼剃光头孙颖莎横扫,国乒主力全过关

南风不及你温柔
2026-06-29 14:01:20
日本彻底懵了!五大产业集体崩盘,日元成废纸,中国这招厉害

日本彻底懵了!五大产业集体崩盘,日元成废纸,中国这招厉害

说故事的阿袭
2026-06-29 03:52:43
全新宝马X5内饰谍照曝光:全景视域桥+倾斜中控屏+副驾屏

全新宝马X5内饰谍照曝光:全景视域桥+倾斜中控屏+副驾屏

IT之家
2026-06-29 18:30:08
7闺蜜众筹70万开咖啡馆  4个月后从“七仙女”变成“战国七雄”

7闺蜜众筹70万开咖啡馆 4个月后从“七仙女”变成“战国七雄”

尘埃里的看客
2026-06-28 10:42:41
上海球迷穿日本球衣!教授:越是自诩国际化的城市 越要警惕汉奸

上海球迷穿日本球衣!教授:越是自诩国际化的城市 越要警惕汉奸

念洲
2026-06-29 20:05:32
2002 年李春平世纪骗局内情曝光:所谓百亿遗产继承权全是谎言

2002 年李春平世纪骗局内情曝光:所谓百亿遗产继承权全是谎言

磊子讲史
2026-06-23 17:22:32
2026-06-30 00:00:49
头号AI玩家 incentive-icons
头号AI玩家
做内容从业者关心的AI研究
469文章数 23关注度
往期回顾 全部

科技要闻

杀疯了!深圳一天出两家200亿具身智能公司

头条要闻

美从俄乌战场抽身 金灿荣:美国有个大战略目标已完成

头条要闻

美从俄乌战场抽身 金灿荣:美国有个大战略目标已完成

体育要闻

他和伊朗队,再次赢得全世界的尊重

娱乐要闻

跟风电影《给阿公的牛肉丸》开机

财经要闻

万达广场批量易主 多位投资人正式入局

汽车要闻

全新宝马iX3长轴版将于成都车展预售 四季度交付

态度原创

家居
数码
健康
艺术
时尚

家居要闻

传奇筑 日常诗

数码要闻

珂芝三模矮轴机械键盘i98上市,首发价329 / 369元

狂吃“糯叽叽”小心肠梗阻!

艺术要闻

16幅 冉茂芹小幅风景油画写生

杨紫,视后!

无障碍浏览 进入关怀版