AI 范儿 · 产品拆解
语音输入用过一两次就放弃了?
不是你的问题,是工具还没到那一步。
你有没有试过用语音打字,说完一段话,看着屏幕愣了一会儿。
因为文字是对的,但逻辑是乱的。你说话跳来跳去,输入法老老实实都给你记下来了。
比如最近我有一个想做自媒体的朋友找我聊,我随口说了自己的想法。思维跳来跳去,没有事先整理。
我用微信的语音输入法,说完是这样的:
![]()
坦率说,看到这一堆文字我头都大了。我去整理花的时间,还不如我一开始就用文字来弄。
而且我自己还能整理,如果是发给别人(比如助理),那真的会让人崩溃吧。
但实际情况就是这样,我们说话不可能跟写文章一样,逻辑那么清晰,而且完全没有废话。
这就是为什么很多人,可能跟我一样,用过一两次语音输入之后,就再也不想碰了。
但这两天豆包上线了个豆包语音输入法。
01豆包输入法,先认识一下
玩过豆包的人应该都对它的语音识别能力叹为观止,比如跟老罗对话完全不带输的,它还能识别各种方言。
豆包输入法其实上线好几个月了,这两天增加了语音输入功能,官方的定位是"豆包同款语音输入"。
把做豆包 AI 时积累的那套语音模型,直接嫁接进了输入法里,这让我充满了想象和期待。
第一次打开会有点意外。界面非常干净,没有皮肤商城,没有弹窗广告,没有会员推广。
![]()
风格和 iOS 自带以及微信输入法接近,换过去几乎没有学习成本。
用过某些输入法的人懂那种"打个字先跳过广告"的烦躁感。豆包没有这个问题。
02回到那个案例,豆包会怎样?
我很急迫的想知道,同样是前面这个例子,豆包语音输入法会输出什么。
豆包的语音输入法跟其他的类似,会边说边转文字,就像同声传译一样。
这个输入法最终的输出是这样的:
![]()
说实话,看完我气都喘不过来。
但你不得不说,它记录的内容比微信输入法是多多了,识别率确实高了很多。
它甚至像个劳模,一字一句完全都记录下来了。
但你注意到没有,豆包的输出虽然准确,口水词还在,逻辑还是乱的。
密密麻麻,再次让人头大。甚至还有错别字,Agent 被识别成了 AIG。
这段话你能直接发出去吗?还是不行。
你还是要坐下来重新整理一遍,把核心观点提炼出来,把跳跃的思路理顺。
这件事,豆包没有帮你做。
一两句话可能无所谓,但有时候我们需要很长的对话,这种情况下那就真的让人头大了。
难道就没有一款真正好用的语音输入法吗?在回答这个问题之前,我们先聊另外一个话题。
03我们到底想要什么?
对于一个语音输入法,我们到底期待的是什么?
是期待它能把语音完全精准、一字不落地转成文字吗?就算你说方言,它也能精准转写?
我以前也以为,能做到这点,就已经是非常好的语音输入法了。
直到我遇到了另一款工具,我才明白:我们要的其实一直都不是精准的语音转文字。
我们要的是:真正能听懂人话、并说人话的工具。
哪怕你说得再怎么前言不搭后语、逻辑跳跃,它也能三言两语帮你把逻辑整理得一清二楚。
04Typeless 是什么感觉
Typeless 是一款让人用了就完全丢不掉的工具,它就是那样的产品,而且它还不止是那样的产品。
第一次用的时候,我的感受是:原来还能这样。
Typeless 跟其他语音输入法不一样,它不是边说边把语音转成文字(比如豆包、微信输入法)。
它会等到你把所有的话说完之后,经过快速整理再发出来。
还是同样那段乱说,Typeless 的输出是这样的:
![]()
这个输出简直绝了吧,一下子舒服了。
同样的一段话,它帮你记录了下来,理顺了逻辑、删除了废话,输出的是完全可以直接用的段落。(这个截图里面的文字以及格式我一点也没改)
它还有很多非常实用的细节,比如你说"明天上午十点,不对,下午三点开会",它输出"明天下午三点开会",不记录你的纠错过程,只给你最终结果。
它做的远远不只是识别更精准,而是真正听懂了你的意图。说完不需要再整理。
坦率说,我现在最爽的就是用 Claude,配上 Typeless。
我絮絮叨叨的说完一大堆的需求,Typeless 瞬间帮我理清了思路,发给 Claude 执行。
05它还不只是输入法
除了整理逻辑这件核心的事,Typeless 还有两个功能,让我觉得它的定位已经超出了"输入法"的范畴。
功能一
语音翻译
你说中文,它直接输出英文,或者其他任何语言。不是先转成中文再翻译,而是说完直接给你目标语言的版本。
更厉害的是,选中屏幕上一段已有文字,按快捷键说"翻译成英文",它就地替换。不需要打开翻译软件,不需要复制粘贴,不需要切换窗口。
功能二
✏️ 语音改写
选中一段文字,按快捷键,然后说"改得更正式一点",或者"把这段重新写得更简洁",它直接原地替换。
你的声音变成了一个可以操控文字的指令,在你正在用的任何软件里直接生效。
这两个功能合在一起,意味着 Typeless 不只能帮你"输入",还能帮你"编辑"。
06字节进场,会怎样?
说到这里,我反而多了一种担心,主要是对 Typeless 这类独立工具而言。
字节做豆包输入法,目前还停留在识别层,确实不是最理想的。
但以它的模型能力,往"理解意图"这个方向走,只是时间问题。
字节做产品有一个惯例:先占住入口,积累用户,然后快速加功能。豆包输入法现在的动作,很像是在打地基。
一旦它开始在语音输入里加入意图理解、逻辑整理、语音改写这些能力,而且免费打包在一个人人都装着的输入法里,Typeless 这种每月要收费的独立工具,生存空间会变得很窄。
这种事在 AI 这个领域,已经发生过很多次了。一个独立产品做出了真正有价值的东西,大厂跟进,免费,然后原来的市场基本消失。
所以:如果你现在有兴趣试 Typeless,我建议认真试一下。
https://www.typeless.com/downloads
趁它还是市场上体验最好的那个,等字节追上来,这个窗口就关了。
语音输入法真正的上限,
不是说得多准,
是说完之后还要不要再整理。从"听写员"到"理解者",这是下一关。
豆包输入法值得换过来用,识别够用,界面干净,免费。
但语音输入法真正的上限,不是说得多准,是说完之后还要不要再整理。这一关,豆包还没过。Typeless 过了。字节的眼睛,肯定已经看着那扇门了。
你用过语音输入吗?说完还得整理,是不是很抓狂?评论区聊聊你现在用什么输入法,够用吗觉得有用 → 点个❤️在看转给还不知道的朋友点个赞 告诉我你看完了关注「AI范儿」,下次更新第一时间收到
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.