说实话,我最近越来越觉得一个AI开发者如果只靠灵感去想产品,是很危险的。
我一直建议:先去小红书、Reddit、抖音,看看大家在为啥焦虑,为啥买单,然后再决定做什么。
这几天我刷到两个让我眼前一亮的例子,感受是:AI翻译这件事,其实很多人还没意识到能用AI做,而且是可以直接变现的。
第一个是关于老高与小茉的视频。他们最近推荐了一本叫《现实转移》的书,结果就有人直接整理好了这本书的1-5部完整翻译版本,在小红书上挂了电子版在售卖。
卖8块8,短短20天已经卖了279份,看评论区很多人还挺满意的。你说这是不是AI能做的事?当然是,而且基本用智能体就能完成。
![]()
第二个是英文素材翻译。有人把200期YouTube英文vlog素材,配上中文翻译字幕,打包卖49块,已经卖出去1.2万套了,获利近百万。
我当时看到这两个案例的感觉是:
现在信息差还是大啊,这两个案例的本质都是找到了需求之后,用AI近乎0成本地快速完成翻译,这种AI明明已经能干得超绝的事,还是有大量的人不知道。
不止是这些产品的用户不知道这事是怎么干的,这些售卖者甚至都还没什么竞争对手!只能说大多数人对AI产品的了解太少,对用户需求理解得太少。
为了告诉你这种AI翻译操作起来真的很简单,我先给你演示两个多模态翻译案例。
案例一:一次性完成全书翻译
![]()
讲道理,我把我自己写的《一本书玩转DeepSeek》pdf丢进去翻译的时候,我是有点战战兢兢的...我这本书好歹有16万字,而且里面有不少图表,再加上pdf格式出奇地难处理。我想着大概率会在翻译完整度、翻译质量或者输出格式上翻一两个车。翻车了我就把文字复制出来,换成txt或者md格式让AI处理得了。
结果,12分钟后,不止没翻车,不止超出了我的预期,甚至我都觉得有点离谱了。
实际测试结果是,我不止得到完整的424页的中英双语的翻译文档,翻译质量相当不错,而且格式和结构上和原本几乎完全一致,甚至把图片也给我翻译得明明白白的。
这是其中带图片带bulletpoint的页面翻译对照
![]()
案例二:中文音频 to 双语字幕
![]()
第二个案例里,我原本想试试翻译字幕文件,因为我的视频会同时在YouTube和B站发布,偶尔会需要把部分字幕做成英文或者中英双语的版本上传到YouTube。但上传附件的时候发现可以传音频文件,所以我抱着试一试的心态尝试了下。
测试的结果属于既符合预期,又颇为惊喜的。特别的点在于:
1、语音识别效果本身很准确,我之前在剪辑软件里自动识别的时候总不免出些错需要自己修改的情况;
2、他居然懂得把我的音频文件识别和处理成带时间戳的字幕文件,而不是一句一句的转录;
3、翻译效果相当好,甚至断句分句都很合理。
下载的双语字幕文件
![]()
看完这两个案例后,平时用AI多的同学可能会有点懵:“不对啊,我平时用的AI可没这么强!”
是的,我这次演示的确实不是常规的to C的AI对话类产品,而是智谱BigModel开放平台(bigmodel.cn)上提供的翻译智能体。他们实际上还根据场景的差异,提供了“通用翻译”“专业文档翻译”“社科文学翻译”“影视剧字幕翻译”“社交媒体翻译”这五类不同的语言翻译智能体。
![]()
接下来,我们来聊聊,为什么专业的翻译要使用智能体,而不是常规的AI对话产品。
我算是从2023年起就开始特别关注AI翻译这个赛道了,因为当时很多学术机构的AI报告都在提「翻译」是最先会被AI取代的职业之一。
但我们要清楚,AI翻译要做“产品化”,还是会遇到几个关键问题:
问题一:翻译质量停在80分,要往90、95分走,其实还需要非常多技巧,比如两步翻译法、思维链(CoT)式翻译、要求扮演专家角色、提供术语表等等。
问题二:AI一次输出token有限,比如你给它个五万字的PDF,它其实一次只看得了2000多字,必须自己分段、上下文衔接、合并格式。
问题三:复杂文档会翻译崩掉,比如有图的PDF、非结构化文本、图片格式文档,AI可能直接给你输出乱码,完全不能用。
为了解决这些问题,我自己也做过一些内容和小产品。
比如2023年做的《一个策略,让ChatGPT翻译能力提升100%》视频在B站和YouTube已经累计获得超过10万播放。
![]()
2024年开发的《GPT翻译》目前在GPT Store也有超过10K的使用量,评分达到4.4+
![]()
不过呢,这些方式能解决的问题都相对有限,不够系统化和产品化,而且还对使用者的AI技能有不少的要求。
也是因为这样的背景,所以当我体验到智谱提供的翻译智能体之后,我一下就意识到,woc,这个产品真做对了,也完全是我想做但是做不了的东西。
接下来,我试试按我有限的理解,来简要解释下智谱的翻译智能体到底是怎么解决我在上面提到的AI翻译的三类问题的,他们有这么几个亮点:
一是他们通过大模型的系统提示词+工作流策略引入了许多行业内的翻译最佳实践,比如「转述翻译」「两步翻译」「COT翻译」等等;以两步翻译来说,模型会执行两次翻译步骤,第一步先按段落理解,第二步再润色、结构化,这种方式翻出来的内容读起来更顺,不是生硬的逐句机翻。
![]()
二是他们引入了术语表,允许你可以提前喂它常用术语表,保证术语翻译一致,比如你翻金融类文档,很多术语不一致会崩,而且术语表的机制也能保证你前后翻译的一致性,你再也不用遇到把「LLM」翻译成「法学硕士」的问题了。
三是长文本上的工程优化,它会自动识别文档段落并分段处理,一本书的长度也能被一次性搞定。
四是多格式支持,word、pdf、图片甚至是网页、音频都能直接上传,他们会先识别内容,用工程优化输出比较整洁的文本。
![]()
当然,其实除了上面我测试过的多模态的、长文本、复杂的翻译任务之外,其实智谱的这套翻译智能体在很多常见的任务上效果也很好。
比如,我自己日常使用的Chrome翻译插件,在读X等社交媒体上的内容时,我尝尝觉得效果不太符合我的预期。比如吴恩达的这段X里,AI把「a United States District Court ruled that training LLMs on copyrighted books constitutes fair use」翻译成了「美国地方法院裁定,对 LLM 进行受版权保护的书籍培训构成合理使用」,你能搞懂这说的是什么鬼吗?
![]()
而如果使用智谱的通用翻译智能体的话,他翻译的结果是:「美国一家地区法院裁定,使用受版权保护的书籍训练大型语言模型(LLMs)属于合理使用」,显然这是真正参照上下文理解了语音语境之后的表达,好多了。
![]()
而且,很棒的是,这个智能体你不止可以直接在智谱BigModel开放平台(bigmodel.cn)上使用,更重要的是你是可以通过API的方式去进行调用的。
所以,前面说了这么多,智谱的这套翻译智能体对你来说,到底有什么用,有什么意义?
我觉得至少下面这些使用场景都是你触手可及的:
你可以用来满足自己或公司的翻译服务,比如“专业留学文书翻译”“财经文档润色”“日语漫画翻译”;
你可以用来包装内容做变现,比如上面那两个例子,一个是图书翻译打包,一个是vlog字幕训练集;
你可以接API做自己的翻译小产品,比如“菜单翻译器”“论文翻译网页小程序”等轻量型产品;
你可以加速出海,把你的内容、网页、产品文案都做多语言版本。
我们总说AI没方向,没需求,其实信息差才是最大的机会。
大部分人压根不知道:翻译已经不是逐字翻译了,而是一个完整的工具链条,一次性搞定一堆事,速度飞快,效果还极佳。
好在知道订阅花叔公众号的人还不多,这波信息差大概率还会持续存在一段时间。
你要不要试着用AI把它吃下来?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.