网易首页 > 网易号 > 正文 申请入驻

科技巨头打响语音模型之战!亚马逊用Claude升级Alexa,Cerebras语音模式快如闪电

0
分享至

新智元报道

编辑:乔杨 Frey

【新智元导读】虽然OpenAI的「Her」还是期货,但硅谷的科技巨头们已经开始相继发力语音模型。前有谷歌的Gemini Live和苹果的升级版Siri,如今巨头亚马逊和新秀Cerebras也加入了这场竞争。

继OpenAI在5月发布会上展示「期货」GPT-4o的语音功能后,「AI语音助手」类的产品又成为了硅谷科技巨头的必争之地。

紧跟着OpenAI开发布会的谷歌也马上宣布——Gemini将推出语音聊天模式Gemini Live。

8月,谷歌在Pixel 9活动上正式发布了Gemini Live,取代了原来谷歌助手的产品定位。

类似GPT-4o,Gemini Live不仅能实现随时打断的对话式交流,还有对设备屏幕的感知能力,可以实时解释用户的屏幕或视频信息。

Gemini Live目前已经针对安卓设备推出,但仍只有英语模式,未来还将登录iOS系统并提供更多语言。

6月,苹果就在WWDC大会上展示了如何用Apple Intelligence给2011年就诞生的Siri改头换面。

与谷歌和OpenAI着重强调的「交流」功能不同,Siri似乎更专注于语音「助手」的定位。

屏幕感知、跨应用操作、智能体般的多命令处理,一个都不少。

比如,动动嘴便可打开文档、将笔记移动到另一个文件夹、发送或删除电子邮件、在Apple News中打开特定文章、发送网页链接,甚至请求设备提供文章摘要。

但是,这版更强Siri的上线还没有明确期限,所依靠的Apple Intelligence也只能在iPhone 15 Pro或更新型号的手机才能运行。

根据彭博社的报道,苹果团队似乎需要大量时间来重构Siri的底层,高级版Siri最快也要等到2025年,才会出现在iOS 18上。

虽然还未正式上线,但可以看出,GenAI的这波革新让苹果13岁的Siri焕发新生。

而提到Siri,让人想起和它同代的另一个语音助手——亚马逊推出的Alexa。

亚马逊改造Alexa

实际上,Alexa的革新计划由来已久。早在今年1月,Business Insider就报道过这个项目,名为Remarkable Alexa,它正在内外的重重阻力下艰难推进。

发布的日期也是一拖再拖,从最初的6月30日,到之前决定的8月。

8月30日路透社报道,有知情人士表示,改进版的Alexa将在10月美国美国假日季前发布。

该项目在内部被称为「榕树」(Banyan),将是Alexa自2014年与Echo系列扬声器一起推出后迎来的首次重大改革。

Remarkable Alexa计划向用户收取5~10美元的订阅费用,以抵销GenAI模型的成本。

这部分订阅不会包含在每年139美元的Prime服务中,但亚马逊仍将提供免费版本的Classic语音助手。

Alexa难掩颓势

2014年,亚马逊首次推出Alexa的语音驱动功能,让当时的消费者惊叹不已,却落后于最近的GenAI浪潮。

根据Insider Intelligence的统计,在美国,Google Assistant今年的用户数量预计将达到8880万,其次是 Siri的8420万。Alexa的用户数量位居第三,约为7560万。

和Siri沦为语音计时器的境地类似,通过Echo音响访问的Alexa也多用于设置计时器、询问天气、播放音乐或回答简单问题等功能。

不仅如此,亚马逊想要通过Alexa提升电商业务销售额的希望也落空了。

正如Kindle屏之于电子书商城,健康监测服务之于Halo手环,便宜到经常低于成本价的Echo音响和免费提供的Alexa,实际上包含着亚马逊借硬件打造软件的产品思路——

不求在硬件销售上获利,但求从用户后续对软件的使用、数字内容的获取和平台的依赖等中获取更高毛利的收入。

这种营销方式最初是借鉴剃须刀巨头吉列——推出极具价格优势的剃须刀,但通过售卖补充刀片赚得盆满钵满。

最初对Alexa的设想非常美好——用户通过语音方式询问购买建议,之后委托Alexa直接下单,就能拉动亚马逊的电商销量。

但随后他们发现,这个思路不起作用。主要是因为用户喜欢「眼见为实」,仅凭Alexa的语音描述很难让人甘心掏钱网购。

根据内部文件和知情人士的透露,这种不成功的策略让亚马逊在Echos、Kindle等智能设备业务上亏损了数百亿美元,可以说是贝佐斯在位时为数不多的巨大误判。

硬件亏钱、软件不赚钱,力挺Alexa的贝佐斯又离开了管理团队,导致裁员的大刀最先落在了Alexa团队的头上。

Business Insider跟踪LinkedIn上的帖子后发现,在2022年底开始的大裁员中,Alexa的AI系统、自然语言理解和对话能力团队几乎是首当其冲、受到了最高等级的影响。

然而,即使AI技术落后、亏损巨大,Alexa还掌握着一个关键优势,可以助他们扳回一城——截至2023年,已经在全球卖出的支持Alexa的硬件设备超过5亿台。

合作Anthropic借用Claude

CNBC和Business Insider在之前的报道中曾援引知情人士的说法,表示亚马逊计划基于内部语言模型Titan或Olympus升级Alexa。

然而,或许是内部技术不给力,路透社的最新报道表示,10月发布的Remarkable Alexa将由Anthropic的Claude模型支持,而非自己的基座模型。

亚马逊和Anthropic的合作由来已久。去年9月,他们就为Anthropic提供了高达40亿美元的投资,获得少量股权的同时,以AWS云服务交换到了对Claude模型的使用。

一些知情人士表示,升级后的Remarkable Alexa可以执行更复杂的任务,例如撰写简短的电子邮件、发送邮件以及从Uber Eats订餐,而且让用户无需在对话中重复召唤「Alexa」。

此外,亚马逊还计划增强Alexa提供的自动化家居功能,可以无线连接到智能设备,让用户进行语音控制。

具体而言,Remarkable的关键功能更新如下:

- 对话能力增强,与用户进行更自然、更有吸引力的对话,并提供与上下文相关的响应

- 个性化推荐:根据用户喜好和历史记录,针对购物、新闻和其他内容进行定制化推荐

- 家居自动化:Remarkable Alexa将作为一个更复杂的家居自动化中心,记住用户偏好,自动执行闹钟设置、咖啡机启动或电视节目录制等任务

- 复杂任务执行:用户可以提出更复杂的指令,例如订购食物或起草电子邮件

总而言之,面对谷歌、苹果等公司来势汹汹的竞争,Alexa团队现在的任务是,打造一款能够在新的GenAI竞争中脱颖而出的语音交互设备。

REUTERS/Mike Blake

这其中的障碍,一是价格,二是AI安全问题。

一位知情人士估计,在Alexa中使用GenAI的查询成本为每次2美分。有内部估计甚至指出,订阅费用需要定为20美元,这也是ChatGPT的订阅价格。

也有亚马逊员工表示怀疑,除了已经为Prime会员支付139美元的用户,是否还有人愿意每年多掏60~120美元,获得比免费版Alexa更智能一点的Remarkable Alexa。

但美国银行分析师Justin Post的分析结果相当乐观。

根据他在6月的估计,大约有1亿活跃的Alexa用户,其中10%可能会选择Alexa的付费版本。按每月5美元的费用计算,这将额外带来6亿美元的年销售额。

AI安全方面,有开发人员表示,Alexa大多出现在客厅或厨房中,这提高了应用GenAI模型的风险。如果Alexa不理解命令或提供不可靠的信息,犯错误的代价就会更高。

Cerebras语音版成GPT-4o平替

想跟上语音模型更新步伐的,除了亚马逊这种巨头,还有Cerebras这个新秀。

前几天刚,也基于livekit.io平台构建了自己的语音模型。

据悉,Cerebras Inference使用了Cerebras CS-3系统和WSE-3 AI处理器,内存带宽和内核数分别是英伟达H100的7,000倍和52倍。

依托具备如此超高速AI推理能力的Cerebras Inference之上的Cerebras语音对话模型让人非常期待!

但原始的视频demo链接已失效。多亏评论区热心网友,提供了另外一个类似于Cerebras语音对话模式的示例。

该对话模拟示例同样基于LiveKit,但以ChatGPT为基础模型。

具体来说,它借助Websocket使用LLM模拟了电话对话,并进行了系列优化,最终实现了无缝和快速对话。

demo链接:https://livekit.io/kitt

不少网友在感叹其功能强大,开发便捷的同时,惋惜它比ChatGPT-4o上线晚,丢失了很大一部分热度。

LiveKit代理是通过语音,视频和数据频道与最终用户相互作用的多模式AI智能体Agent的端到端框架。该框架可以凭借Python构建智能体。

Agent框架被设计成可构建实时、可编程、运行在服务器上的框架。它可被用来创建可看到的、听到、理解的对话和多模态语音智能体。

该框架包括用于常见工作流程的插件,例如语音活动检测和语音到文本转换。

Agent与云或自托管LiveKit服务器无缝集成,在本地计算机上开发的Agent代码可以扩展以支持成千上万的并发会话,然后将其部署到服务器中。

仓库地址:https://github.com/livekit/agents

Cerebras语音版一经发布,就引发了油管上很多博主的关注和测评。

Antti Luode通过多次打断对话的方式,测试了Cerebras 实时语音模式的能力,证实其能快速有效理解对话并提供可靠信息。

YouTube链接:https://www.youtube.com/watch?v=iJfeX1Wd5oM

Cerebras语音版Q&A对话集锦

Q:你是如何被开发的?

A:我是自然语言处理和机器学习算法的组合产物。我可以实现交互,在用户打断我时,也允许无缝转换和自然的对话流程。

Q:你有什么想对YouTube观众说的吗?

A:我只是开启了对话型AI技术套件的新纪元。诸如我一样的语音助手未来,需要拥有更复杂、更人性化的功能。比如能理解细微上下文间的差距,甚至情绪的变化。

Q:我的最后一个问题,如何打开启动舱门?

A:短语「打开启动舱门」, 是电影《2001年太空漫游》中的一句著名台词,由Dave Bowman在尝试与飞船计算机交互时说出...

令人惊喜的是,这场跨时空的虚假对话,预示着人工智能时代,超智慧电脑HAL 9000的现实体正一步步向我们走来!

参考资料:

https://www.reuters.com/technology/artificial-intelligence/amazon-turns-anthropics-claude-alexa-ai-revamp-2024-08-30/

https://www.cnbc.com/2024/05/22/amazon-plans-to-give-alexa-an-ai-overhaul-monthly-subscription-price.html

https://www.businessinsider.com/amazon-paid-alexa-plus-service-issues-2024-1

https://cerebras.vercel.app/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
有钱了!中超保级队引进南美国脚,股改成功后有望重现昔日辉煌

有钱了!中超保级队引进南美国脚,股改成功后有望重现昔日辉煌

体坛鉴春秋
2026-02-20 10:21:27
俄战略轰炸机在白令海完成计划飞行,有外国战机伴飞

俄战略轰炸机在白令海完成计划飞行,有外国战机伴飞

界面新闻
2026-02-20 20:37:08
退休族最舒服的8种状态,如果占4条以上,你的退休生活堪比活神仙

退休族最舒服的8种状态,如果占4条以上,你的退休生活堪比活神仙

情感大使馆
2026-01-22 09:34:30
17岁韩国首金得主崔佳恩三处骨折,对未直播夺冠“有点失望”

17岁韩国首金得主崔佳恩三处骨折,对未直播夺冠“有点失望”

懂球帝
2026-02-20 16:31:05
人民日报怒批!炫富、偷税749万、跑国外,现又来“割内地韭菜”

人民日报怒批!炫富、偷税749万、跑国外,现又来“割内地韭菜”

小熊侃史
2026-01-18 07:20:09
浙江一快递员跳河救落水小孩,弄湿客户名牌包被索赔8万,谁料孩子爷爷拿出一张卡,客户瞬间懵了!

浙江一快递员跳河救落水小孩,弄湿客户名牌包被索赔8万,谁料孩子爷爷拿出一张卡,客户瞬间懵了!

明智家庭教育
2026-02-20 20:15:56
确认了!是知名演员张嘉益

确认了!是知名演员张嘉益

看尽落尘花q
2026-01-04 11:55:44
余承东春节携妻回老家!和家乡年轻人打成一片,大佬也很平易近人

余承东春节携妻回老家!和家乡年轻人打成一片,大佬也很平易近人

一盅情怀
2026-02-20 14:10:50
卡罗拉锐放暴涨99%,这才是家庭用户的真实选择

卡罗拉锐放暴涨99%,这才是家庭用户的真实选择

侃故事的阿庆
2026-02-19 14:48:10
印度大型翻车现场翻出中国机器狗,还有泡沫塑料无人机……

印度大型翻车现场翻出中国机器狗,还有泡沫塑料无人机……

新民周刊
2026-02-20 09:12:25
明明状态相当不错,但掘金侧翼新星却并没有得到足够的战术支持?

明明状态相当不错,但掘金侧翼新星却并没有得到足够的战术支持?

稻谷与小麦
2026-02-21 02:35:11
去了趟拉斯维加斯,这辈子再不想去二回,到处是陷阱防不胜防!

去了趟拉斯维加斯,这辈子再不想去二回,到处是陷阱防不胜防!

天下霸奇
2026-01-29 09:07:49
萝莉岛文件再公开!背后更可怕的,是每年50万“消失的孩子”

萝莉岛文件再公开!背后更可怕的,是每年50万“消失的孩子”

秋枫凋零
2026-02-04 21:04:24
银行员工:若你60-80岁了,一定要停止存款,原因让人意想不到

银行员工:若你60-80岁了,一定要停止存款,原因让人意想不到

王二哥老搞笑
2026-02-12 11:18:57
惊人的关系定律:你与任何人关系结束了,皆因相同原因

惊人的关系定律:你与任何人关系结束了,皆因相同原因

闻心品阁
2026-01-20 09:50:40
美国希望打,欧洲希望打,印度希望打,俄罗斯希望打,东盟希望打,连朝鲜、韩国、以色列都希望打

美国希望打,欧洲希望打,印度希望打,俄罗斯希望打,东盟希望打,连朝鲜、韩国、以色列都希望打

头条爆料007
2026-02-19 12:28:54
哈登加盟后的潜在受益者?骑士锋线大将有机会扮演更重要的角色?

哈登加盟后的潜在受益者?骑士锋线大将有机会扮演更重要的角色?

稻谷与小麦
2026-02-21 01:20:04
美媒评全球最差7艘航母,辽宁舰在列,福建舰山东舰情况如何?

美媒评全球最差7艘航母,辽宁舰在列,福建舰山东舰情况如何?

林子说事
2026-02-19 17:59:48
外媒曝光!英国《简史防务》公布中国095型核潜艇卫星照,泵喷推进系统实锤了!

外媒曝光!英国《简史防务》公布中国095型核潜艇卫星照,泵喷推进系统实锤了!

军武速递
2026-02-20 19:10:37
最快女护士张水华代言年收入逼近500万,辞去工作也是赢家

最快女护士张水华代言年收入逼近500万,辞去工作也是赢家

姜大叔侃球
2026-02-19 17:23:27
2026-02-21 04:59:00
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14560文章数 66632关注度
往期回顾 全部

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

头条要闻

贝加尔湖遇难者遗体已被发现 涉事司机系私下接单

头条要闻

贝加尔湖遇难者遗体已被发现 涉事司机系私下接单

体育要闻

金牌夫妻!王心迪徐梦桃赛后拥抱太甜了

娱乐要闻

《将门独后》开拍,王鹤棣孟子义主演

财经要闻

特朗普全球关税被推翻!有何影响?

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

艺术
房产
数码
旅游
军事航空

艺术要闻

你绝对不想错过的石涛五十幅国画作品!

房产要闻

春节三亚楼市再放大招!千亿巨头,重磅推出超性价比海景现房

数码要闻

AMD "Zen 6" MSDT主流桌面处理器被曝最快2027年推出

旅游要闻

游人如织,新天地解锁马年最热闹的新春模样

军事要闻

消息人士透露:美军赴黄海活动 解放军有效应对处置

无障碍浏览 进入关怀版