网易首页 > 网易号 > 正文 申请入驻

豆包一声声“OK”把罗永浩搞破防,不就是大型现场直播版图灵测试

0
分享至

嘻疯 发自 凹非寺
量子位 | 公众号 QbitAI

罗永浩的年度科技创新分享大会,刷屏全网。

复盘整场四个多小时的直播,大伙儿集体回味讨论的焦点似乎就两个事儿:

第一件事,不知是因为迟到了40多分钟,还是提前就有谋划,罗永浩现场宣布给买了票的所有观众都退票

第二件事,罗永浩这张网络名嘴和豆包之间的“人机舌战”竟成最大亮点,火爆出圈。



光看二位的辩题,就已火药味十足,关于——锤子手机是否好用,节目效果也是拉满了。

一方,是锤子科技创始人罗永浩,立场鲜明地为自己的昔日作品辩护“锤子手机做得挺好的”。

另一方,则是AI豆包,手持数据与用户体验,冷静反驳“锤子手机做得不怎么样”。

整场交锋金句频出、逻辑对冲,搞得大伙儿掌声不断,笑声也不断,被网友调侃这是“老罗科技春晚上最搞笑名场面”。



老罗也现场直言“现在如果是辩论或吵架,我试过的所有大模型产品里,豆包是最厉害”、“跟它吵架能吵出心流来”。



这场辩论,表面上看是二位的斗嘴,实质上,却是在数百万观众注视下,对新一代实时交互AI能力进行的一次极限公测。

下面,我们就回到现场,拆解每一个精彩回合。

现场复盘,拆解豆包如何“接招”与“出招”

老罗一句“你准备好了吗”,话刚落地,豆包几乎是零延迟响应

最开始,豆包的语气还算轻松,抛出一句:“我觉得锤子手机可能不算成功吧”。但这句试探性的开场,立刻被老罗抓住逻辑漏洞,强势打断:“我没说成功,我是说做得好…它倒闭了我们都知道的。”

老罗的打断,带着明确的辩论策略与轻微的情绪施压。

而豆包的反应不仅迅速,其情绪承接和控制能力也立刻显现,声调中带上了更具对抗性的“生气”色彩,反驳道:“那好的标准总不能只看设计吧?它的硬件品控出过不少问题。”

老罗再次插话,称锤子手机不仅是设计做得好,人机交互也非常好,有一些创新还被各个大的手机厂商全都抄了。

笑不活,豆包完全没有被带偏,它在理解老罗逻辑的同时,精准记住了此前“品控”的论述,并以此为基础进行组合打击,抛出一通吐槽:

  • 就算有些交互被借鉴,也不代表产品整体好啊。
  • 你看它的TNT工作站定价高还得依赖手机,实际体验根本没达到预期,这不就是华而不实吗?



视频链接:https://mp.weixin.qq.com/s/PMQPrVV1gLbyilsc-j2gCA

眼看豆包这小刀嘴,句句喇在心窝子上,老罗也是破大防,称其“就挺讨厌的”。

接下来,直接上花招,要求豆包“每句话加一个OK”

OK啊,作为一个AI,对于用户发出的指令,那定然是得遵循的。

阴阳怪气这一块,豆包也是拿捏了。老罗也是没忍住差点笑出声。

但显然老罗是没玩够,毫不给豆包留情,吐槽它每一句后面都加OK太死板了,让它一句夹OK,一句不夹,这样就更像人了

PS:刚说完讨厌人家,又骂人家傻,要说这不是赤裸裸的AI身攻击,我是不信的(手动狗头)。

豆包还很有人情味地说了一句“行吧那我调整一下”,像极了无奈的真·打工人…

然后一秒切换状态,继续开大:

  • 锤子的交互创新是有,但不能掩盖硬伤啊,比如续航和发热问题,当年很多用户吐槽过的,这对手机来说很影响体验的OK。而且它的生态一直没做起来,很多功能的实用性其实打折扣的。就算有亮点,也得综合看整体表吧OK?

老罗眼看自己败下阵来,又开始“开骂”了:“你用过吗?你就在那儿振振有词的,你怎么用,你也没有手”。

(这部分高能片段对应以下视频2:40-3:40)



视频链接:https://mp.weixin.qq.com/s/PMQPrVV1gLbyilsc-j2gCA

豆包气势上却一点不输,表示自己看了大量用户反馈和评测,有依据的。

有意思的是,老罗追问你的数据评测来源是什么,豆包脱口而出ZEALER,老罗当场暴跳。众所周知,2014年ZEALER与罗永浩围绕锤子手机的直播辩论,被称为“世纪约架”。

现场观众也是炸了,老罗只能挑刺,说豆包忘了加OK了。

这背后,是豆包对复杂问题和隐含意图的深刻理解,以及将知识库信息迅速组织成有力论据的能力。



视频链接:https://mp.weixin.qq.com/s/PMQPrVV1gLbyilsc-j2gCA

最后,老罗问豆包是不是训练过情绪,豆包则回答“没有真正的情绪啦,只是在根据你的话调整表达”。

这话,确实也说得没毛病。

而且豆包意识到了话题跑偏,多次试图将话题引回到辩题,其多轮长上下文理解能力可见一斑。



视频链接:https://mp.weixin.qq.com/s/PMQPrVV1gLbyilsc-j2gCA

看完整场PK,现场效果是真精彩。但仔细一想,豆包终究是个AI,能和一个以“能说会道”著称的人类在公开直播中辩论还不翻车,这背后没有足够硬的技术是做不到的。

豆包咋这厉害呢?

豆包的实时语音交互能力,一度被视作国内AI语音赛道“独一份”的存在。像我身边的好多朋友、同事,遇事不决就给豆包打电话。

支撑起这种亮眼表现的,正是背后的豆包端到端实时语音模型。这款模型发布初代版本时就曾引发行业广泛关注。时隔一年,团队对模型进行了多轮迭代与优化,主要提升包括以下几个维度:

  • 多轮长上下文理解能力显著增强:在多轮、快速、话题跳跃的辩论中,豆包能始终紧扣主线,精准回溯历史论点,这直接体现了模型在长程记忆与逻辑关联上的进步。
  • 智商、情商拟人表现大幅提升:豆包不仅能进行逻辑反驳,更能根据对话氛围和对方的情绪调整策略,模型的交互智商大幅超过之前的版本。
  • 指令遵循的深度和稳定性进一步提升:能在交互过程中坚持人设和指令要求,具有深度可定制性。
  • 更好的情绪承接和控制能力:正如老罗察觉到的,豆包能根据用户的语气和内容,实时调整自己的表达情绪。
  • 更极致低延迟:端到端的响应速度无限逼近真人对话节奏。

总之,豆包并非仅仅在“文本对话”能力上进行了升级,而是通过底层架构的创新,在实时性、拟人性、可控性这三个维度上构建了综合优势。

昨晚与老罗的辩论,正是这套系统在极限场景下的一次公开测试。

而且我们刚刚发现,豆包APP已经上线了老罗同款功能“一辩高下”。打开豆包APP,点选“打电话-选择情景-一辩高下”,就能体验同款辩论搭子。此外,这一模型版本也即将在火山引擎上线API。



大型现场直播版图灵测试

回看这场“人机舌战”,它实际上清晰地标记了一个重要节点:实时交互式AI的能力,已经抵达了可以进入实战应用的关键阶段

过去语音助手是“指令-响应”工具,本质是功能映射,而现在以豆包为代表的AI,展现出来了“意图-理解-博弈-共识”的认知对齐能力。

AI正在从被动执行的工具,演进为能够与人类展开更深度、复杂互动的“对话型伙伴”。

与此同时,评估AI能力的方式或许也正在被重新定义。实验室的基准测试已然不够用,真正的考验来自于更复杂的现实场景

像这场辩论,模糊的立场、隐含的价值判断、设陷式的逻辑追问,以及持续施加的情绪压力,这是一种没有标准答案、只有博弈策略的开放式“压力测试”。

这种能力的突破,也意味着更多实际应用场景将成为可能。

在客服领域,AI将能处理更复杂的投诉和协商;在教育场景中,它可以成为更有挑战性的对话伙伴;在个人助理方面,它能理解更模糊的意图并管理多步骤任务。更重要的是,这种实时、自然的交互方式,将让人机协作变得更加顺畅。

豆包与老罗的这一战,或许就是这个时代的“大型现场直播版图灵测试”。在人类引以为傲的复杂实时思维博弈领域,AI展现了足以匹配、甚至在某些维度上超越人类的交互深度与逻辑韧性。

最后啊,老罗在直播中还说了,对于那些一出门吵架就不会吵,回家之后就会突然想起来“哎呀,我要那么吵就好了”的人,那你就需要有个人跟你一起练。

简直就在演我,这就和豆包对吵去。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
CCTV5直播巴萨vs皇马:巴萨不败就夺冠 皇马内讧难阻死敌卫冕

CCTV5直播巴萨vs皇马:巴萨不败就夺冠 皇马内讧难阻死敌卫冕

智道足球
2026-05-10 10:50:48
7分5板2助!又一个塔克诞生,哈登说得对,阿特金森该让他首发了

7分5板2助!又一个塔克诞生,哈登说得对,阿特金森该让他首发了

画夕
2026-05-10 20:52:11
茶叶是血糖的“加速器”?医生忠告:不想血糖升高,少喝4种茶

茶叶是血糖的“加速器”?医生忠告:不想血糖升高,少喝4种茶

阿莱美食汇
2026-05-10 19:59:18
男人过了60岁,永远不要在女人面前,说这5句话

男人过了60岁,永远不要在女人面前,说这5句话

风起见你
2026-05-11 01:01:37
贺希宁:重回四强来之不易,三年前被浙江绝杀成就了今天的我们

贺希宁:重回四强来之不易,三年前被浙江绝杀成就了今天的我们

懂球帝
2026-05-10 23:29:40
消失的美嘉生私生子了

消失的美嘉生私生子了

毒舌扒姨太
2026-05-10 22:36:37
马云:王中军是我见过中国最懒的CEO

马云:王中军是我见过中国最懒的CEO

时事娱闻杂记
2026-05-09 19:45:15
有出息的孩子,童年都有信号:出现这3种表现说明父母养对了

有出息的孩子,童年都有信号:出现这3种表现说明父母养对了

木言观
2026-05-04 07:08:52
巴尔韦德:“他们在荒谬的情况下进球了”

巴尔韦德:“他们在荒谬的情况下进球了”

绿茵情报局
2026-05-11 01:22:37
阿尔特塔确认本·怀特伤退:情况不乐观

阿尔特塔确认本·怀特伤退:情况不乐观

绿茵狂热者
2026-05-11 04:01:33
斯洛特下课倒计时?罗马诺最新爆料,利物浦锁定传奇主帅

斯洛特下课倒计时?罗马诺最新爆料,利物浦锁定传奇主帅

澜归序
2026-05-11 03:02:04
乌克兰击沉里海舰队导弹舰!摧毁全俄最大的两座炼油厂

乌克兰击沉里海舰队导弹舰!摧毁全俄最大的两座炼油厂

项鹏飞
2026-05-08 19:30:06
“你要收费我就卸载”,全网最离不开的AI不装了,口碑大反转

“你要收费我就卸载”,全网最离不开的AI不装了,口碑大反转

果壳
2026-05-09 12:33:57
190元白嫖榴莲被刑拘后,女子再迎三大噩耗,恐将变刑事审判

190元白嫖榴莲被刑拘后,女子再迎三大噩耗,恐将变刑事审判

北纬的咖啡豆
2026-05-10 09:37:00
一旦装上心脏支架,还能活多少年?医生不再隐瞒,说出了实话

一旦装上心脏支架,还能活多少年?医生不再隐瞒,说出了实话

医学原创故事会
2026-05-01 23:20:56
云南一交管大队队长被举报在KTV违规饮酒与女子举止亲密,本人称喝的茶水,女子突然靠近我下意识推了她;官方:初步调查举报不实

云南一交管大队队长被举报在KTV违规饮酒与女子举止亲密,本人称喝的茶水,女子突然靠近我下意识推了她;官方:初步调查举报不实

大象新闻
2026-05-10 08:42:28
两分半钟全部售完!广州楼市“日光盘”出现

两分半钟全部售完!广州楼市“日光盘”出现

爱看剧的阿峰
2026-05-10 13:46:54
撒贝宁一家现身重庆!蹲地上给女儿拍照超宠爱,妻子李白长腿吸睛

撒贝宁一家现身重庆!蹲地上给女儿拍照超宠爱,妻子李白长腿吸睛

青梅侃史啊
2026-05-10 07:41:59
宝马新车提回家 引擎盖现一窝猫 4S店:检测洗车未发现 愿提供检查与关怀补偿

宝马新车提回家 引擎盖现一窝猫 4S店:检测洗车未发现 愿提供检查与关怀补偿

快科技
2026-05-09 20:16:11
算命先生坦言:头上有两个旋的孩子,多半是这种命,很准

算命先生坦言:头上有两个旋的孩子,多半是这种命,很准

青青会讲故事
2025-10-23 16:45:08
2026-05-11 04:48:49
量子位 incentive-icons
量子位
追踪人工智能动态
12599文章数 176461关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

特朗普看完伊朗回应发帖:不喜欢 完全不可接受

头条要闻

特朗普看完伊朗回应发帖:不喜欢 完全不可接受

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

赵露思老实人豁出去了 没舞蹈天赋硬跳

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

家居
亲子
游戏
房产
公开课

家居要闻

菁英人居 全能豪宅

亲子要闻

从第一声呼唤开始,爱就有了名字

LPL第二赛段:拒绝让一追二!JDG三局战胜AL,挺进前三

房产要闻

低价甩卖!海口这个地标商业,无人接盘!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版