网易首页 > 网易科技 > 网易科技 > 正文

人机大战“辩论赛”:IBM的AI选手战胜人类辩论冠军

0
分享至

本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!

【网易智能讯 6月20日消息】日前,IBM 公司发布了被称为Project Debater的人工智能系统,这个系统与经验丰富的人类辩手之间举行了两场辩论,以展示它已经拥有的强大能力。

Debater在两次辩论中均获胜

Project Debater亮相在IBM位于旧金山办公室的包装舞台上,该系统内嵌有一个6英尺高的黑色面板,并带有一个蓝色动态“嘴巴”。这是人类辩论者Noa Ovadia和Dan Zafrir的最强大对手,它站在附近的领奖台后面。

几年来,IBM一直在公司内部进行人类与 Project Debater 之间的辩论,这次演示是首次公开辩论。虽然 Debater 在短时间内收集了大量支持其论点的证据,但是有时候的答辩会超出边际,偶尔也会表达错误。虽然机器在很多方面都表现地不太自然和磕绊,但这场史无前例的事件让人想起了计算机如何学习如何应对非结构化的人类决策世界,代表着对话式人工智能向前迈出了一步。

对于两次短暂的辩论,参与者必须准备一份四分钟的开幕词,然后是四分钟的反驳和两分钟论证总结。开幕辩论的主题是“我们应该资助太空探索”,其次是“我们应该扩大远程医疗的应用”。

Debater 的设计目的是分析单个辩论问题,然后扫描众多文档(从维基百科到杂志和新闻文章)中的数十亿个句子,以形成自己的论点、准备反驳对方观点的陈词以及总结陈词。

Debater 与人类对手分别有 4 分钟时间陈述自己的论点,4 分钟时间反驳对方的论点,2 分钟时间做总结陈词。与站在讲台后面的人类辩手不同,代表Debater 的是一个跟人一样高的黑色方尖碑,当显示 3 个圆点时就表示它在倾听或者准备论点。

该程序严格遵守辩论形式,概述论点,并通过从科学研究和全球事件中获取的事实来直接回应人类对手提出的论点。Debater 还一度比较准确地指出了对手所犯的事实错误。尽管这一举动在政治辩论中很常见,但是因为这是人工智能系统做出的应对,所以显得弥足珍贵。

在这两场辩论中,观众们都投票赞成票给Project Debater系统,其在传达的信息量方面表现更好。尽管AI系统出现了一些失误,但观众们在第二场辩论中投票认为AI系统在说服观众立场方面,比其人类对手Zafrir更具说服力。

机器以自信的节奏、有组织的结构发言,但缺乏语言精确度和议论清晰度。例如,在太空辩论期间,它几次重复了空间探索对经济有利的因素,使用的语言略有不同。在其他时候,AI系统以不自然的方式插入了随机语和引语。有一次,AI系统提到宇航员Scott Kelly,然后说“配音”,表明这部分论点是从视频记录中提取的。如果没有手势(好,完全没有双手)或面部表情,观众在听过机器人辩论者时仍然难以保持联系和交流。

AI的辩论能力经过六年研发

不过值得注意的是,有很多IBM员工可能一直在为他们的创作提供支持。IBM希望这项研究最终能够使一个更复杂的虚拟助理能够吸收大量不同的信息集合,以帮助建立有说服力的论点并作出明智的决定——不仅仅是回应简单的问题和命令。Project Debater是IBM处理非常大型数据集的能力的展示,其中包括几十个主题的数百万篇新闻文章,然后将论点片断变成流畅的文章——这是计算机的一项挑战性任务。

该公司已经花费了6年的时间来开发Project Debater的辩论能力,包括数据驱动的演讲能力,在演讲中识别关键声明的听力理解以及制定原则性论据的能力。它扩展了IBM超级计算机Watson的功能,公司正在使用它来挖掘庞大的内部数据集,包括帮助医生诊断不同类型的癌症。

近70年来,人工智能系统在一定程度上是通过学习西洋跳棋和国际象棋等游戏而发展起来的。1997年,IBM的深蓝程序在国际象棋中击败加里卡斯帕罗夫(Gary Kasparov );2011 年,IBM Watson 在《危险边缘》(Jeopardy)比赛中取胜。几年后,Google 的 Alpha Go 打败了顶级围棋冠军;一个名为Libratus的程序击败了全球四大顶级扑克玩家。而这次里程碑式的辩论发生在人与机器之间的多次相似的对决之后。

用语言和推理来辩论是一个更加复杂的游戏。“国际象棋的规则很少。即使对于更为复杂的围棋来说,我们仍然在谈论一个非常有限和明确界定的空间”。参加辩论的邓迪大学技术中心教授Chris Reed说。“对语言而言,它不是那么明确。”他说。“关于什么构成转折和游戏规则,灵活性更大。”

一旦人工智能具有说服力的论点,就可以将其用作辅助人类决策的工具。

IBM 负责AI的副总裁 Dario Gil 接受《财富》采访时表示,“这一计划的挑战在于脱离传统的游戏环境,尽管游戏可能很复杂,但你最终处在一个独立封闭的体系中。有一些规则需要遵守。将人工智能引入一个开放性问题领域非常有趣。问题是这能否实现?”

2012 年,Slonim 和其他研究人员开始开发 Debater,并在第二年 10 月得到了一个早期的工作原型。要取得成功,Debater 需要完成三项基本任务,每项任务都标志着人工智能领域的新突破,这包括:识别口语中的重要概念和观点;理解大量文档并提取明确的论点;以及模拟人类的困境和争议,来创建有原则的论点。

例如,Gil 表示,如果 Debater 正在准备一场赞成素食主义的辩论,它可能会从与该主题没有明确关联的内容中提取一个论点,比如一项科学研究表明动物可以感受到恐惧和其他情绪。人工智能系统还需要消除多余的词汇,并以对人类有说服力的方式提出其论点。

IBM 在 Debater 中的首要目标之一就是帮助人工智能系统掌握人类语言。诸如 Dragon 之类的语音听写程序只是被动地在文本和语音之间转录语言,而不进行分析。而诸如 Alexa 之类、受语音驱动的人工智能助手只能进行有限的交流,通常只会持续几秒钟。但 Debater 是要构建一个可能持续几分钟的论点,然后做出它的回应。

Gil 表示,IBM 计划适时将 Debater 投入商用。该技术可应用于从教育到法律、从政府到企业等多种领域。销售团队和辩护律师可以通过能够进行辩论的人工智能系统来巩固他们的观点,而研究人员和决策者可以从 Debater 产生的赞成和反对意见中受益。

Slonim 表示,另一种潜在的应用可能是,检查有多少证据(如果有)支持虚假主张,并揭示这些证据的可信度,借此来处理虚假新闻。他表示,“毫无疑问,我们正在开发的基础技术将对打击虚假新闻大有用处。”

Debater的未来:巨大的用途

除此之外,IBM 希望继续开发人工智能系统,推动 Project Debater 实现更加伟大的成就。

“IBM研究部门主管Arvind Krishna说:”我们相信人工智能具有很好的可以理解我们人类的巨大潜力。

其中一个例子可能是企业董事会决策,其中存在很多相互矛盾的观点。AI系统可以毫无情绪地倾听对话,将所有的证据和论据都考虑进去,并在必要时挑战人类的推理。“这可以提高以证据为基础的决策水平”。Reed说,他还补充,同样的系统可以用于反恐情报分析,例如确定某个人是否构成威胁。

在这两种情况下,机器都不会做出决定,但会有助于讨论,并作为另一位发言者。尽管辩论看起来像是一个噱头,但Reed认为这是对人工智能极限的重要证明。

“它有助于公众了解AI技术的最新状态,这意味着即将发生的机器人启示的恐慌可能会稍微缓和一些。”他说。

(选自:theguardian 编译:网易智能 参与:nariiy)

关注网易智能公众号(smartman163),为你解读AI领域大公司大事件,新观点新应用。

相关推荐
热点推荐
泽连斯基:美国要求乌单方面撤军不公平!同意接受美欧提供类似“北约第五条”的安全保障

泽连斯基:美国要求乌单方面撤军不公平!同意接受美欧提供类似“北约第五条”的安全保障

每日经济新闻
2025-12-14 23:47:08
知名演员欧豪回乡为父亲庆生,全家福曝光,家人同住简朴套房反差大

知名演员欧豪回乡为父亲庆生,全家福曝光,家人同住简朴套房反差大

今古深日报
2025-12-15 10:17:01
何晴告别仪式曝光,许亚军态度说明她甘愿为爱做小

何晴告别仪式曝光,许亚军态度说明她甘愿为爱做小

李橑在北漂
2025-12-15 22:11:19
“轮椅总裁”李创利:身高不到1米,赚3亿后娶1米7女秘书为妻

“轮椅总裁”李创利:身高不到1米,赚3亿后娶1米7女秘书为妻

瑾瑜聊情感
2025-09-16 13:46:45
柬埔寨机枪手瞎打一通,操着东大高射机枪朝泰国F-16猛烈开火!

柬埔寨机枪手瞎打一通,操着东大高射机枪朝泰国F-16猛烈开火!

阿龙聊军事
2025-12-15 10:18:26
波兰将援助乌克兰8架战斗机!捷克民间组织筹资1亿援乌

波兰将援助乌克兰8架战斗机!捷克民间组织筹资1亿援乌

项鹏飞
2025-12-15 21:08:43
上海海港2026赛季前瞻:换血目标明确,新老逐步接班

上海海港2026赛季前瞻:换血目标明确,新老逐步接班

铿锵格斗
2025-12-15 20:04:44
宗庆后DNA被调取,3个私生子力证血缘关系,宗庆后72岁生小儿子?

宗庆后DNA被调取,3个私生子力证血缘关系,宗庆后72岁生小儿子?

削桐作琴
2025-07-14 20:20:04
12月最大黑天鹅即将起飞?若日本加息,人民币与A股如何自处?

12月最大黑天鹅即将起飞?若日本加息,人民币与A股如何自处?

小白鸽财经
2025-12-15 09:46:02
380亿美元罚单直接贴脸,吃准苹果要从中国跑路,印度装都不装了

380亿美元罚单直接贴脸,吃准苹果要从中国跑路,印度装都不装了

哄动一时啊
2025-12-14 22:03:27
为什么后来翻身的人,都有一段家里蹲的过往?

为什么后来翻身的人,都有一段家里蹲的过往?

洞见
2025-12-14 20:36:23
承诺给弟弟 30 万拆迁款,多年未兑现!大姐:我也委屈

承诺给弟弟 30 万拆迁款,多年未兑现!大姐:我也委屈

福建第一帮帮团
2025-12-14 19:00:27
反制日本的野心,这张牌的威力越看越大

反制日本的野心,这张牌的威力越看越大

明人明察
2025-12-14 17:56:29
仍在世的红卫兵领袖,曾被判刑17年,接受采访坦言:挺感谢邓小平

仍在世的红卫兵领袖,曾被判刑17年,接受采访坦言:挺感谢邓小平

旧时楼台月
2024-09-23 18:05:33
波尔津吉斯又病了!老鹰官宣至少休两周 上季曾确诊神经功能疾病

波尔津吉斯又病了!老鹰官宣至少休两周 上季曾确诊神经功能疾病

罗说NBA
2025-12-15 06:32:30
曾是“淡水鱼天花板”的鳜鱼,为何如今也卖不动了?大家不爱吃了?

曾是“淡水鱼天花板”的鳜鱼,为何如今也卖不动了?大家不爱吃了?

农夫也疯狂
2025-12-05 15:15:00
亚运三金得主运动员王莉,实名举报获奖归来竟被领导索要奖金

亚运三金得主运动员王莉,实名举报获奖归来竟被领导索要奖金

回旋镖
2025-12-14 22:01:43
从国家一级演员到“淫魔”,床戏令人大开眼界,却深受观众喜欢?

从国家一级演员到“淫魔”,床戏令人大开眼界,却深受观众喜欢?

墨兰史书
2025-12-13 17:50:03
缺爱的朝鲜长公主金敬姬,与被处死的“摄政王”张成泽的隐秘往事

缺爱的朝鲜长公主金敬姬,与被处死的“摄政王”张成泽的隐秘往事

洞鉴历史
2023-12-21 10:57:33
证监会:全力做好岁末年初工作,坚决守牢防风险、保稳定的底线

证监会:全力做好岁末年初工作,坚决守牢防风险、保稳定的底线

界面新闻
2025-12-15 12:32:14
2025-12-15 23:03:00

科技要闻

大佬冷酷预言:未来15年 人形机器人成废铁

头条要闻

55岁丈夫收到小卡片半年花30多万 妻子:一天就13人次

头条要闻

55岁丈夫收到小卡片半年花30多万 妻子:一天就13人次

体育要闻

战胜完全体雷霆,马刺“疯狂动物城”只是半成品

娱乐要闻

何晴告别式现场,前夫许亚军双眼泛红?

财经要闻

新农合涨到400元 农民断缴背后的扎心真相

汽车要闻

主驾配按摩还可选6座 新款捷途X90PRO售13.59万起

态度原创

手机
数码
游戏
旅游
家居

手机要闻

一加Turbo系列确定,性能、续航全面提升

数码要闻

机械革命无界S500办公台式主机上架预约,国补到手2199元

《识质存在》PC配置公开 游戏确认使用D加密

旅游要闻

文旅精英齐聚济源 共话产业发展新篇

家居要闻

温暖色调 大空间不冷清

无障碍浏览 进入关怀版
×