网易首页 > 网易科技 > IT业界 > 正文

为确保Bard能给出高质量答案 谷歌员工对其进行单条式的评估、修正训练

0
分享至

2月25日消息,不久前,谷歌在内部发起了代号为“斗狗”的活动,要求公司所有员工每周用两到四个小时帮助测试和改进其新的人工智能搜索聊天机器人Bard

就在Bard发布前不久,微软也刚刚发布了采用ChatGPT聊天机器人背后技术的新版必应搜索引擎,它允许用户就几乎任何话题进行多轮对话。然而,在Bard被发现提供了一个错误的答案后,对于谷歌的质疑也逐渐浮现。同样,随着越来越多的人测试了新必应,他们的聊天机器人也遇到了问题,比如其倾向于好斗的行为。

Bard和ChatGPT这样的AI聊天机器人,可以通过接受人类编写的文本训练来模仿人类对话,这就解释了为什么必应的回复有时候看起来有些情绪化和不可预测。毕竟,被训练得像人一样的机器人也很容易犯下人类的错误。

这些聊天机器人最初通过摄取大量的训练数据来完成大部分学习。此外,Bard项目的产品主管杰克·克劳奇克(Jack Krawczyk)在一份备忘录中告诉员工,谷歌的研究发现,为用户查询添加高质量的响应“显著”提高了其AI模型的质量。

据多位AI专家透露,谷歌员工可能会为Bard编写高质量的答复以改进其模型。这些专家已经在AI和大型语言模型领域完成了广泛的研究。

克劳奇克让员工向Bard询问他们擅长的领域,比如最喜欢的兴趣爱好。然后,他们被要求评估Bard的答案,以确保这些答案符合人们的期望,长度和结构也都要合理。如果某个答案过于人性化、存在事实错误或者没有任何意义,员工可以重写答案并提交给Bard的模型训练。

英属哥伦比亚大学计算机科学助理教授韦德·施瓦茨(ved Shwartz)表示,要想持续改进Bard,谷歌可以采取监督式学习和强化学习相结合的方式。

其中,监督式学习是第一步,研究人员可以向聊天机器人输入人类编写的查询和答案,直到它学会如何像人类那样回复。在此基础上,谷歌可以构建一个强化学习模型,用谷歌员工写的答案来训练它,以帮助它理解该公司希望Bard的答案展现哪些价值观,包括在结构、语气以及其他方面加以改进。

这个强化学习模型会查看Bard给出的答案,剔除其中不合适的答案,并验证合格的答案,直到聊天机器人明白它应该如何行事。基本上,来自谷歌员工的“正确”答案将帮助该模型改进。

强化学习模型还可以教会Bard在不谈论情感或以其他方式假装人类的情况下提供信息。第一种模型主要学习基本的写作技巧,而第二种模型将引导机器按照预期的方向回答问题。

哥伦比亚大学计算机科学教授周宇(音译)说,有了足够好的答案进行分析,强化学习模型就能知道哪些是合适的答案,哪些是不合适的答案。

确保事实准确性

谷歌始终对推出聊天机器人持谨慎态度,可能是因为其可能对搜索业务利润产生短期影响,并担心准确性。谷歌要求员工拒绝回答Bard试图就金融或健康等敏感话题向用户提供建议的问题,因为回答错误的风险很高。

AI领域始终在努力解决事实准确性问题,OpenAI在1月份发布了更新,以提高ChatGPT在各种话题上对话的准确性。本月在旧金山举行的一场关于聊天机器人和AI的会议上,Anthropic首席执行官达里奥·阿莫代(Dario Amodei)表示,他相信随着模型的改进,聊天机器人将不再编造事实。

虽然训练有助于提高聊天机器人所生成答案的质量,但施瓦茨表示,她不认为这能够彻底解决事实准确性的问题。Bard和ChatGPT都有所谓的“幻觉”倾向,这是该行业用来形容聊天机器人编造事实的术语。它们会从网页上提取内容,有时不可避免地会错误地总结这些内容。(小小)

延伸阅读
相关推荐
热点推荐
证监会要求签署IPO承诺书!今日凌晨的四大消息正式发酵

证监会要求签署IPO承诺书!今日凌晨的四大消息正式发酵

逆潮流财商
2024-04-20 00:50:03
小米SU7车主买车5天后被辞退!知名车企回应:他大肆宣传小米SU7三个月,旷工去提车

小米SU7车主买车5天后被辞退!知名车企回应:他大肆宣传小米SU7三个月,旷工去提车

每日经济新闻
2024-04-17 12:54:09
美媒评华为Pura70系列开售:会给iPhone带来更大压力

美媒评华为Pura70系列开售:会给iPhone带来更大压力

手机中国
2024-04-18 14:40:31
开车时的不雅行为,摄像头拍的一清二楚,网友:不要这么迫不及待

开车时的不雅行为,摄像头拍的一清二楚,网友:不要这么迫不及待

芷夕说文
2024-01-08 08:54:41
证监会IPO最新通告!今日凌晨的三大利好正式袭来

证监会IPO最新通告!今日凌晨的三大利好正式袭来

逆潮流财经
2024-04-20 01:25:03
中国十大口感很好的高档香烟

中国十大口感很好的高档香烟

阿莱美食汇
2024-04-19 17:22:35
鸡汤灌多了,有的人真的就被骗了

鸡汤灌多了,有的人真的就被骗了

听风听你
2024-04-18 00:01:53
众议院规则委员会将援助乌克兰的议案提交全院表决

众议院规则委员会将援助乌克兰的议案提交全院表决

寰宇大观察
2024-04-19 16:28:13
唏嘘人世的十五个真相

唏嘘人世的十五个真相

读书人冯学荣
2024-04-17 10:10:41
这瓜……过去这么久,依然很恶心!

这瓜……过去这么久,依然很恶心!

听风听你
2024-04-17 11:28:33
老人居家4个月燃气费1.5万!成都及重庆燃气公司被查后,爆出猛料

老人居家4个月燃气费1.5万!成都及重庆燃气公司被查后,爆出猛料

飘飘视角
2024-04-18 14:49:30
在全球197个国家中,竟然没有一个愿意将主要粮食变为转基因品种

在全球197个国家中,竟然没有一个愿意将主要粮食变为转基因品种

搞笑的阿票
2024-04-19 22:41:07
1-14!国奥0胜算,遭韩国队碾压,成耀东苍白无力,恐提前出局

1-14!国奥0胜算,遭韩国队碾压,成耀东苍白无力,恐提前出局

小金体坛大视野
2024-04-19 11:32:51
晚间市场传来两大消息,国家队再度出手,两亿股民兴奋地睡不看了

晚间市场传来两大消息,国家队再度出手,两亿股民兴奋地睡不看了

彩云的夕阳
2024-04-19 16:55:18
熊孩子全网公开王者荣耀新作保密视频,爸妈要面临巨额赔款吗?

熊孩子全网公开王者荣耀新作保密视频,爸妈要面临巨额赔款吗?

叶子猪游戏网
2024-04-18 13:04:21
英伟达“钱途”黯淡?次级芯片中国市场遇冷,黄仁勋:奖金都发不出

英伟达“钱途”黯淡?次级芯片中国市场遇冷,黄仁勋:奖金都发不出

科技龙
2024-04-17 17:25:11
广东副秘书长自杀前发微信:羡慕……

广东副秘书长自杀前发微信:羡慕……

我是娱有理
2024-04-19 07:18:42
霍勒迪:通常家里来人我老婆会告诉我 但希尔突然就拿着球衣来了

霍勒迪:通常家里来人我老婆会告诉我 但希尔突然就拿着球衣来了

直播吧
2024-04-19 21:32:34
陕西包工头发现漂亮妻子出轨,在卧室装监控,情夫身份让他暴走

陕西包工头发现漂亮妻子出轨,在卧室装监控,情夫身份让他暴走

纪实录
2024-04-16 20:15:05
新一代宝马X3正式亮相,颜值提升明显,还有3.0T动力可选,能火?

新一代宝马X3正式亮相,颜值提升明显,还有3.0T动力可选,能火?

車解读
2024-04-18 17:38:49
2024-04-20 02:52:49

科技要闻

最沉默的李想,最便宜的理想

头条要闻

媒体:以色列对伊朗的反报复刀刀见血 要真的打痛伊朗

头条要闻

媒体:以色列对伊朗的反报复刀刀见血 要真的打痛伊朗

体育要闻

米切尔这次对线不会输了吧

娱乐要闻

北影节开幕之夜,内娱女星千娇百媚

财经要闻

新华资管香港的秘密:猛投地产或致巨亏

汽车要闻

风神L7预售 东风汽车北京车展阵容公布

态度原创

房产
游戏
本地
数码
艺术

房产要闻

国企下场,海口疯狂抢地!

诸葛亮北伐路上的头号克星郭淮,王者之心里换成姜维能不能拿下?

本地新闻

春色满城关不住|千阳春日限定美景上线了!

数码要闻

5599元 华硕破晓Pro14笔记本开售:Ultra 5 125H+2.5K屏

艺术要闻

最全展览单元剧透!北京最受瞩目艺术现场100青年艺术季终极解读

无障碍浏览 进入关怀版
×