网易首页 > 网易科技 > IT业界 > 正文

为确保Bard能给出高质量答案 谷歌员工对其进行单条式的评估、修正训练

0
分享至

2月25日消息,不久前,谷歌在内部发起了代号为“斗狗”的活动,要求公司所有员工每周用两到四个小时帮助测试和改进其新的人工智能搜索聊天机器人Bard

就在Bard发布前不久,微软也刚刚发布了采用ChatGPT聊天机器人背后技术的新版必应搜索引擎,它允许用户就几乎任何话题进行多轮对话。然而,在Bard被发现提供了一个错误的答案后,对于谷歌的质疑也逐渐浮现。同样,随着越来越多的人测试了新必应,他们的聊天机器人也遇到了问题,比如其倾向于好斗的行为。

Bard和ChatGPT这样的AI聊天机器人,可以通过接受人类编写的文本训练来模仿人类对话,这就解释了为什么必应的回复有时候看起来有些情绪化和不可预测。毕竟,被训练得像人一样的机器人也很容易犯下人类的错误。

这些聊天机器人最初通过摄取大量的训练数据来完成大部分学习。此外,Bard项目的产品主管杰克·克劳奇克(Jack Krawczyk)在一份备忘录中告诉员工,谷歌的研究发现,为用户查询添加高质量的响应“显著”提高了其AI模型的质量。

据多位AI专家透露,谷歌员工可能会为Bard编写高质量的答复以改进其模型。这些专家已经在AI和大型语言模型领域完成了广泛的研究。

克劳奇克让员工向Bard询问他们擅长的领域,比如最喜欢的兴趣爱好。然后,他们被要求评估Bard的答案,以确保这些答案符合人们的期望,长度和结构也都要合理。如果某个答案过于人性化、存在事实错误或者没有任何意义,员工可以重写答案并提交给Bard的模型训练。

英属哥伦比亚大学计算机科学助理教授韦德·施瓦茨(ved Shwartz)表示,要想持续改进Bard,谷歌可以采取监督式学习和强化学习相结合的方式。

其中,监督式学习是第一步,研究人员可以向聊天机器人输入人类编写的查询和答案,直到它学会如何像人类那样回复。在此基础上,谷歌可以构建一个强化学习模型,用谷歌员工写的答案来训练它,以帮助它理解该公司希望Bard的答案展现哪些价值观,包括在结构、语气以及其他方面加以改进。

这个强化学习模型会查看Bard给出的答案,剔除其中不合适的答案,并验证合格的答案,直到聊天机器人明白它应该如何行事。基本上,来自谷歌员工的“正确”答案将帮助该模型改进。

强化学习模型还可以教会Bard在不谈论情感或以其他方式假装人类的情况下提供信息。第一种模型主要学习基本的写作技巧,而第二种模型将引导机器按照预期的方向回答问题。

哥伦比亚大学计算机科学教授周宇(音译)说,有了足够好的答案进行分析,强化学习模型就能知道哪些是合适的答案,哪些是不合适的答案。

确保事实准确性

谷歌始终对推出聊天机器人持谨慎态度,可能是因为其可能对搜索业务利润产生短期影响,并担心准确性。谷歌要求员工拒绝回答Bard试图就金融或健康等敏感话题向用户提供建议的问题,因为回答错误的风险很高。

AI领域始终在努力解决事实准确性问题,OpenAI在1月份发布了更新,以提高ChatGPT在各种话题上对话的准确性。本月在旧金山举行的一场关于聊天机器人和AI的会议上,Anthropic首席执行官达里奥·阿莫代(Dario Amodei)表示,他相信随着模型的改进,聊天机器人将不再编造事实。

虽然训练有助于提高聊天机器人所生成答案的质量,但施瓦茨表示,她不认为这能够彻底解决事实准确性的问题。Bard和ChatGPT都有所谓的“幻觉”倾向,这是该行业用来形容聊天机器人编造事实的术语。它们会从网页上提取内容,有时不可避免地会错误地总结这些内容。(小小)

延伸阅读
相关推荐
热点推荐
Angelababy在上海与一众网红聚会!这真是“美得突出”

Angelababy在上海与一众网红聚会!这真是“美得突出”

今古深日报
2025-12-18 11:58:58
枫花恋高分佳作,长发枫哥,黑丝女仆

枫花恋高分佳作,长发枫哥,黑丝女仆

吃瓜党二号头目
2025-12-18 08:58:41
大规模年轻人选择不生小孩

大规模年轻人选择不生小孩

经济学教授V
2025-12-16 18:41:25
骗走 80 后眼泪的神片:《妈妈再爱我一次》,中年再看全是PUA

骗走 80 后眼泪的神片:《妈妈再爱我一次》,中年再看全是PUA

白羽居士
2025-12-09 18:38:18
还未入冬!湖南刷新1961年以来最晚入冬纪录,专家:秋季攒的热量太多

还未入冬!湖南刷新1961年以来最晚入冬纪录,专家:秋季攒的热量太多

潇湘晨报
2025-12-18 09:54:13
邪恶实验:6女4男船上共处100天无法律约束,结果揭秘

邪恶实验:6女4男船上共处100天无法律约束,结果揭秘

王嚾晓
2025-12-17 13:19:55
轰动全国的游戏军费贪污案,欠铺路民工80,没有万

轰动全国的游戏军费贪污案,欠铺路民工80,没有万

远方青木
2025-12-16 23:38:18
2028年奥运会男足名额分配:亚足联2.5个名额,欧足联4个名额

2028年奥运会男足名额分配:亚足联2.5个名额,欧足联4个名额

懂球帝
2025-12-17 22:03:05
王大雷离开鲁能后首次现身新去处,得到球迷追捧,本人发声确认

王大雷离开鲁能后首次现身新去处,得到球迷追捧,本人发声确认

篮球看比赛
2025-12-18 13:40:05
难以置信!高考664分,某同学从顶尖985转学到普通本科,引发争议

难以置信!高考664分,某同学从顶尖985转学到普通本科,引发争议

火山詩话
2025-12-17 06:19:46
霸王茶姬创始人婚礼证婚词曝光!证婚人李善友称:张俊杰一天书都没念,是个天才,与新娘在混沌学园相识相爱

霸王茶姬创始人婚礼证婚词曝光!证婚人李善友称:张俊杰一天书都没念,是个天才,与新娘在混沌学园相识相爱

观威海
2025-12-17 15:18:04
离奇“海参养殖恶势力”案:被敲诈者包括河北省公安厅公职人员

离奇“海参养殖恶势力”案:被敲诈者包括河北省公安厅公职人员

法治边角料
2025-12-18 10:02:40
和郭艾伦传绯闻?女篮美女曝光,31岁,老乡,活泼,公布择偶标准

和郭艾伦传绯闻?女篮美女曝光,31岁,老乡,活泼,公布择偶标准

乐聊球
2025-12-17 11:18:50
Epic就圣诞连送活动向玩家道歉!深知与Steam的差距

Epic就圣诞连送活动向玩家道歉!深知与Steam的差距

3DM游戏
2025-12-18 14:38:26
咱们不打算继续等下去了,王毅外长直言:我们有权对日本进行清算

咱们不打算继续等下去了,王毅外长直言:我们有权对日本进行清算

扶苏聊历史
2025-12-17 15:24:00
大船绕开新加坡直奔中国,打破“马六甲困局”,中国布局终于起效

大船绕开新加坡直奔中国,打破“马六甲困局”,中国布局终于起效

达文西看世界
2025-12-18 15:52:14
让人眼红了!16岁小伙深圳卖烤鸡,日入过万,每月给家里寄几万元

让人眼红了!16岁小伙深圳卖烤鸡,日入过万,每月给家里寄几万元

火山詩话
2025-12-17 05:38:28
悲催!一男子露营为陌生女孩提供帐篷睡袋遭损坏,要赔偿被骂拉黑

悲催!一男子露营为陌生女孩提供帐篷睡袋遭损坏,要赔偿被骂拉黑

火山詩话
2025-12-17 08:41:36
成都8人合同到期,周定洋成抢手货 徐正源走人有阵痛期 明年争前4

成都8人合同到期,周定洋成抢手货 徐正源走人有阵痛期 明年争前4

替补席看球
2025-12-18 14:25:53
林生斌现状曝光:定居澳洲富人区,一家幸福,现任是前公司员工

林生斌现状曝光:定居澳洲富人区,一家幸福,现任是前公司员工

林轻吟
2025-09-21 09:21:51
2025-12-18 17:20:49

科技要闻

新一代AI创业大赛颁奖典礼暨AI投资论坛

头条要闻

普京:“欧洲小猪”想从俄罗斯解体中捞好处

头条要闻

普京:“欧洲小猪”想从俄罗斯解体中捞好处

体育要闻

巴黎首夺世界级冠军 加冕6冠王比肩巴萨拜仁

娱乐要闻

丝芭放大招了!实名举报鞠婧祎经济犯罪

财经要闻

重大改革,身关14亿人的政策彻底变了!

汽车要闻

开箱日产大沙发 精致办公or躺平追剧 哪个更适配?

态度原创

教育
亲子
旅游
房产
公开课

教育要闻

满分听力秘籍!!

亲子要闻

智商较低的儿童是否面临更大的心理健康问题风险?研究发现

旅游要闻

文明蕴化看陶寺:陶寺遗址博物馆将举行冬至观日出活动

房产要闻

太强了!封关时刻,两天砸下50亿!央企绿发,重仓三亚!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×