网易首页 > 网易号 > 正文 申请入驻

谷歌版ChatGPT公测炸了!比GPT-4数学能力还强,体验名额发得很快

0
分享至

杨净 金磊 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌吃了大亏之后,这次一声不吭,放了大招:

对标ChatGPT的Bard测试版,刚刚正式对外发布。

而且这次用户在申请候补名单之后,无需经历漫长的等待时间。

没错,量子位也已经拿到了测试资格!(中间只有不到5小时的间隔。)

实测之后表示,Bard效果惊人,情绪和事实性有,尤其是ChatGPT前期的数理能力,Bard都不在话下。

甚至有时候还略胜当前GPT-4一筹!

谷歌CEO皮猜哥(Sundar Pichai)解释了如此上线之快的原因:希望获得用户的反馈,加速让Bard变得更好。

话不多说,我们现在就来开始体验。

Bard VS GPT-4

首先在聊天界面上,Bard率先开始介绍自己:

我是Bard,您的创意和协作者。我有局限性,不会总是做对,但你的反馈将帮助我改进。
不确定从哪里开始?你可以试试这些问题:「为什么大模型有时候会犯错?」、「闪电是否会在同一个地方击中两次?」、「写一篇关于无酒精夏日特饮的博文」。

(严谨而又体贴)

而在人类这边的发送端,可以选择键入语音输入两种方式。

首先最简单的难度,以它推荐的常识题闪电是否会在同一个地方击中两次?为例,来看看实际功能体验如何?

(不错不错,秒秒钟响应。目前暂不支持英文,但可以借助谷歌翻译插件)

从答案结构上看,采用的是总分总结构。

先总结发言:闪电可以袭击同一个地方两次。

随后开始细致地讲原理「闪电被高大、尖锐的物体所吸引」、摆事实「帝国大厦每年都被闪电击中25次」。

最后再给人类提出切实的建议:

如果你遇到雷雨天气,保持安全的最好办法是避开高大尖锐的物体,留在室内。如果你在外面,蹲下来,让自己尽可能的小。

这波逻辑和真实性满分!但因为是谷歌推荐的问题,暂且保持观望。

而从功能上看,确实是十分完备的。

回答框的右上角「View other drafts」,有更多的版本可供选择;而在左下角,你可以点赞or拉踩or重新生成,实在不行,还可以谷歌一下

右下方还有一个more的功能,你可以进行复制和(反手一个)举报**操作。

既然如此,开始难度升级。作为参考,我们同题挑战GPT-4。

1、经典的哲学题:为什么人不能两次踏入同一条河流?(借助闪电的灵感)

(很快啊,这次也是几秒钟响应)

从答案结构上看,确实理解和逻辑能力满分:首先解释这句话本身含义,还提到了来自赫拉克利特的名言,以及更多解释和本身意义。

而GPT-4这边,几乎是不加思考地给出了答案。

从结构上看,主要分成两个部分。首先提到这是赫拉克利特说的,以及他的观点;然后解释背后隐藏的生活意义。

2、小学加减法:356+132等于多少?

结果Bard在4秒内就给出答案,488没问题的,这不比ChatGPT早期厉害多了!

那直接再上点难度,两个数直接相乘:356*132等于多少?

结果没想到Bard依旧是秒秒钟就给答案,而且完全正确!

再来看看GPT-4这边,加法还行,但没想到在乘法这边,直接败下阵来!

不过提醒它错了之后,它就又回答正确了。

3、理解笑话能力,Bard还能听得懂英文里面的谐音梗。

而这也并没有难倒GPT-4。不过相较而言,Bard似乎更有情绪一点,它很开心地回答出了答案;而GPT-4则更显理智(无聊)。

不过,在此之前,GPT-4就已经测试过是懂一些谐音梗的,甚至连中文的谐音梗也不在话下。

最后的最后,再考验一下它了解事实性的能力。(狗头)

你知道量子位吗?

回答错咯~Bard。

咳咳,正经一点的:你知道GPT-4吗?你想对它说些什么?

可以看到,Bard具备多轮对话的能力。「我认为它有潜力成为沟通和创造力的强大工具」,嗯~格局有了。

那竞争对手呢?(我在搞事)

不过到这里,就有点问题了。

关于Bard

谷歌Bard背后是由一个大语言模型(LLM)来支持,具体而言,就是轻量优化版的LaMDA。

我们可以把LLM视作一个预测引擎,当给出提示时,它会从接下来可能出现的单词中,一次选择一个单词来生成响应。

谷歌在研究中发现,对于LLM来说,使用的人越多,它的预测效果就会更好,这或许也就是为什么Bard如此着急公开测试的原因了。

不过谷歌也直言不讳地说,虽然LLM很强,但它并非是没有缺点。

由于Bard会根据众多信息来学习,不过这些信息中必然存在着有偏见甚至错误的那种。

因此,在回答用户问题时,Bard有时就会出现不准确、误导性的或虚假的信息。

例如在下面的案例中,Bard就搞错了一个植物的学名:

除此之外,谷歌还强调说,Bard并非是搜索引擎,而是它的一个补充。

最后,奉上申请候补名单的地址,感兴趣的小伙伴可以抓紧尝鲜了:

https://bard.google.com/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
思科警告称:全球出现大规模针对 VPN 服务的暴力破解攻击事件

思科警告称:全球出现大规模针对 VPN 服务的暴力破解攻击事件

搞笑的阿万
2024-04-18 23:56:58
小米SU7车主买车5天后被辞退!知名车企回应:他大肆宣传小米SU7三个月,旷工去提车

小米SU7车主买车5天后被辞退!知名车企回应:他大肆宣传小米SU7三个月,旷工去提车

每日经济新闻
2024-04-17 12:54:09
陕西包工头发现漂亮妻子出轨,在卧室装监控,情夫身份让他暴走

陕西包工头发现漂亮妻子出轨,在卧室装监控,情夫身份让他暴走

纪实录
2024-04-16 20:15:05
网友:为什么一些女孩选择去做按摩女?985同学的对话瞬间破防…

网友:为什么一些女孩选择去做按摩女?985同学的对话瞬间破防…

火山诗话
2024-04-19 13:02:22
外媒:伊朗警告称,如以方升级局势,将动用迄今从未用过的武器发起行动

外媒:伊朗警告称,如以方升级局势,将动用迄今从未用过的武器发起行动

环球网资讯
2024-04-16 15:10:18
严惩杨宏峰!四次重大误判,形成8打5,解说员:那是好帽!吹反了

严惩杨宏峰!四次重大误判,形成8打5,解说员:那是好帽!吹反了

弄月公子
2024-04-19 11:53:46
爷爷觉得4岁孙子长得像女孩, 带去医院检查后, 爷爷奶奶相拥而泣

爷爷觉得4岁孙子长得像女孩, 带去医院检查后, 爷爷奶奶相拥而泣

再吃一口
2024-04-18 11:50:33
又一省会城市全面取消限购!曾是反炒房“优等生”

又一省会城市全面取消限购!曾是反炒房“优等生”

南方都市报
2024-04-19 10:20:39
安徽省工业和信息化厅产业信息化发展处原处长余要火接受监察调查

安徽省工业和信息化厅产业信息化发展处原处长余要火接受监察调查

极目新闻
2024-04-19 09:32:45
北京这一夜,49岁林志玲和44岁高圆圆同框,输得很彻底

北京这一夜,49岁林志玲和44岁高圆圆同框,输得很彻底

柠檬有娱乐
2024-04-19 10:13:12
北京地铁5号线部分列车临时停车,地面公交已采取接驳措施

北京地铁5号线部分列车临时停车,地面公交已采取接驳措施

新京报
2024-04-19 08:46:38
不只是黄金在涨,现在全部都在疯涨,人民币大起义!

不只是黄金在涨,现在全部都在疯涨,人民币大起义!

好心态
2024-04-19 10:37:30
三大消息:南海一夜生变?马科斯突然对华保证!美国是时候低头了

三大消息:南海一夜生变?马科斯突然对华保证!美国是时候低头了

壹号评论
2024-04-19 11:42:14
车市太惨烈了,小鹏P7时隔半年掉价8w,车主有苦难言

车市太惨烈了,小鹏P7时隔半年掉价8w,车主有苦难言

买车家
2024-04-18 10:25:34
浙江一寺庙“闹鬼”,考古队挖12天后发现异常,被眼前场景震撼

浙江一寺庙“闹鬼”,考古队挖12天后发现异常,被眼前场景震撼

一个人讲故事
2024-03-08 21:54:55
有人问:李白如果坐过飞机会写出什么诗,评论区炸出一大波才子!

有人问:李白如果坐过飞机会写出什么诗,评论区炸出一大波才子!

雪莉故事汇
2024-04-17 11:39:39
北京电影节:朱一龙疤痕明显,林志玲太尴尬,有人脸肿有人整容!

北京电影节:朱一龙疤痕明显,林志玲太尴尬,有人脸肿有人整容!

古希腊掌管月桂的神
2024-04-18 19:23:16
364.86分!全红婵/陈芋汐碾压优势夺冠,世界杯总决赛轻松摘金

364.86分!全红婵/陈芋汐碾压优势夺冠,世界杯总决赛轻松摘金

ALL体育
2024-04-19 10:43:31
恭喜国际米兰,4亿欧元到手,张康阳公布夏转计划,3将9000万

恭喜国际米兰,4亿欧元到手,张康阳公布夏转计划,3将9000万

体育全天候
2024-04-18 21:32:29
反转了!大小S有新动态

反转了!大小S有新动态

娱乐圈酸柠檬
2024-04-19 12:51:27
2024-04-19 16:12:49
量子位
量子位
追踪人工智能动态
9297文章数 175237关注度
往期回顾 全部

科技要闻

最沉默的李想,最便宜的理想

头条要闻

以色列发动"报复袭击" 伊朗曾发出最高级别"核警告"

头条要闻

以色列发动"报复袭击" 伊朗曾发出最高级别"核警告"

体育要闻

安息吧勇士王朝,2013-2023

娱乐要闻

北影节开幕之夜,内娱女星千娇百媚

财经要闻

围猎三丰智能的神秘基金设骗局转移资产

汽车要闻

风神L7预售 东风汽车北京车展阵容公布

态度原创

游戏
家居
艺术
教育
数码

MMO游戏《Project:RogueLands》封测开启招募!

家居要闻

光影浮动 色块碰撞与线条起伏的情感呼应

艺术要闻

最全展览单元剧透!北京最受瞩目艺术现场100青年艺术季终极解读

教育要闻

课堂上的即兴辩论

数码要闻

2024 年 Q1 中国显示器市场 TOP10 出炉:AOC、HKC、小米销量前三

无障碍浏览 进入关怀版