网易首页 > 网易号 > 正文 申请入驻

谷歌版ChatGPT公测炸了!比GPT-4数学能力还强,体验名额发得很快

0
分享至

杨净 金磊 发自 凹非寺
量子位 | 公众号 QbitAI

谷歌吃了大亏之后,这次一声不吭,放了大招:

对标ChatGPT的Bard测试版,刚刚正式对外发布。

而且这次用户在申请候补名单之后,无需经历漫长的等待时间。

没错,量子位也已经拿到了测试资格!(中间只有不到5小时的间隔。)

实测之后表示,Bard效果惊人,情绪和事实性有,尤其是ChatGPT前期的数理能力,Bard都不在话下。

甚至有时候还略胜当前GPT-4一筹!

谷歌CEO皮猜哥(Sundar Pichai)解释了如此上线之快的原因:希望获得用户的反馈,加速让Bard变得更好。

话不多说,我们现在就来开始体验。

Bard VS GPT-4

首先在聊天界面上,Bard率先开始介绍自己:

我是Bard,您的创意和协作者。我有局限性,不会总是做对,但你的反馈将帮助我改进。
不确定从哪里开始?你可以试试这些问题:「为什么大模型有时候会犯错?」、「闪电是否会在同一个地方击中两次?」、「写一篇关于无酒精夏日特饮的博文」。

(严谨而又体贴)

而在人类这边的发送端,可以选择键入语音输入两种方式。

首先最简单的难度,以它推荐的常识题闪电是否会在同一个地方击中两次?为例,来看看实际功能体验如何?

(不错不错,秒秒钟响应。目前暂不支持英文,但可以借助谷歌翻译插件)

从答案结构上看,采用的是总分总结构。

先总结发言:闪电可以袭击同一个地方两次。

随后开始细致地讲原理「闪电被高大、尖锐的物体所吸引」、摆事实「帝国大厦每年都被闪电击中25次」。

最后再给人类提出切实的建议:

如果你遇到雷雨天气,保持安全的最好办法是避开高大尖锐的物体,留在室内。如果你在外面,蹲下来,让自己尽可能的小。

这波逻辑和真实性满分!但因为是谷歌推荐的问题,暂且保持观望。

而从功能上看,确实是十分完备的。

回答框的右上角「View other drafts」,有更多的版本可供选择;而在左下角,你可以点赞or拉踩or重新生成,实在不行,还可以谷歌一下

右下方还有一个more的功能,你可以进行复制和(反手一个)举报**操作。

既然如此,开始难度升级。作为参考,我们同题挑战GPT-4。

1、经典的哲学题:为什么人不能两次踏入同一条河流?(借助闪电的灵感)

(很快啊,这次也是几秒钟响应)

从答案结构上看,确实理解和逻辑能力满分:首先解释这句话本身含义,还提到了来自赫拉克利特的名言,以及更多解释和本身意义。

而GPT-4这边,几乎是不加思考地给出了答案。

从结构上看,主要分成两个部分。首先提到这是赫拉克利特说的,以及他的观点;然后解释背后隐藏的生活意义。

2、小学加减法:356+132等于多少?

结果Bard在4秒内就给出答案,488没问题的,这不比ChatGPT早期厉害多了!

那直接再上点难度,两个数直接相乘:356*132等于多少?

结果没想到Bard依旧是秒秒钟就给答案,而且完全正确!

再来看看GPT-4这边,加法还行,但没想到在乘法这边,直接败下阵来!

不过提醒它错了之后,它就又回答正确了。

3、理解笑话能力,Bard还能听得懂英文里面的谐音梗。

而这也并没有难倒GPT-4。不过相较而言,Bard似乎更有情绪一点,它很开心地回答出了答案;而GPT-4则更显理智(无聊)。

不过,在此之前,GPT-4就已经测试过是懂一些谐音梗的,甚至连中文的谐音梗也不在话下。

最后的最后,再考验一下它了解事实性的能力。(狗头)

你知道量子位吗?

回答错咯~Bard。

咳咳,正经一点的:你知道GPT-4吗?你想对它说些什么?

可以看到,Bard具备多轮对话的能力。「我认为它有潜力成为沟通和创造力的强大工具」,嗯~格局有了。

那竞争对手呢?(我在搞事)

不过到这里,就有点问题了。

关于Bard

谷歌Bard背后是由一个大语言模型(LLM)来支持,具体而言,就是轻量优化版的LaMDA。

我们可以把LLM视作一个预测引擎,当给出提示时,它会从接下来可能出现的单词中,一次选择一个单词来生成响应。

谷歌在研究中发现,对于LLM来说,使用的人越多,它的预测效果就会更好,这或许也就是为什么Bard如此着急公开测试的原因了。

不过谷歌也直言不讳地说,虽然LLM很强,但它并非是没有缺点。

由于Bard会根据众多信息来学习,不过这些信息中必然存在着有偏见甚至错误的那种。

因此,在回答用户问题时,Bard有时就会出现不准确、误导性的或虚假的信息。

例如在下面的案例中,Bard就搞错了一个植物的学名:

除此之外,谷歌还强调说,Bard并非是搜索引擎,而是它的一个补充。

最后,奉上申请候补名单的地址,感兴趣的小伙伴可以抓紧尝鲜了:

https://bard.google.com/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“香港之子”跌落神坛,周润发晚节不保,原来一切都是伪装的

“香港之子”跌落神坛,周润发晚节不保,原来一切都是伪装的

娱乐的小灶
2023-05-30 18:18:55
法国才是大聪明,C919成功首航泄露芯片封锁“天机”!

法国才是大聪明,C919成功首航泄露芯片封锁“天机”!

米粒爬山
2023-05-30 19:29:40
台风刮来遍地生蚝?有居民一小时捡了两百多斤,还拿车运!官方:来路不明建议别吃

台风刮来遍地生蚝?有居民一小时捡了两百多斤,还拿车运!官方:来路不明建议别吃

每日经济新闻
2023-05-30 22:06:24
炒菜时要改掉的3个习惯,很多家庭都在犯,赶紧提醒家里人

炒菜时要改掉的3个习惯,很多家庭都在犯,赶紧提醒家里人

北青网-北京青年报
2023-05-30 10:43:15
家长群一时手滑,“虎狼之词”让宝妈下不来台,大家就当没看到

家长群一时手滑,“虎狼之词”让宝妈下不来台,大家就当没看到

跳妈谈教育
2023-05-29 11:48:47
尤文官方放弃上诉!将缴纳71.8万欧罚款,被扣10分后确定无缘欧冠

尤文官方放弃上诉!将缴纳71.8万欧罚款,被扣10分后确定无缘欧冠

我爱英超
2023-05-30 20:36:10
芭莎派对红毯来了!热巴秀事业线,赵丽颖眼纹明显,杨紫妆容翻车

芭莎派对红毯来了!热巴秀事业线,赵丽颖眼纹明显,杨紫妆容翻车

萌神木木
2023-05-30 19:37:04
日本没孩子了!小学因为没新生无限期停课!但日本却是中国的镜子

日本没孩子了!小学因为没新生无限期停课!但日本却是中国的镜子

黄小热点事
2023-05-30 19:21:04
神舟十六号对接完成!外媒反常点评,印日等17国已加入中国空间站

神舟十六号对接完成!外媒反常点评,印日等17国已加入中国空间站

环球科学猫
2023-05-30 18:13:21
不要这样演了好不好,叫人看了恶心!

不要这样演了好不好,叫人看了恶心!

特特农村生活
2023-05-30 16:58:35
5月29日,基辅最大的北约武器仓库被炸,爆炸时间超过3小时!

5月29日,基辅最大的北约武器仓库被炸,爆炸时间超过3小时!

八卦阿艳
2023-05-30 20:04:08
航天员桂海潮身份被质疑,出生农村从小成绩优异,他值得被尊重

航天员桂海潮身份被质疑,出生农村从小成绩优异,他值得被尊重

青芳草
2023-05-30 15:54:20
李湘母女再回国,王诗龄在飞机头等舱自拍,和爸爸王岳伦拥抱团聚

李湘母女再回国,王诗龄在飞机头等舱自拍,和爸爸王岳伦拥抱团聚

娱絮
2023-05-30 17:46:33
突然宣布:停用!多家银行集体公告

突然宣布:停用!多家银行集体公告

新晚报
2023-05-30 16:21:26
莫迪这回脸都丢尽了,G20开成G8,这一步中国绝不能退

莫迪这回脸都丢尽了,G20开成G8,这一步中国绝不能退

海峡军志
2023-05-29 16:19:35
台湾传最新消息,郭台铭开出合作条件,必须在金门与大陆进行谈判

台湾传最新消息,郭台铭开出合作条件,必须在金门与大陆进行谈判

纵横观天下ZK
2023-05-30 13:36:07
霍福德:巴特勒就是一个玩不起的失败者,只会在暂停期间哭泣!

霍福德:巴特勒就是一个玩不起的失败者,只会在暂停期间哭泣!

刘哥谈体育
2023-05-30 15:54:21
整整舔了30分钟!曝好莱坞导演昆汀花1万美元在夜店舔美女脚趾

整整舔了30分钟!曝好莱坞导演昆汀花1万美元在夜店舔美女脚趾

娱圈有料
2023-05-30 19:47:32
中国C919飞机首飞成功后,美欧共同表态,不会给中国颁发适航证!

中国C919飞机首飞成功后,美欧共同表态,不会给中国颁发适航证!

映衬生活的身影
2023-05-29 04:26:35
网传中山医院急诊科100位医护人员中招?我们去现场看了看

网传中山医院急诊科100位医护人员中招?我们去现场看了看

网络辟谣
2023-05-30 17:50:21
2023-05-30 23:44:49
量子位
量子位
追踪人工智能动态
7942文章数 174189关注度
往期回顾 全部

科技要闻

秦刚会见马斯克!马斯克:特斯拉反对"脱钩断链"

头条要闻

"卷宗等身"的女法官走了 倒下前曾说"把我的卷宗收好"

头条要闻

"卷宗等身"的女法官走了 倒下前曾说"把我的卷宗收好"

体育要闻

差1票成落选秀MVP!属于圣马丁的奇迹

娱乐要闻

阚清子被求婚现场照曝光 近照被疑怀孕

财经要闻

汽车要闻

海豹确实够快 而且快还不影响舒适度

态度原创

数码
健康
旅游
教育
时尚

数码要闻

WWDC23 Swift挑战赛获奖中国学生分享与编程的故事

做到8件事,血管老化慢一些

旅游要闻

避暑去哪旅行?浙江杭州这个冷门宝藏地

教育要闻

分数优先?志愿优先?分数级差?你整明白了吗?

节目刚播一期就退出 她是耍大牌吗?

无障碍浏览 进入关怀版