网易首页 > 网易号 > 正文 申请入驻

用了chatGPT之后,我不得不向机器学习

0
分享至

ChatGPT火了之后,有人惊叹这个工具的厉害,也有人讨论它的不严谨。有人认为它未来能带来教育方面的平权,因为所有人可以公平的通过它接触到全世界的公开资料。

也有人认为,这个工具反而会放大大家的信息鸿沟,因为使用者水平的不同会导致使用效果天差地别。会用和不会用的两波人之间的差距,会比它没出现之前更大。

以深蓝、阿尔法狗和chatGPT为代表的人工智能,已经在多个领域战胜了人类。这是事实。

在研究了它们到底怎样战胜人类之后,我发现,自己必须要开始向机器学习。因为它们的训练方法确实能导向更强的实力。

第一个要学习的,就是克服人性的弱点。贪婪、恐惧、焦虑、不安、傲慢和懒惰,都是人性的弱点。这些机器人都没有。

1997年,世界棋王卡斯帕罗夫就曾经被IBM的机器人“深蓝”打败。事后,他曾经回忆过,自己和机器人对决的时候那种不安的感觉。

卡斯帕罗夫是国际象棋界公认的世界棋王,他少年成名,从22岁开始,他连续21年在棋坛封王。有一场经典的比赛证实过卡斯帕罗夫的实力。

他曾经一个人对抗来自全世界75个国家和地区的5万名国际象棋高手。卡斯帕罗夫自己在一边,其他5万人在另外一边。

那5万人可以讨论,商量、投票决定下一步往哪走,一招棋的讨论时间可以长达1天。经过4个月的拉锯战,5万人弃权认输,卡斯帕罗夫获胜。

但是,这位世界棋王在和“深蓝”的对决中,溃败认输。事后,他曾经在TED演讲中回忆了这场比赛。

“比赛之前,我已经和世界顶级选手进行过数百场较量。我能从他们的肢体语言中判断出他们的精神状态,还有下一步会怎么走。但当我坐在‘深蓝’对面的时候,立刻有一种崭新的、不安的感觉。我无法预测到底要做什么。”

之后,谷歌的阿尔法狗又曾经先后打败过世界冠军李世石和柯洁。柯洁在赛后曾经沮丧的认为,自己的职业生涯就要结束了。

无数人研究过阿尔法狗为什么能够战胜人类。他们发现了阿尔法狗“强化学习”模式。的两个秘密。

第一个就是“左右互搏”,每天自己和自己下棋,自我对弈3万局,不知疲倦。这是人类不可能做到的,人的体力最多支撑对决十几盘。

第二个就是,它每下一步棋都能实现“快速复盘”。快速评估这一招棋走的是好是坏。从而进一步计算这一步棋对全局赢面的影响。还能根据这一步棋,决定接下来的棋要怎么走。这种快速的计算能力和积累,是人类很难做到的。

阿尔法狗成功的这两个秘密,正是人类需要向机器学习的地方。在第一个秘密中,我们并不是要学习机器永不知疲倦,这是不可能做到的。值得学习和借鉴的是,我们需要向机器一样,尽量让自己在对决中克服人性的弱点,弱点越少,赢面越大。

第二个秘密,要学习这种“快速复盘”的能力,尽管我们根本就不可能很快速。但这种思路仍然可以在实际做事过程中给我们很多启发。我们需要尽量快速的盘点每一个动作的得失,以便于调整接下来的动作。

如果我们能够做到这两点,的确可以在实际工作中获得更好的结果。

ChatGPT相比于前几代人工智能机器人,更厉害的地方在于它的RLHF训练方法。这种训练方法翻译过来叫“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)。

工程师们为了训练chatGPT,除了搭建语言模型之外,还要喂给它大量的语料,让它能够自主理解上下文。这样,才能实现给了上文之后,自动生成下文。而且,每一次用户和它的互动和反馈,都是在帮助chatGPT学习和提升。它的理解越来越精准,回复也越来越完善。

就在两年前,它还仅仅只能回答“一年有几个季节”这种基本的事实性问题。两年过后,它已经能在聊天中识别笑话、能写新闻稿和代码,也能给程序找bug了。

而人类,即便在学习能力最强的10-20岁时期,也不可能成长的这么快。更何况,人在一生中还有故步自封的中年和老年时期。相比于机器人,我们经常听不进去别人的劝告和建议。机器人训练中这种快速学习和反馈调整的策略,不正是自我迭代的方法嘛。

人和机器人要如何相处?乐观派认为,机器人永远都只是人类的工具;悲观派也曾经担心人类被机器人殖民和统治。在人工智能技术逐渐成熟的过程中,科学家和工程师们模拟人类大脑思考的方式去训练机器人。

在这两派之外,我想,如果我们能像机器一样学习,不是也会很厉害吗?

(全文完)

感谢阅读,原创不易,转载请注明出处。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
她曾是央视美女主持人,嫁给了军委副主席之子,离婚后成知名画家

她曾是央视美女主持人,嫁给了军委副主席之子,离婚后成知名画家

燕小姐说历史
2024-06-02 08:50:46
细节披露:中美防长谈了什么

细节披露:中美防长谈了什么

齐鲁壹点
2024-06-01 21:16:37
“梁上君子”入室盗窃留字条“你要改进防盗”,被刑拘

“梁上君子”入室盗窃留字条“你要改进防盗”,被刑拘

澎湃新闻
2024-06-03 13:08:28
“1%定律”:一个人要走大运,会有三种迹象

“1%定律”:一个人要走大运,会有三种迹象

布衣粗食68
2024-06-01 16:05:14
谢晖为了亚泰保级,首次向老东家申花开口提要求,斯卢茨基已同意

谢晖为了亚泰保级,首次向老东家申花开口提要求,斯卢茨基已同意

罗掌柜体育
2024-06-03 08:20:21
距离发射不到四分钟!波音取消了“星际客机”载人试飞任务

距离发射不到四分钟!波音取消了“星际客机”载人试飞任务

财联社
2024-06-02 03:25:09
村上春树:最幸福的事就是没朋友,无用的社交,不如高质量的独处

村上春树:最幸福的事就是没朋友,无用的社交,不如高质量的独处

学史思今
2024-05-31 17:00:08
狂野荷乙丨广州城旧帅上演“黑八奇迹”重返荷甲

狂野荷乙丨广州城旧帅上演“黑八奇迹”重返荷甲

直播吧
2024-06-03 11:01:09
阿根廷的生活水平到底是什么样的?

阿根廷的生活水平到底是什么样的?

火山杂谈
2024-06-02 22:35:58
张曼源身材也太炸裂了

张曼源身材也太炸裂了

娱乐的小灶
2024-06-03 12:00:31
说实话,我确实不大理解,今天看到相关新闻时很震惊。

说实话,我确实不大理解,今天看到相关新闻时很震惊。

火山杂谈
2024-05-31 23:29:47
右边这个是陈好,大家肯定都知道。左边这个我没看出来是谁?

右边这个是陈好,大家肯定都知道。左边这个我没看出来是谁?

牛叨小史
2024-06-03 10:43:00
真受不了这个状元!拿着两亿顶薪,当老大不合格,当老二还不合格

真受不了这个状元!拿着两亿顶薪,当老大不合格,当老二还不合格

球毛鬼胎
2024-06-02 17:07:20
三只羊厦门分公司开业!曾志伟穿粉装现身,透露未来重要动向

三只羊厦门分公司开业!曾志伟穿粉装现身,透露未来重要动向

鑫鑫说说
2024-06-03 13:37:18
《天行健》:一部不该被忽略的好剧

《天行健》:一部不该被忽略的好剧

澎湃新闻
2024-06-02 11:46:43
饼饼不在~臭美日

饼饼不在~臭美日

娱乐八卦木木子
2024-06-03 05:05:17
解气,李盈莹说心里话!采访当场改口让蔡斌尴尬,难怪朱婷喜欢她

解气,李盈莹说心里话!采访当场改口让蔡斌尴尬,难怪朱婷喜欢她

嘴炮体坛
2024-06-03 13:13:33
媒体人:广西平果哈嘹出现了欠薪现象

媒体人:广西平果哈嘹出现了欠薪现象

直播吧
2024-06-02 22:16:19
美图分享第0039期

美图分享第0039期

花小猫的美食日常
2024-06-03 01:57:22
看李小冉47岁蜕变成“大号水蜜桃”,你跟上新风潮了吗?

看李小冉47岁蜕变成“大号水蜜桃”,你跟上新风潮了吗?

虾剪说剧
2024-05-30 16:07:11
2024-06-03 14:18:44
合子的独白
合子的独白
更深的思考、更快的成长
91文章数 201关注度
往期回顾 全部

科技要闻

2万字演讲|黄仁勋剧透 未来3年新品有这些

头条要闻

武汉一警察牺牲 身中15刀仍下25级台阶紧追歹徒20米

头条要闻

武汉一警察牺牲 身中15刀仍下25级台阶紧追歹徒20米

体育要闻

万人空巷!皇马举行欧冠夺冠庆典

娱乐要闻

混战升级!编剧赵冬苓力挺王阳遭围攻

财经要闻

黄仁勋的计划:涉及新AI平台 HBM4 机器人

汽车要闻

搭载华为HiCAR 传祺M6 MAX售14.58万元

态度原创

数码
手机
艺术
游戏
家居

数码要闻

AMD下一代电脑处理器更名!改为“Ryzen AI 300系列”

手机要闻

曝一加13定制2K 8T LTPO高规格国产屏 还有超大电池

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

有点猛!魔兽世界能用Xbox直接打本?玩家测试:最高配置给我拉满

家居要闻

静谧极简 让空间回归本质

无障碍浏览 进入关怀版