网易首页 > 网易号 > 正文 申请入驻

chatgpt是如何训练出来的?它最难的点不是技术

0
分享至

【chatgpt是如何训练出来的?它最难的点不是技术】

chatgpt现在非常火爆,根源在于它的聊天水平号称超过了90%的人类。

在这以前,所谓的小冰、siri、小艺、小度、小Q这类科技巨头公司推出的聊天机器人,都是傻瓜式的聊天机器人,胡言乱语,答非所问,插诨打科,跟智能几乎是不挨边。

chatgpt不同,人工智能大为提高,美国的大学生几乎人人在用,用它写作业,考试与写论文,关键是,居然过关了,甚至论文的水平达到教授级别,这不是普通的智能,这是硕士博士级别的智能啊。

等于是chatpgt成为人工智能设备的大脑,人类终于将AI的大脑创造出来了,并且让它迅速迭代,这是chatpgt火爆的原因。5天用户超过百万级别,2个月,用户达到1亿,这是互联网产品吸引用户最快的产品。

称它为现象级的应用,没有夸赞它的意思。

那么,chatgpt是如何训练出来的呢?它最难的地方是哪个环节?

有些人会以为最难的地方是技术,其实并不是的,chatgpt的技术并不难,百度、华为、阿里等技术团队都掌握了chatpgt的技术。就是算法模型NLP,智能型的算法模型难,什么意思呢?

原来我们跟聊天机器人比如小艺聊天时,没办法追问,只能一问一答,一答一个问题,前后风马牛不相及,现在呢?可以追问,并且在追问中,在刨根究底的过程中,最终获得了自己需要的内容。也就是说,机器人能看懂持续追问的内容,并且不断根据追问的要求提供更精准、更科学、更人性化的内容。

依靠什么做到的呢?依靠对聊天机器人算法模型(NLP)的训练,不断给它喂数据,让它成长起来,变得更加智能。而由于人类各个领域内的对话聊天互动太过复杂,就需要在训练过程中不断地修正NLP的参数,有多少个参数呢?

chatgpt的参数是千亿级别的,达到1750亿个参数,以应对无数个意外;而华为算法模型参数也是千亿级别的;

为什么会有这么多参数?因为训练的内容太多了,chatgpt的训练内容有多少?45TB,1TB=1024GB,1GB=1024MB,1MB=1024KB,1KB-1024字节,一个英文字母是1个字节,一个汉字是2个字节。

那么,45TB大概等于5兆亿字节,等于2.5兆亿汉字的内容,如果一本书是10万字来算的话,那么,2.5兆亿汉字相当于2.5亿册书,中国最大的图书馆是北京图书馆,藏书1500万册,45TB相当于17个北京图书馆的数量。

因此,要通过千亿级别的参数对45TB的数据进行训练,一天的成本,chatgpt是460万美元。

所以说,chatgpt最难不是技术,而是算力,就是芯片的计算速度,chatgpt动用了28.5万个CPU与1万个高端GPU来进行训练的。CPU负责NLP模型的代码运行,浮点计算与控制,GPU负责图形处理。

如此庞大的训练数据来自于哪儿?不可能是训练人员输入的,而是通过蛛蛛爬虫在网络上抓取,当然不排除电子扫描一些专业的文档。

由于互联网已经发展了20多年,在2018年时,每天产生的数据就有175ZB,ZB可比TB大多了!1ZB=1024*1024*1024TB。

互联网中有天文数字的数据,训练数量非常多,只需要抓取就可以了。

所以,chatgpt的训练步骤分为三步:

第一步,通过蜘蛛爬虫从互联网里抓取需要的数据,目前来看,主要抓取的是问答类、代码类、数据库表格类、专业科技文档类、医学类、学校课本知识类、法律类等等类别的数据,其中问答类数据基本上占了互联网数据的80%。

这也是为什么人工智能时代的现象级产品是chatgpt的原因,聊天问专家嘛。

将这些内容抓取出来,喂给chatpgt,训练它,使它具备一定的智能。

第二步,由专家级别的人工向chatgpt提问,让chatpgt提供3个最佳答案,再由专家判断其中一个为唯一答案,这是第二步,chatpgt为什么比以前的聊天机器人小度siri更智能?原因在于此。围棋阿尔法狗就是这样训练出来打败世界冠军的。

知道中国的聊天机器人是招什么人在训练吗?招普通的客服,因为它在开发客服机器人嘛,不是专家在训练,所以,这也是中国聊天机器人比较傻的原因之一吧。

第三步,再不断地喂数据给chatpgt,再通过参数与专家对答案进行微调,使之趋向于完善。

当chatpgt有1亿人,甚至更多人在使用它时,等于是在免费帮它训练chatgpt,虽然有偏差,但是总体上来讲,chatgpt会通过参数控制答案的科学性与合理性,它会越来越智能。

那么,如此不断地训练下去,chatpgt就会越来越智能,因为它不像人类,会忘记掉训练的知识,它不会忘记,所以它会越来越强大,越来越智能,最终变成一个全能超人,除了未来,除了创造性思维,它无所不知,无所不能。

比如,它精通世界上所有菜的炒制,如果开发一个机器实体,引进chatpgt作为它的大脑,那么,它就成为世界上最厉害的厨师,没有任何其他厨师比它厉害,因为,所有的炒菜的细节参数与时间温度它都知道,不会有丝毫的失误。

这个现象什么时候到来?第三次工业革命,人工智能时代,它来了,你准备好了吗?

商机可以说是非常多,我在上一篇文章中就列举了3个商机,小科技公司如果拿去用,就可以小团队创业了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
男篮为何 91-81 澳大利亚?赛后郭士强毫不迟疑说出原因,句句在理

男篮为何 91-81 澳大利亚?赛后郭士强毫不迟疑说出原因,句句在理

寒律
2026-06-22 01:34:30
黄金涨破4200美元,国际油价急跌,伊美达成协议文件

黄金涨破4200美元,国际油价急跌,伊美达成协议文件

21世纪经济报道
2026-06-22 10:16:06
足协杯16强定了!中超6队集体过关雪耻,海牛点球惊魂,蓉城泰山狂胜找回场子

足协杯16强定了!中超6队集体过关雪耻,海牛点球惊魂,蓉城泰山狂胜找回场子

林子说事
2026-06-22 10:05:59
俄乌开打之前,乌克兰亚速营为啥瞧不上中国人

俄乌开打之前,乌克兰亚速营为啥瞧不上中国人

贱议你读史
2026-05-18 17:08:39
赛力斯,我又没忍住!63元先干为敬,剩下的交给工资和问界M8了!

赛力斯,我又没忍住!63元先干为敬,剩下的交给工资和问界M8了!

沙雕小琳琳
2026-06-22 11:34:08
21岁土耳其女排新星Duru Türkan,高挑貌美尽显运动员风采

21岁土耳其女排新星Duru Türkan,高挑貌美尽显运动员风采

娱你同欢
2026-06-19 19:32:24
1956年毛主席在怀仁堂看戏,突然询问周恩来:老嫂子同桂荣在哪?

1956年毛主席在怀仁堂看戏,突然询问周恩来:老嫂子同桂荣在哪?

旧史新谭
2026-06-22 10:33:25
世界冠军吴鹏近况:39岁发福明显,迎娶美女主持,创业成功不缺钱

世界冠军吴鹏近况:39岁发福明显,迎娶美女主持,创业成功不缺钱

大西体育
2026-06-22 07:01:47
东南亚人口拐卖最新套路:20万一个人,落地就被卖进园区!

东南亚人口拐卖最新套路:20万一个人,落地就被卖进园区!

命运自认幽默
2026-06-22 01:28:36
向太曝马伊琍已再婚:当年文章过不了心理那关

向太曝马伊琍已再婚:当年文章过不了心理那关

娱乐看阿敞
2025-12-12 15:50:00
井喷,冯小刚《抓特务》首日全天票房2000多万,以小博大!

井喷,冯小刚《抓特务》首日全天票房2000多万,以小博大!

另子维爱读史
2026-06-19 21:26:32
历史要毁于一旦?已经独立百年的蒙古,正在毁掉中国人40年的努力

历史要毁于一旦?已经独立百年的蒙古,正在毁掉中国人40年的努力

小杨侃事
2026-06-22 10:20:43
波兰前总统克瓦希涅夫斯基警告政界人士没有乌克兰人波兰无法生存

波兰前总统克瓦希涅夫斯基警告政界人士没有乌克兰人波兰无法生存

魅力乌克兰
2026-06-22 03:11:33
禁酒令没错,但半夜叫回吹气,到底在防谁?

禁酒令没错,但半夜叫回吹气,到底在防谁?

细说职场
2026-06-21 16:08:10
山西肉铺伤人后续:又杀害两名顾客,3人当场死亡,家属曝隐情

山西肉铺伤人后续:又杀害两名顾客,3人当场死亡,家属曝隐情

离离言几许
2026-06-16 20:59:36
姚明点评男篮10分胜澳洲 点名表扬1人像诺维茨基 20年噩梦终于醒了

姚明点评男篮10分胜澳洲 点名表扬1人像诺维茨基 20年噩梦终于醒了

夕落秋山
2026-06-22 10:44:43
过于性感!国外玩家联名请愿修改《剑星血雨》女主服装

过于性感!国外玩家联名请愿修改《剑星血雨》女主服装

游民星空
2026-06-21 19:06:47
本田圭佑:铃木彩艳身体素质像怪物;他脚下力量太神了

本田圭佑:铃木彩艳身体素质像怪物;他脚下力量太神了

懂球帝
2026-06-21 14:36:05
孙科一辈子没叫过宋庆龄一声妈,却在1949年替她挡了蒋介石一刀

孙科一辈子没叫过宋庆龄一声妈,却在1949年替她挡了蒋介石一刀

近史谈
2026-06-21 15:36:49
中国海军最大软肋:军舰一旦打光导弹,真的只能沦为海上的废铁?

中国海军最大软肋:军舰一旦打光导弹,真的只能沦为海上的废铁?

喜你成疾药石无医
2026-06-21 22:35:00
2026-06-22 12:48:49
托尼富聊GEO incentive-icons
托尼富聊GEO
分享日志
1736文章数 4226关注度
往期回顾 全部

科技要闻

智谱盘中狂飙超40%,市值破万亿港元

头条要闻

37岁男子爱上女主播月赚5千打赏14万 父亲:智商有问题

头条要闻

37岁男子爱上女主播月赚5千打赏14万 父亲:智商有问题

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

韩红帮冯小刚宣传,结果翻车了…

财经要闻

“床垫界的特斯拉”破产了

汽车要闻

全面提升 全新理想L8 livis将家用舒适再进化

态度原创

艺术
时尚
教育
公开课
军事航空

艺术要闻

冷军 人物油画写生8幅

不得不说,“T恤+九分裤”真的很适合夏天,清爽减龄又高级!

教育要闻

代词指代:英语作文连贯性的“隐形杀手”,你真的掌握了吗?

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

东风-17发射状态首次公开 多车齐射场面硬核

无障碍浏览 进入关怀版