网易首页 > 网易号 > 正文 申请入驻

什么是生成式AI

0
分享至

您的关注是对我最大的支持

『 AI每日快讯 欢迎大家转载、引用、分享,让更多人了解AI,学习AI 』

生成式人工智能无处不在。事实上,像OpenAI的ChatGPT这样的生成式AI,它展示了一种似乎由人类编写的生成文本的惊人能力,使得一些头条新闻可能实际上是由它撰写的。

但当人们谈论“生成式AI”时,他们到底指的是什么?

在过去几年的生成式AI热潮之前,当人们谈论AI时,通常是指能够基于数据进行预测的机器学习模型。例如,这些模型通过数百万例子的训练,可以预测某个X射线是否显示出肿瘤的迹象,或者某个借款人是否可能违约。

生成式AI可以被认为是一种被训练来创建新数据的机器学习模型,而不是对特定数据集进行预测。生成式AI系统是一种学会生成类似于其训练数据的更多对象的系统。

麻省理工学院电气工程与计算机科学副教授、计算机科学与人工智能实验室(CSAIL)成员Phillip Isola说:“在生成式AI和其他类型AI的实际机制方面,区别可能有点模糊。通常,同样的算法可用于两者。”

尽管ChatGPT及其同类产品的发布伴随着炒作,但这项技术本身并不是全新的。这些强大的机器学习模型依赖于超过50年的研究和计算进展。

复杂度的提升

生成式AI的一个早期示例是一种更简单的模型,称为马尔可夫链。这项技术以1906年引入这种统计方法来模拟随机过程的俄罗斯数学家安德烈·马尔可夫的名字命名。在机器学习中,马尔可夫模 型长期用于诸如电子邮件程序中的自动完成功能之类的下一个词预测任务。

麻省理工学院电气工程与计算机科学的Thomas Siebel教授、CSAIL和数据、系统与社会研究所(IDSS)成员Tommi Jaakkola说,在文本预测中,马尔可夫模型通过查看前一个单词或几个前面的单词来生成句子中的下一个单词。但由于这些简单模型只能回溯这么远,它们不擅长生成可信的文本。

他解释道:“我们在过去十年之前就在生成东西,但主要区别在于我们可以生成的对象的复杂性,以及我们可以训练这些模型的规模。”

就在几年前,研究人员还倾向于寻找一种机器学习算法,以最佳利用特定数据集。但这种重点已经有所转变,许多研究人员现在使用更大的数据集——可能包含数亿甚至数十亿数据点——来训练能够取得令人印象深刻结果的模型。

作为马尔可夫模型的基础模型,ChatGPT及类似系统的基础模型工作方式大致相同。但一个很大的区别是,ChatGPT的规模远大且更为复杂,拥有数十亿参数。它接受了大量数据的训练——在这种情况下,是互联网上大部分公开可用的文本。

在这庞大的文本语料库中,单词和句子以某些依赖性出现在序列中。这种重复性帮助模型了解如何将文本切割成具有一定可预测性的统计块。它学习这些文本块的模式,并使用这些知识来提出接下来可能出现的内容。

更强大的架构

虽然更大的数据集是引发生成式AI热潮的一个催化剂,但多项重大研究进展也导致了更复杂的深度学习架构的发展。

2014年,蒙特利尔大学的研究人员提出了一种名为生成对抗网络(GAN)的机器学习架构。GAN使用两个模型协同工作:一个学习生成目标输出(如图像),另一个学习区分真实数据和生成器输出。生成器试图欺骗鉴别器,并在此过程中学会制作更逼真的输出。图像生成器StyleGAN基于这些类型的模型。

斯坦福大学和加州大学伯克利分校的研究人员在一年后引入了扩散模型。通过迭代地完善它们的输出,这些模型学会生成类似于训练数据集中样本的新数据样本,并已被用于创建逼真的图像。文本到图像生成系统Stable Diffusion的核心就是扩散模型。

2017年,谷歌的研究人员引入了变压器架构,用于开发大型语言模型,如ChatGPT的动力。在自然语言处理中,变压器将文本语料库中的每个单词编码为一个标记,然后生成一个注意力图,该图捕获每个标记与所有其他标记的关系。这个注意力图帮助变压器在生成新文本时理解上下文。

这些只是用于生成式AI的众多方法中的几种。

应用范围

所有这些方法的共同点是,它们将输入转换为一组标记,这些标记是数据块的数值表示。只要你的数据可以转换成这种标准的标记格式,那么理论上,你可以应用这些方法来生成看起来类似的新数据。

Isola说:“你的成效可能会有所不同,这取决于你的数据有多嘈杂以及提取信号的难度,但它确实越来越接近通用CPU可以接收任何类型的数据并以统一的方式开始处理的方式。”

这为生成式AI打开了一个巨大的应用阵列。

例如,Isola的小组正在使用生成式AI创建合成图像数据,这些数据可以用于训练另一个智能系统,例如教授计算机视觉模型如何识别对象。

Jaakkola的小组正在使用生成式AI设计新颖的蛋白质结构或指定新材料的有效晶体结构。就像生成模型学习语言的依赖性一样,如果向它展示晶体结构,它可以学习使结构稳定和实现的关系。

但是,尽管生成模型可以取得令人难以置信的结果,它们并不是所有类型数据的最佳选择。麻省理工学院电气工程与计算机科学教授、信息和决策系统实验室成员Devavrat Shah指出,对于涉及对结构化数据(如电子表格中的数据)进行预测的任务,传统的机器学习方法往往比生成人工智能模型表现更佳。

他说:“在我看来,它们最大的价值是成为一个非常好的、对人类友好的机器接口。以前,人们必须用机器语言与机器交流以完成任务。现在,这个接口已经学会了如何同时与人类和机器沟通。”

提出风险

生成人工智能聊天机器人现在被用于呼叫中心处理人类客户的问题,但这一应用强调了实施这些模型的一个潜在风险 —— 工人被取代。

此外,生成人工智能可能会继承并扩散训练数据中存在的偏见,或放大仇恨言论和虚假陈述。这些模型具有剽窃的能力,可以生成看似由特定人类创作者制作的内容,引发潜在的版权问题。

另一方面,Shah提出,生成人工智能可以赋予艺术家权力,他们可以使用生成工具帮助他们制作他们可能无法自己生产的创意内容。

他预见,在未来,生成人工智能将改变许多学科的经济学。

麻省理工学院电子工程与计算机科学副教授、计算机科学与人工智能实验室成员Phillip Isola看到生成人工智能的一个有前途的未来方向是其在制造方面的应用。他提到,与其让模型制作一张椅子的图像,不如生成一张可以生产的椅子的计划。

他还看到生成人工智能系统在开发更普遍智能的人工智能代理中的未来用途。

他说:“这些模型的工作方式与我们认为人类大脑的工作方式之间存在差异,但我认为也有相似之处。我们能够在头脑中思考和梦想,提出有趣的想法或计划,我认为生成人工智能是将使代理能够做到这一点的工具之一。”

关注我,每天领取AI领域最新大事

设置⭐️标不迷路

转发朋友圈为您朋友播报每日AI大事

进交流群请扫下面码







您的关注是对我最大的支持

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
吃完香椿炒鸡蛋后,男子多器官衰竭!这起悲剧,给所有人敲响警钟

吃完香椿炒鸡蛋后,男子多器官衰竭!这起悲剧,给所有人敲响警钟

DrX说
2026-03-20 14:00:07
身段最好的就是她,可惜整垮了一点

身段最好的就是她,可惜整垮了一点

贵圈真乱
2026-03-23 10:30:00
马筱梅给儿子开通账号,承诺未来会保护好大S女儿,做合格的妈妈

马筱梅给儿子开通账号,承诺未来会保护好大S女儿,做合格的妈妈

素素娱乐
2026-03-23 09:43:31
随着塔猜亚夺冠,巡回锦标赛12人对阵出炉!赵心童8强对手确定了

随着塔猜亚夺冠,巡回锦标赛12人对阵出炉!赵心童8强对手确定了

球场没跑道
2026-03-23 08:22:38
神经科学家:每天走同一条路,可能比环球旅行更让大脑感到满足

神经科学家:每天走同一条路,可能比环球旅行更让大脑感到满足

明天见灌装冰块
2026-03-22 00:51:04
遭北京15分逆转!辽宁将用掉最后换外援名额 签内线替换布罗金顿

遭北京15分逆转!辽宁将用掉最后换外援名额 签内线替换布罗金顿

醉卧浮生
2026-03-23 10:54:47
广州偶遇张馨予一家三口出游,和老公何捷带娃骑行划船,画面有爱

广州偶遇张馨予一家三口出游,和老公何捷带娃骑行划船,画面有爱

情感大头说说
2026-03-23 16:06:01
宇树王兴兴年薪曝光!网友破防了!

宇树王兴兴年薪曝光!网友破防了!

广告案例精选
2026-03-23 08:43:11
特斯拉和比亚迪的差距是多少?老驾驶员:上了高速你就懂了

特斯拉和比亚迪的差距是多少?老驾驶员:上了高速你就懂了

阿尢说历史
2026-03-22 18:51:06
西红柿立大功!中国科学家研究发现:补充3个月,减轻大脑衰老

西红柿立大功!中国科学家研究发现:补充3个月,减轻大脑衰老

思思夜话
2026-03-22 11:07:04
特朗普:台湾属于中国,武统是中方的自由,但一动手美国会不高兴

特朗普:台湾属于中国,武统是中方的自由,但一动手美国会不高兴

共工之锚
2026-03-22 00:48:09
“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

“老人味”的祸首被揪出!医生提醒:55岁后要少碰,老了或也没味

今日养生之道
2026-03-23 11:46:39
泪奔!21年了,终于赢了,北岸花园真是地狱难度啊

泪奔!21年了,终于赢了,北岸花园真是地狱难度啊

体育新角度
2026-03-23 16:12:14
98岁的田华也没想到,风光一辈子老了住旧房子,孙子成了晚年依靠

98岁的田华也没想到,风光一辈子老了住旧房子,孙子成了晚年依靠

白面书誏
2026-03-22 14:32:46
特朗普:台湾属于中国,中方武统是自由,但一动手美国会不高兴

特朗普:台湾属于中国,中方武统是自由,但一动手美国会不高兴

纪中百大事
2026-03-23 09:57:51
以色列要让全世界禁声?斩首俄罗斯记者,普京下令,撞枪口上了

以色列要让全世界禁声?斩首俄罗斯记者,普京下令,撞枪口上了

防卫狙击手
2026-03-23 10:08:17
专机抵达东京!高市早苗收到好消息,她深知:中方不会轻饶她

专机抵达东京!高市早苗收到好消息,她深知:中方不会轻饶她

匹夫来搞笑
2026-03-23 15:45:38
“最强地级市”市长,拟任新职

“最强地级市”市长,拟任新职

上观新闻
2026-03-23 13:46:13
11场轰入10球!皇马1.5亿巨星爆发,率队踢爆曼城,掀翻马竞

11场轰入10球!皇马1.5亿巨星爆发,率队踢爆曼城,掀翻马竞

足球狗说
2026-03-23 06:33:38
以色列专打伊朗“镇压机器”,为巴列维王储势力铺路

以色列专打伊朗“镇压机器”,为巴列维王储势力铺路

老马拉车莫少装
2026-03-01 21:19:35
2026-03-23 16:59:00
AI最新追踪 incentive-icons
AI最新追踪
专注于AI相关的最新动态,关注我,随时掌握AI最新消息
155文章数 22关注度
往期回顾 全部

科技要闻

裁掉2万多名员工后,扎克伯格对自己下手了

头条要闻

特朗普向伊朗发出48小时"最后通牒" 中方表态

头条要闻

特朗普向伊朗发出48小时"最后通牒" 中方表态

体育要闻

不敢放手一搏,你拿什么去争冠?

娱乐要闻

刘烨47岁生日,安娜晒全家福为其庆生

财经要闻

沪指险守3800点 全市场超百股跌停

汽车要闻

"拒绝"豪车税 新款Panamera尽享版99.8万元起精准入局

态度原创

教育
时尚
亲子
艺术
军事航空

教育要闻

《暑期实习怎么找?3个方法提高成功率》

“这条裙子”才是今年春天的顶流,怎么搭都好看

亲子要闻

有娃之后才开窍,分享一波宝妈的“生活智慧”,省时又省力

艺术要闻

如此美妙的光影,安静而温暖,真令人折服!

军事要闻

伊朗回应美方威胁:将在战场上坚决对抗

无障碍浏览 进入关怀版