网易首页 > 网易号 > 正文 申请入驻

手把手教你在微软云-Azure搭建私有chatGPT

0
分享至

背景
开源模型大多是基于大厂预训练模型演变而来,即使是推理效果最好的Vicuna也是才能达到90分(以chatGPT答案作为100分),其他开源模型推理效果与chatGPT相比,更是相形见绌。同时开源模型的单机部署和维护也是一项非常繁重的工作,GPU服务器需要安装驱动和各种依赖包,解决包冲突会让人痛不欲生(经历过才会懂)。那么有没有办法既能享受chatGPT的推理效果,同时又不用自己手动去进行单机环境部署,还能进行模型fine-tuning,训练自己特定领域内的模型呢?答案是肯定的,微软云-Azure就提供了这样的服务(感觉天一下子就亮了有木有)。Azure提供了openAI服务,我们可以在Azure上完成一键部署GPT3.5(chatGPT模型底座)模型(GPT4模型也可以申请使用,但需要填写使用申请单,默认不开放),同时支持上传训练数据,对部署的模型进行fine-tuning,让模型获取特定领域的知识,这样我们就可以在Azure上得到了一个推理效果堪比chatGPT,同时又有特定领域知识的私有chatGPT模型了(是不是迫不及待了,那我们现在就开始部署私有chatGPT模型之旅吧)。" Type="normal"SectionTitle="操作步骤" Type="normal"SectionTitle="原生模型部署及使用" Type="normal"@@首先我们先访问Azure的域名: https://azure.microsoft.com/zh-cn/ ,有时候加载会有点慢,需要耐心等待一下,打开之后右上角有个“登录”按钮,如果没有Azure账号的话需要先注册一下(这里略过注册步骤)。

注册完之后,我们登录,默认弹出的订阅信息是我们账户的余额信息(时刻提醒我们需要充值了!!! Azure上所有服务都是收费的,有钱就是好!!!),默认显示的是日元,可能是服务器在日本的原因吧。

然后我们选择“更多服务”,就会显示所有提供的服务了,这里面我们选择“Azure openAI”。

我们就进入到openAI的实际操作页面了。

默认显示的“azure-openai-whq”是我之前创建资源名称,点击资源名称,可以进入到资源详情页面。

其中比较重要的两项是“资源组名称”和“终结点”,由于Azure提供很多机器学习的模型和服务,资源组相当于是一个命名空间,方便资源和服务的管理。“终结点”是我们后续模型部署成功后,通过api访问Azure接口时的域名,它的组成是https://{自定义域名}+openai.azure.com,如我的自定义域名是“azure-open-whq”,那么终结点就是“ https://azure-open-whq.openai.azure.com ”。

点击左侧导航树的“模型部署”,然后再点击加载页面的“管理部署”,就可以看到我们之前部署的模型了。

当然这里我们也可以新建部署,也就是新建一个模型,这里会列出所有我们能够创建的模型,gpt-35-turbo就是chatGPT的底座模型,它的功能是最全的。还有细分的其他模型,如text-ada-011模型,进行文本信息处理的ada模型,这里ada是代号,同理还有babbage,curie和davinci,他们都是进行文本处理的,这里模型推理效果从ada到davinci越来越好,即ada

然后点击“在操场中打开”或者左侧导航树的“聊天”,就可以进入到与GPT对话的页面了。

进入到聊天页面,可以对之前部署过的模型进行选择,但只有聊天功能效果好的模型才会显示在备选列表中,比如ada模型比较适合分类,聊天效果可能并不太好,就没有在备选列表中显示,而gpt3.5-turbo模型是显示在备选列表中的,在会话区我们就可以正常的GPT模型进行会话交流了,到目前位置我们所有操作都是基于web的(是不是很简单呐)。

现在是通过页面与机器人进行交流的,那么能不能通过代码以接口调用的方式,与机器人进行对话呢?答案是肯定的,Azure提供了资源的访问密钥,在资源页面,默认会生成两个密钥,任何一个都是可以使用的,提供两个密钥的原因是可以进行无感升级,同时也可以随时重新生成密钥。

我们现在利用生成的密钥,测试一下在本地通过接口调用的方式访问Azure的openAI服务。python的代码如下,这里选择的执行引擎是ada引擎,解决的是一个分类问题。

提示词如下:

#首先提示模型需要做什么,它需要做的是根据headline中的文字描述,将内容进行分类,分类的结果是商业、技术、整治、运动和娱乐

Classify the following news headline into 1 of the following categories: Business, Tech, Politics, Sport, Entertainment

#根据headline1的描述,输出的category是娱乐,这个是给模型的提示

#headline1的翻译:唐娜·史蒂芬森 (Donna Steffensen) 正在烹饪一种新的完美菜肴。互联网上最受欢迎的烹饪大师有一本热门新书和全新视角

Headline 1: Donna Steffensen Is Cooking Up a New Kind of Perfection. The Internet's most beloved cooking guru has a buzzy new book and a fresh new perspective

Category: Entertainment

#当我们给模型输入headline2的时候,让模型推理category是什么?

#headline2的翻译:大型零售商宣布计划关闭 100 多家商店

Headline 2: Major Retailer Announces Plans to Close Over 100 Stores

Category:

我们现在执行python代码,卡看headline2的category的输出是不是与实际内容相符。

显然headline2的描述是business相关的,模型输出的结果也是Business,符合预期,模型是能够根据提示,对描述信息进行正确的分类。

" Type="normal"SectionTitle="模型fine-tuning" Type="normal"@@我们在使用一个模型的时候,如果想使模型的推理效果好,有时候需要进行示例学习(也就是少样本学习,常说的few-shot),也就是让模型模仿我们的操作进行推理,这样做的好处是使模型的推理更加精准,但由于模型使用是按token进行收费的,如果每次使用模型推理都输入示例成本会更高。另外示例学习也不能让模型具有一个全局视角去学习特定领域知识,效果也不如fine-tuning好,示例学习和fine-tuning效果对比如下。

所以如果想长期使用模型进行推理,fine-tuning是个更好的选择。Azure也提供了对原生模型进行fine-tuning的功能,下面我们就来一步一步开始训练属于我们自己的模型。首先我们可以先看一下Azure给的报价单,模型fine-tuning,托管和使用都是需要收费的,同样推理效果越好的模型收费标准也就越高。

首先我们准备需要进行训练的数据,训练数据的格式必须是jsonl的,也就是每行是一个json串,openai提供了生成jsonl的工具,用法为:

openai tools fine_tunes.prepare_data -f

其中 ,支持CSV、TSV、XLSX、JSON 和 JSONL格式,只要文件中的数据格式是包含 prompt 和 completion 列或关键字就行。

然后我们选择“Data files”将我们生成的文件上传到Azure云端。

选择“上传新的数据集”,直接拖动就可以传到云端,这里面我上传了两个数据集,一个是训练数据集traning.jsonl,一个是验证数据集validation.jsonl,上传后会生成两个文件的ID,这个ID后续会用到,我们在进行模型训练的时候,需要在脚本中指定文件的ID,这样就可以在Azure云端找到这个文件作为模型的输入。

由于我们的目标是跑通整个链路,所以这块训练数据集没有很大,就有3条数据。

编写进行模型训练的脚本(Azure上不提供模型训练的页面操作,这块需要自己写脚本),具体内容如下,这里需要提供我们的资源key,也就是访问的鉴权key,还有进行模型训练用到的file ID,还有一些模型训练的超参数(超参数的设定需要根据具体的数据集,模型以及经验进行设定,这里不赘述)。

如果能够生成具体的job id信息,就说明训练的job启动成功了。

模型训练的过程中,我们可以在页面上看到执行状态(“正在运行”,“异常”或者“已成功”等)。

训练如果顺利,正常结束的话,会生成训练报告,包含训练时长,账单等详细的信息。

我们看到自定义模型已经是部署成功的状态了。

那么我们看看训练之后的模型效果如何吧。很遗憾,结果并不是我们想要的训练数据里的“coffee”,而是“Human,Tells”,很有职业范,哈哈。原因也很简单,我们的训练数据太少了,而且场景太通用,所以最终得到的答案比较随机了。

那么需要多少样本才能使模型的推理效果达到我们的预期呢,通常情况下至少需要几百到上千条的样本才能使模型具备特定领域的认知,当然样本越多训练的效果也就越好,在微软云Azure上训练模型收费也是不低的,如果模型更新频次不高,我们可以一劳永逸一次准备尽量多的样本,也可以少量多次不断对模型进行迭代训练,这个可根据实际情况进行选择,如下是训练样本多少与模型推理准确率之间的关系,可供参考(来源于网络)。

2.大模型在特定场景落地:寻找大模型与现有业务结合点,将简单重复的工作交给大模型进行处理,降本增效;

3.评估模型推理效果:寻找更多评估模型和提升模型效果的方法,不断优化模型的推理准确率;

4.择优选取模型:测试从ada到davinci模型的优劣势,针对特定场景择优选取模型进行使用;

5.prompt工程探索:提示词的好坏,也可能最终决定模型推理结果的好坏,针对如何进行提示词优化后续也需要进行不断探索和总结。

" Type="normal"@@-->

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
北京一家七口集体失联,亲戚爬窗查看,一眼魂飞天外

北京一家七口集体失联,亲戚爬窗查看,一眼魂飞天外

世异时移
2024-05-23 05:16:39
带女儿进组?董璇女儿演《墨雨云间》,五官明艳,气质不输杨超越

带女儿进组?董璇女儿演《墨雨云间》,五官明艳,气质不输杨超越

喵喵娱乐团
2024-06-03 21:45:48
空姐接“私活”遇猛男,连强奸她八小时,被男子逼得报警自保

空姐接“私活”遇猛男,连强奸她八小时,被男子逼得报警自保

史二了
2023-12-31 18:52:00
董军划下红线,晚宴座位变了,奥斯汀对华作出保证,美方避免冲突

董军划下红线,晚宴座位变了,奥斯汀对华作出保证,美方避免冲突

说天说地说实事
2024-06-02 20:47:30
权威机构测试Model Y是首个车内致敏物风险单项满分的车型!

权威机构测试Model Y是首个车内致敏物风险单项满分的车型!

特空间
2024-06-03 13:42:19
泰媒:泰国足协主席安排泰国队来华住五星级酒店,并配备泰国厨师

泰媒:泰国足协主席安排泰国队来华住五星级酒店,并配备泰国厨师

直播吧
2024-06-03 13:08:49
沙俄仅用50多年,让我国领土损失300多万平方公里,失地比印度面积还大

沙俄仅用50多年,让我国领土损失300多万平方公里,失地比印度面积还大

黎庶文史
2024-04-15 23:30:10
颜值美女黑丝正装性感内衣纯欲风写真,曼妙身姿,热辣时尚,

颜值美女黑丝正装性感内衣纯欲风写真,曼妙身姿,热辣时尚,

白宸侃片
2024-06-03 12:03:55
为什么感觉广州越来越萧条了呢?网友的分享真实又扎心!

为什么感觉广州越来越萧条了呢?网友的分享真实又扎心!

大叔电吹管
2024-06-03 00:44:45
中国女排奥运门票分析:3-0保加利亚德国稳拿 两竞争者赛程难度大

中国女排奥运门票分析:3-0保加利亚德国稳拿 两竞争者赛程难度大

颜小白的篮球梦
2024-06-03 12:21:43
洋钱罐频繁骚扰网贷紧急联系人 律师认为此举涉违法违规

洋钱罐频繁骚扰网贷紧急联系人 律师认为此举涉违法违规

信网
2024-06-03 16:44:05
邓文迪参加前夫的第五次婚礼,穿碎花裙很漂亮,是新娘的好朋友

邓文迪参加前夫的第五次婚礼,穿碎花裙很漂亮,是新娘的好朋友

小书生吃瓜
2024-06-03 17:56:02
乌克兰哈尔科夫反击大获成功,俄罗斯军队吐出一大块嘴边肥肉

乌克兰哈尔科夫反击大获成功,俄罗斯军队吐出一大块嘴边肥肉

亡海中的彼岸花
2024-06-03 15:55:07
西媒:姆巴佩预计在皇马担任中锋,但更具自由度&会和维尼修斯换位

西媒:姆巴佩预计在皇马担任中锋,但更具自由度&会和维尼修斯换位

直播吧
2024-06-03 23:25:09
与会解放军代表:中美防长“香会”演讲最大区别,在格局

与会解放军代表:中美防长“香会”演讲最大区别,在格局

直新闻
2024-06-02 23:01:38
存量房贷利率不降?深圳业主决定“自救”!

存量房贷利率不降?深圳业主决定“自救”!

深圳买房计划
2024-06-03 22:11:35
2024年全球最具有价值的13家公司!

2024年全球最具有价值的13家公司!

妖妖浅谈
2024-05-21 16:02:28
报复来得太快!北约给乌克兰“松绑”之际,俄军导弹飞向基辅

报复来得太快!北约给乌克兰“松绑”之际,俄军导弹飞向基辅

环球调查局
2024-06-01 19:11:22
江西男子被“托梦”告知地下有宝藏,深挖7米后,被眼前一幕震撼

江西男子被“托梦”告知地下有宝藏,深挖7米后,被眼前一幕震撼

青丝人生
2024-01-29 17:59:05
北大吴谢宇弑母通灵记录:通灵人自曝与其交流,得知弑母真实动机

北大吴谢宇弑母通灵记录:通灵人自曝与其交流,得知弑母真实动机

古今档案
2024-05-29 18:42:08
2024-06-04 00:54:44
格物时间
格物时间
效率工具,App评测
22文章数 627关注度
往期回顾 全部

科技要闻

特斯拉回应单踏板模式可能被禁止:暂无影响

头条要闻

中方被指在中俄天然气项目提不合理诉求 外交部回应

头条要闻

中方被指在中俄天然气项目提不合理诉求 外交部回应

体育要闻

休假期运作展望<射手篇>

娱乐要闻

混战升级!编剧赵冬苓力挺王阳遭围攻

财经要闻

接班100天,宗馥莉急了

汽车要闻

搭载华为HiCAR 传祺M6 MAX售14.58万元

态度原创

艺术
本地
时尚
公开课
军事航空

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

本地新闻

食味印象|歙县限定!枇杷味儿的清甜初夏

今年流行“五五分”穿法,太时髦了!

公开课

近视只是视力差?小心并发症

军事要闻

泽连斯基称俄武器来自中国 外交部回应

无障碍浏览 进入关怀版