网易首页 > 网易号 > 正文 申请入驻

ChatGPT 火了,一大批开源平替也来了

0
分享至

ChatGPT 凭一己之力让全球为 AI 沸腾,引发了科技巨头之间的聊天机器人军备竞赛。

众所周知,ChatGPT 的背后技术是 GPT(Generative Pre-trained Transformer)模型。GPT 是一种基于 Transformer 模型的自然语言处理模型,由 OpenAI 公司开发。它可以通过学习大量的自然语言数据来生成自然流畅的文本,例如文章、对话等。

2019 年 11 月,OpenAI 开源了 GPT-2 语言模型的完整版本(有 15 亿个参数)。GPT-2 是作为 OpenAI 2018 年 GPT 模型的 "直接扩展" 而创建的,其参数和训练数据集的大小都增加了 10 倍。

在 GPT-2 之后,OpenAI 又推出了 1750 亿个参数的 GPT-3,只是其源代码从未被公开。OpenAI 认为 GPT-3 可能被滥用,因此不应开源。包括后来的 GPT-3.5、GPT-4 都没有开源。目前,公开免费版 ChatGPT 仍然基于 GPT-3.5,不过按月订阅 “ChatGPT Plus” 的用户能够试用由 GPT-4 提供支持的更新版本的 ChatGPT。

尽管 ChatGPT 没有开源,但趁着这波热度,还是有不少类似的开源项目出现,GitHub 已经有人做个了替代 ChatGPT 的开源项目列表。

lucidrains/PaLM-rlhf-pytorch

这是一个类似于 ChatGPT 的模型,但使用的是 PaLM 架构。在 PaLM 架构之上实现了 RLHF(人类反馈强化学习)。

注:只有源代码,没有数据,没有模型权重,没有聊天系统。

togethercomputer/OpenChatKit

OpenChatKit 提供了一个强大的开源基础,可以为各种应用程序创建专用和通用聊天机器人。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

oobabooga/text-generation-webui

它是一个用于运行 GPT-J 6B、OPT、GALACTICA、LLaMA 和 Pygmalion 等大型语言模型的 gradio web UI。其目标是成为文本生成领域的AUTOMATIC1111/stable-diffusion-webui。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

KoboldAI/KoboldAI-Client

这是一个基于浏览器的前端,用于使用多个本地和远程 AI 模型进行 AI 辅助写作。它提供一系列标准工具,包括内存、作者笔记、世界信息、保存和加载、可调整的 AI 设置、格式化选项,以及导入现有 AI Dungeon 冒险的能力。您还可以打开冒险模式并像 AI Dungeon Unleashed 一样玩游戏。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

LAION-AI/Open-Assistant

OpenAssistant 是一个基于聊天的助手,可以理解任务,可以与第三方系统交互,并为此动态检索信息。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

tatsu-lab/stanford_alpaca

这是 Stanford Alpaca 项目的 repo,该项目旨在构建和共享指令遵循的 LLaMA 模型。

注:半开源、非真正开源、基于封闭模型等...

BlinkDL/ChatRWKV

ChatRWKV 类似于 ChatGPT,但由 RWKV(100% RNN)语言模型提供支持,并且是开源的。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

THUDM/ChatGLM-6B

ChatGLM-6B 是一个基于通用语言模型(GLM)框架的开放式双语语言模型,拥有 62 亿个参数。借助量化技术,用户可以在消费级显卡上进行本地部署(INT4 量化级别仅需 6GB GPU 显存)。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

bigscience-workshop/xmtf

此存储库概述了用于创建 BLOOMZ & mT0 和 xP3 的所有组件,这些组件在通过多任务微调进行跨语言泛化一文中介绍。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

carperai/trlx

这是一个用于通过人类反馈(RLHF)进行语言模型分布式训练的代码库,用于微调 GPT 模型以生成聊天文本的工具,支持在线 RL 训练多达 20 亿个参数的模型,以及离线 RL 训练更大的模型。

注:只有源代码,没有数据,没有模型权重,没有聊天系统。

databrickslabs/dolly

该模型基于 pythia-12b 进行训练,使用了约 15,000 条指令 / 响应微调记录,这些记录是由 Databricks 员工在 InstructGPT 论文的能力领域中生成的 databricks-dolly-15k。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

LianjiaTech/BELLE

本项目的目标是推动中文大型会话模型开源社区的发展。该项目在原有的 Stanford Alpaca 基础上优化了中文性能。模型微调仅使用通过 ChatGPT 生成的数据(没有其他数据)。此 repo 包含 175 个用于生成数据的中文种子任务、用于生成数据的代码、用于微调模型的 0.5M 生成数据等等。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

ethanyanjiali/minChatGPT

这个示例演示了如何使用 RLHF 技术对齐语言模型,使其能够生成类似于 ChatGPT 的聊天文本。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

cerebras/Cerebras-GPT

7 个开源 GPT-3 样式模型,参数范围从 1.11 亿到 130 亿,使用 Chinchilla 公式 训练。模型权重已在宽松许可下发布(特别是 Apache 2.0 许可)。

注:有数据,有模型权重,通过 API 可以实现基础的聊天功能。

TavernAI/TavernAI

一款主题风格是冒险和探险的聊天机器人,默认 AI 语言模型是 Pygmalion,还包括其他语言模型,比如 KoboldAI、ChatGPT、GPT-4 等。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

Cohee1207/SillyTavern

SillyTavern 是 TavernAI 1.2.8 的一个分支,目前正在积极开发中,并添加了许多主要功能。现在,它们可以被视为完全独立的程序。Tavern 是一个用户界面,它需要与一个 AI 系统后端配合使用,才能发挥作用。有多种支持的后端可供选择,包括 OpenAPI API(GPT)、KoboldAI(可以在本地运行或在 Google Colab 上运行)等。

注:有完整数据,有模型权重,包括 TUI 和 GUI 的精致聊天系统。

ChatGPT 这阵风刮得这么猛,GOTC 2023 怎会错过?

5 月 27 日至 28 日,GOTC 2023 将在上海召开,AIGC (AI Generated Content,AI 生成内容) 将成为本次大会的重头戏。尤其是在 “AI is Everywhere” 分论坛上,诸多 AI 专家将深入探讨 AIGC 背后的技术。

全球开源技术峰会(Global Open-source Technology Conference),简称 GOTC,是由开放原子开源基金会、 Linux 基金会亚太区、上海浦东软件园和开源中国联合发起的,面向全球开发者的一场盛大开源技术盛宴。 5 月 27 日至 28 日,GOTC 2023 将于上海举办为期 2 天的开源行业盛会。大会将以行业展览、主题发言、特别论坛、分论坛的形式展现,与会者将一起探讨元宇宙、3D 与游戏、eBPF、Web3.0、区块链等热门技术主题,以及开源社区、AIGC、汽车软件、开源商业化、开源教育培训、云原生等热门话题,探讨开源未来,助力开源发展。

GOTC 2023报名通道现已开启,诚邀全球各技术领域开源爱好者共襄盛举!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“隐形支出”太可怕了!多少家庭深陷其中不自知,难怪攒不下钱

“隐形支出”太可怕了!多少家庭深陷其中不自知,难怪攒不下钱

抠搜侠
2025-09-13 16:21:27
东条英机的结局:在绞架上硬挺12分钟,尿流满地,骨灰丢入太平洋

东条英机的结局:在绞架上硬挺12分钟,尿流满地,骨灰丢入太平洋

凡人侃史
2025-09-02 11:00:50
孙立人高龄去世,棺椁35年未下葬,儿子参加九三阅兵后提出要迁葬

孙立人高龄去世,棺椁35年未下葬,儿子参加九三阅兵后提出要迁葬

小莜读史
2025-09-11 13:31:20
马德里会谈生变,中国或退出中美谈判?美国等来中方冰冷的质问

马德里会谈生变,中国或退出中美谈判?美国等来中方冰冷的质问

时时有聊
2025-09-14 05:53:27
大量日系“电视棒”流入闲鱼,跟打火机一样小,预装安卓系统

大量日系“电视棒”流入闲鱼,跟打火机一样小,预装安卓系统

科技拌饭
2025-09-08 19:21:46
42.5亿!华裔夫妇入局!开拓者正式出售!

42.5亿!华裔夫妇入局!开拓者正式出售!

柚子说球
2025-09-13 12:14:42
仅捞到1只!海南海鲜市场被买走,网友尝了一口:差点被送走

仅捞到1只!海南海鲜市场被买走,网友尝了一口:差点被送走

万象硬核本尊
2025-09-13 20:25:46
朱雨玲:澳门赛期间接连遭遇人身骚扰,已提起民事侵权诉讼

朱雨玲:澳门赛期间接连遭遇人身骚扰,已提起民事侵权诉讼

懂球帝
2025-09-14 09:02:03
梅西生涯已31次罚丢点球,点球命中率比C罗低6%

梅西生涯已31次罚丢点球,点球命中率比C罗低6%

雷速体育
2025-09-14 15:28:23
人生3大天规,违背必遭恶报!很多人因不懂栽了跟头

人生3大天规,违背必遭恶报!很多人因不懂栽了跟头

金沛的国学笔记
2025-09-14 12:30:00
西贝硬刚罗永浩,卫健委出手了!

西贝硬刚罗永浩,卫健委出手了!

梳子姐
2025-09-13 19:16:39
脸没恢复就先不要出来演戏了,面部僵硬和馒化,看得观众好难受

脸没恢复就先不要出来演戏了,面部僵硬和馒化,看得观众好难受

上官晚安
2025-08-16 10:43:39
3.5米长剧毒眼镜王蛇闯入村民家中,吓得老两口一夜未眠,多方合力抓捕

3.5米长剧毒眼镜王蛇闯入村民家中,吓得老两口一夜未眠,多方合力抓捕

红星新闻
2025-09-14 12:59:34
“几乎没人”!西贝客流断崖式减少,门店负责人:羊肉每年一次集采冷冻发往全国,我们不可能天天杀羊

“几乎没人”!西贝客流断崖式减少,门店负责人:羊肉每年一次集采冷冻发往全国,我们不可能天天杀羊

隐于山海
2025-09-14 10:35:02
“陪睡上位,知三当三,风流成性”,宋佳的私生活传闻有多离谱

“陪睡上位,知三当三,风流成性”,宋佳的私生活传闻有多离谱

山河月明史
2025-09-13 16:06:28
哈工大博士被砸死,是家中独子,刚入职两月,涉事企业一直沉默

哈工大博士被砸死,是家中独子,刚入职两月,涉事企业一直沉默

纪中百大事
2025-09-12 07:27:45
全面进攻倒计时!以色列总理发出紧急撤离令,50座高楼被毁是开始

全面进攻倒计时!以色列总理发出紧急撤离令,50座高楼被毁是开始

起喜电影
2025-09-13 07:42:19
女优小凑四叶竟演这种作品?丈夫还是结城结弦!

女优小凑四叶竟演这种作品?丈夫还是结城结弦!

葫芦哥爱吐槽
2025-09-14 12:51:00
“他们逼我说台湾是中国的,不然就不救我!”一石激起千层浪

“他们逼我说台湾是中国的,不然就不救我!”一石激起千层浪

壹知眠羊
2025-08-10 07:29:29
北电78明星班聚会,张丰毅一身腱子肉显年轻,方舒缺席,2人去世

北电78明星班聚会,张丰毅一身腱子肉显年轻,方舒缺席,2人去世

喜欢历史的阿繁
2025-09-13 00:03:26
2025-09-14 16:11:00
瓴麟科技
瓴麟科技
全媒体智库平台
485文章数 30关注度
往期回顾 全部

科技要闻

L3级车型要来了!辅助驾驶迎重大利好

头条要闻

十余架无人机进入波兰领空后 北约多国宣布:出动战机

头条要闻

十余架无人机进入波兰领空后 北约多国宣布:出动战机

体育要闻

3次遭争议判罚!皇马向FIFA投诉西甲裁判

娱乐要闻

彪悍那英,大女人与旧妻子

财经要闻

西贝贾国龙,“错”得离谱

汽车要闻

混动狂潮 835马力V12 阿斯顿·马丁的最后浪漫

态度原创

艺术
亲子
时尚
公开课
军事航空

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

亲子要闻

杰森找了个中餐厅,结果菜品味道一言难尽,安吉拉总结真到位!

衣服“买精不买多”,日常准备这几款单品,简单舒适又大方

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄无人机飞入波兰 美国务卿:不可接受

无障碍浏览 进入关怀版