网易首页 > 网易号 > 正文 申请入驻

首个中文版ChatGPT来了:大模型的中国元“Yuan”

0
分享至

延伸阅读机器之心发布

机器之心编辑部

元语智能的功能型对话大模型 ChatYuan「既泛又专」,除了问答、上下文对话以及创意性写作等各类自然语言理解和生成任务之外,还能回答法律、医疗等专业领域的问答,并且写代码功能也已经在内测中,不久即将发布。特别提醒,本文中有部分文本由「ChatYuan」生成,请君细心分辨。

ChatGPT 到底有多火?它已成为史上最快传播的应用,发布两个月后就有了1亿用户。实现同样的用户量,TikTok 需要近九个月,而 Instagram 用了两年多。

未来几年,微软将继续增加投资 ChatGPT 背后的公司 OpenAI 100亿美金,而 Google 也于近日投资了另外一个同类公司 Anthropic 将近4亿美金,在硅谷科技圈和资本市场成为了2023年最令人兴奋的科技进展。微软联合创始人比尔盖茨判断,ChatGPT 的历史意义重大,不亚于 PC 或互联网诞生。

国内在这次 AI 变革的浪潮中同样反应热烈,其中就有国内通用人工智能初创公司元语智能,推出国内首个基于大模型的功能型对话产品 ChatYuan

ChatYuan 产品样例

PromptCLUE 全中文任务零样本学习模型

在正式介绍元语智能的功能型对话大模型 ChatYuan 之前,我们先了解一下大规模多任务 Prompt 预训练中文开源模型——PromptCLUE,它实现了中文上的三大统一:统一模型框架、统一任务形式和统一应用方式

PromptCLUE 在千亿中文 token 上大规模预训练,累计学习1.5万亿中文 token,在亿级中文任务数据上完成训练,并训练数百种任务集。它具有更好的理解、生成和抽取能力,并且支持文本改写、纠错、知识图谱问答等。

PromptCLUE 支持几十个不同类型的任务,具有较好的零样本学习能力和少样本学习能力。针对理解类任务,如分类、情感分析、抽取等,可以自定义标签体系;针对生成任务,可以进行采样自由生成。

技术亮点

  1. 首个全中文任务支持的零样本学习的开源模型;
  2. 自动化高质量数据处理算法,产出海量高质量无监督和有监督数据用于训练;
  3. 基于高质量数据构建更加符合中文习惯的字典并从零训练中文大模型,模型性能效果更有保证;
  4. 融合多种训练策略训练大模型,具备在中文上强大的泛化、迁移和生成能力。

ChatYuan 功能对话开源大模型

就其功能而言,ChatYuan 可以用于问答、结合上下文做对话、做各种生成任务(包括创意性写作),也能回答一些像法律、医疗等领域问题。ChatYuan 线上服务是基于百亿参数大模型,目前已开源了7.7亿的参数模型,显存6G 左右,一张民用显卡即可加载使用。后续会陆续开源更多、更大参数量的版本。

ChatYuan基于 PromptCLUE 结合数亿条功能对话多轮对话数据进一步训练得到,它去掉了文本理解、信息抽取类任务,加强了问答、对话和各种生成式任务的学习和训练;针对多轮对话容易受到上下文的干扰,加入了抗干扰数据使得模型可以在必要时忽略无关的上下文;加入了用户反馈数据的学习,对齐人类意图,使得模型不仅具有一定的通用语言理解能力、特定任务上的生成能力,也能更好地响应用户的意图。

技术亮点

  1. 基于从零训练的全中文任务支持零样本学习模型 PromptCLUE 进一步迭代获取。
  2. 在中文领域首创了功能对话形式支持全中文任务,支持自由输入。
  3. 结合人类反馈的方法进行学习,对齐人类意图。

文本创作能力

上下文关联能力

元语智能认为目前公司发布的大模型中还有很多可以优化的方向,比如在某些场景下效果不稳定;在对齐人类意图、复杂推理和代码生成上还需要持续优化

在未来,元语智能将在多个方向上持续精进,比如模型 size 上将推出千亿级别参数模型、在对齐人类意图层面实现关键突破,并且提升至少50% 模型的覆盖场景,并且今年在国内实现行业通用人工智能的落地应用

通用人工智能(AGI)的坚定信仰者 — 中国 “Yuan”

元语智能是一家致力于提供通用人工智能技术(AGI)的初创公司,坚定通用人工智能信仰,持续不断在全球范围内,为实现可靠、有效、无害的通用人工智能贡献中国力量,让人类受益。目前元语智能已经提供了支持功能型对话的开源中文大模型免费下载及 API 服务,以及基于网页、小程序的类似「ChatGPT」的机器人交互产品等

元语智能认为,通用人工智能(AGI)是下一代计算机基础设施,代表了人类未来主要人机交互和生活方式,并在不久的将来会使大部分行业广泛受益。

元语智能核心成员来自于中文 NLP 开源社区「CLUE」及阿里达摩院、百度等互联网企业,在这里不得不介绍下「神秘」的 CLUE 开源社区。

CLUE 开源社区

2019年,随着预训练模型成为主流的趋势,国内陆续产生了一些预训练模型。可是国内没有一个可以衡量大模型效果的综合性中文基准,而国外已经有了 GLUE 这样的通用预训练模型基准。CLUE 的发起人联合国内外30多个产业界青年学者,一起共建了中文语言理解标准评价系统(CLUE)。CLUE 的定位是要更好的服务中文语言理解任务,作为通用语言模型测评的补充,通过搜集整理发布中文任务及标准化测评等方式完善基础设施,最终促进中文 NLP 和认知领域的进步和突破。

CLUE 是一组评估机器能够像人类一样理解和响应中文文本的任务,上线于3年前,也是第一个大规模的中文语言评估基准。在 CLUE 的官网上,有语料库、排行榜、预训练模型和代表性的数据集等资料可供选择,包括文本相似度、分类、上下文推理、阅读理解、少样本学习和知识图谱等在内的17项测评任务。自发布以来,获得了人工智能行业的广泛认可,同时将成果发布在顶会论文。众多头部公司包括阿里、华为、百度、字节跳动、美团、网易、OPPO、招商银行等都使用了 CLUE 基准。

因此脱胎于 CLUE 社区的元语智能,在多方面具备大模型的先天优势,积累了包括大量高质量数据、具备丰富的处理数据的算法和经验、沉淀了强大的大模型研发能力,并且非常重要的是,积累了十分活跃的开发者开源社区。

CLUE 核心组织成员在2022年看到了大模型和生成模型的潜力,以及基于对通用人工智能(AGI)未来的坚定判断,进行了近一年的技术孵化,之后创立元语智能。并且在 ChatGPT 发布半年之前就已经在多任务大模型进行深入探索和研发,积累了大量经验。

团队进展

截至目前,元语智能主要在以下方面取得了有效进展:

  • 2022年10月1日发布 PromptCLUE1.0模型 & API — 首个中文支持的零样本开源模型。目前全平台下载量:4.4W+,API 调用量:10w+/ 天。
  • 2022年11月发布 PromptCLUE1.5模型 & API — 支持更多任务的零样本开源模型。
  • 2022年12月20日发布 ChatYuan— 国内首个基于百亿参数大模型的功能对话产品,支持小程序和网页。
  • 2023年1月12日发布 ChatYuan 大模型 — 首个功能对话开源模型供免费下载,全平台已有数万下载量。
  • 2023年2月3日发布 ChatYuan API— 可供 API 调用的功能对话模型。

国内 AGI 困境

其实包括元语智能在内,国内无论是大型科技公司还是创业公司,目前都面临着各式各样的挑战,很难有像 OpenAI 的资源和人才密度。国内创业公司或许在一段时间内可以专心技术研发,但很快就会受到盈利压力的挑战,而不断调整战略方向。大型科技公司虽然看起来资源充足,但是很少能在未有落地成效的情况下,坚定信念进行长期持续投入基础设施建设。

在元语智能看来,国内目前主要有以下多方面的问题:

  • 人力、算力方面的资源瓶颈。国内行业内相对来说更缺乏耐心,在未见到明确收益前持续投入不足,资本也同时缺乏耐心。
  • 中国高质量的数据积累不足,国内开源开放的生态相对薄弱。
  • 对 AI 未来趋势的前瞻性判断不足,缺少具有坚定信仰的引领者。
  • 行业对 AGI 创业公司信心不足,对于 AGI 价值的共识不够。

未来愿景

因此,元语智能作为国内第一个勇敢前行的初创公司,并坚定通用人工智能(AGI)将普惠人类的信仰,给了国内通用人工智能行业从业者非常大的信心。

同时,元语智能强烈呼吁:国内从事人工智能研究的同行、长期关注科技行业的资本以及各行各业对 AGI 感兴趣的朋友,要共同有耐心、有信心的坚持下去。他山之石,可以攻玉,但我山之石将会持之以恒

延伸阅读

百度类ChatGPT项目预计三月完成内测,名字确定为“文心一言” 聊天机器人

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
美军轰炸机直扑朝鲜,距边境仅80公里!朝方:随时使用核武器反击

美军轰炸机直扑朝鲜,距边境仅80公里!朝方:随时使用核武器反击

娱乐的大姨妈
2023-03-20 17:30:37
许家印:恒大汽车资金断裂濒临破产,发不起工资,宣布裁员94%!

许家印:恒大汽车资金断裂濒临破产,发不起工资,宣布裁员94%!

韩牙娱乐
2023-03-20 15:59:36
“我只是想看看你的私处!”健身房男教练,竟将女学员的裤裆剪开

“我只是想看看你的私处!”健身房男教练,竟将女学员的裤裆剪开

社会猎奇号
2023-03-20 21:23:57
中国专机还没落地,普京就想加钱,中方给远东开的价,俄方嫌低了

中国专机还没落地,普京就想加钱,中方给远东开的价,俄方嫌低了

军武谈
2023-03-18 20:17:33
中国植树造林无用?甘肃张掖遭沙尘暴袭击,沙墙达百米,咋回事?

中国植树造林无用?甘肃张掖遭沙尘暴袭击,沙墙达百米,咋回事?

环球科学猫
2023-03-20 15:39:40
谷爱凌太狠了!时隔1年回到中国,直奔健身房,晒6块腹肌+好身材

谷爱凌太狠了!时隔1年回到中国,直奔健身房,晒6块腹肌+好身材

体坛扒客
2023-03-20 21:50:52
细思极恐!苏州女子杀夫藏尸冰柜事件,更多细节被暴露

细思极恐!苏州女子杀夫藏尸冰柜事件,更多细节被暴露

潇湘史说
2023-03-20 10:54:51
从确诊到去世,仅三天!21岁运动员因睾丸癌离世,5个祸根要远离

从确诊到去世,仅三天!21岁运动员因睾丸癌离世,5个祸根要远离

肿瘤的真相与误区
2023-03-20 18:13:33
太惨了!9名中国公民在非洲,被枪顶后脑勺挨个枪决!

太惨了!9名中国公民在非洲,被枪顶后脑勺挨个枪决!

魔都姐姐杂谈
2023-03-20 15:27:37
全部暂停运营!总部仅剩保安留守......网友怒了:退钱!

全部暂停运营!总部仅剩保安留守......网友怒了:退钱!

极目新闻
2023-03-19 16:06:58
李梦和张隆无码艳照30张,还原真实工作状态下风采,做小三天下知

李梦和张隆无码艳照30张,还原真实工作状态下风采,做小三天下知

哈哈小娱记
2023-03-20 09:04:51
指使董事损害上市公司利益!“芯片狂人”赵伟国被带走调查8个月后,有新消息了……

指使董事损害上市公司利益!“芯片狂人”赵伟国被带走调查8个月后,有新消息了……

每日经济新闻
2023-03-20 16:41:22
国有企业怎么就变成了家族企业?

国有企业怎么就变成了家族企业?

生财之路
2023-03-20 17:41:50
男子与女友妹妹发生关系,后被对方以此胁迫继续XX,网友用ChatGPT想办法

男子与女友妹妹发生关系,后被对方以此胁迫继续XX,网友用ChatGPT想办法

可达鸭资讯
2023-03-20 19:51:31
是否替身成迷,“下巴实锤”出现

是否替身成迷,“下巴实锤”出现

风趣环球笔记
2023-03-20 20:25:03
美国终于下场!三十国联军总动员:10天内10万北约联军扑向俄罗斯

美国终于下场!三十国联军总动员:10天内10万北约联军扑向俄罗斯

无定河
2023-03-20 15:57:48
虽远必诛!杀死中非金矿场9名中国人的凶手有俄罗斯瓦格纳雇佣军

虽远必诛!杀死中非金矿场9名中国人的凶手有俄罗斯瓦格纳雇佣军

老马拉车莫少装
2023-03-20 21:55:07
中国国家主席抵达莫斯科  俄三军仪仗队隆重迎宾

中国国家主席抵达莫斯科 俄三军仪仗队隆重迎宾

看看新闻Knews
2023-03-20 21:25:22
著名作家:落后地区让清北复旦的人才当乡长、副县长,我觉得搞笑

著名作家:落后地区让清北复旦的人才当乡长、副县长,我觉得搞笑

小星球资讯
2023-03-20 09:08:25
2011年单身汉捡了个流浪女,生了2个孩子,5年后才发现是外国人

2011年单身汉捡了个流浪女,生了2个孩子,5年后才发现是外国人

社会奇闻君
2023-03-19 18:20:02
2023-03-21 01:18:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
7711文章数 140231关注度
往期回顾 全部

科技要闻

东航事故为何非常复杂极为罕见?专家解读

头条要闻

警方通报女子杀夫藏尸:已被刑拘 自称因家庭矛盾行凶

头条要闻

警方通报女子杀夫藏尸:已被刑拘 自称因家庭矛盾行凶

体育要闻

罗马诺:齐达内回皇马不容易,安切洛蒂知道他必须要赢得奖杯

娱乐要闻

恭喜!"我的女孩"李多海官宣5月办婚礼

财经要闻

汽车要闻

首搭全新1.5T发动机 一汽-大众T-ROC探歌亮相

态度原创

教育
亲子
家居
数码
公开课

教育要闻

速看!在安徽免学费还带编的公费师范生都招些什么专业

亲子要闻

奢侈品狂热风吹进韩国幼儿园,专家担心对幼儿心理健康产生影响

家居要闻

大理石墙面搭配深色家具,高级感十足

数码要闻

小米真无线降噪耳机3星战定制版图赏

公开课

得尿毒症的人增多?医生:5个习惯别碰

无障碍浏览 进入关怀版