网易首页 > 网易号 > 正文 申请入驻

Meta硬刚OpenAI,国产“小模型”官宣开源,“百模大战”走向何方?

0
分享至

摘要:全球围绕大模型生态迎来了新一轮道路之争。

今年以来,全球互联网大厂掀起“百模大战”,微软、谷歌、百度、阿里等接连下场。经过半年多的竞争,科技巨头们围绕大模型生态正迎来新一轮道路之争:面对参数“天花板”,大模型的未来走向封闭还是开放?

开源模型可在家用电脑运行

8月3日,国内AI开发者社区“魔搭”(ModelScope)上架两款开源模型Qwen-7B和Qwen-7B-Chat,分别为阿里云通义千问的70亿参数通用模型和对话模型,两款模型均开源、免费、可商用。

据介绍,通义千问Qwen-7B是支持中英等多种语言的基座模型,在超过2万亿token(文本单位)数据集上训练,而Qwen-7B-Chat是基于基座模型的中英文对话模型,已达到人类的认知水平。简而言之,前者好比“地基”,后者是地基之上的“房屋”。

经过实际测试显示,Qwen-7B模型的综合表现不俗。其中在英文能力测评基准MMLU上,得分普遍高于同等参数规模的主流模型,甚至赶超120亿、130亿参数规模的部分模型。而在中文评测C-Eval验证集上,该模型也取得了同等规模的最高分。在数学解题能力评测GSM8K和代码能力评测HumanEval方面,Qwen-7B模型表现也名列前茅。

也就是说,在中英文写作、数学解题以及写代码等考试中,Qwen-7B模型妥妥是一名“学霸”,分数甚至超过同等参数级别的国际主流大模型。

除此之外,业界更关心Qwen-7B模型的易用性。众所周知,主流大模型的训练和运行需要专门的AI训练芯片(如英伟达A100),这些芯片不仅售价昂贵,每块英伟达A100售价高达1万—1.5万美元,而且被欧美等国家垄断,国内几乎无法购买。而国产Qwen-7B模型支持消费级显卡上部署,相当于高性能的家用电脑就能运行该模型。

得益于免费商用加上低门槛,Qwen-7B模型的上架,引起了AI开发者的关注。短短一天,在代码托管平台GitHub上,Qwen-7B模型已被千余名开发者标星收藏,绝大多数提问者均为中文开发者。正如阿里云在声明中所说:“相比英文世界热闹的AI开源生态,中文社区缺少优秀的基座模型。通义千问的加入有望为开源社区提供更多选择,推动中国AI开源生态建设。”

开源还是封闭

事实上,Qwen-7B模型并非首款开源的大模型,其实ChatGPT的“前辈”GPT-2也是彻底开源的,其代码和框架在互联网上均可免费使用,还有相关论文可供查阅。而OpenAI在ChatGPT火遍全球之后选择了闭源发展,GPT-3和GPT-4等模型代码已成为OpenAI的商业机密。

所谓开源,就是开放源代码。比如大模型一旦宣布开源后,在版权限制范围内,任何人可以公开获取模型源代码,并进行修改甚至重新开发。打个简单的比方,源代码就像是一幅画的底稿,所有人可以照着底稿填色创造自己的艺术画作。

闭源与开源正好相反,只有源代码所有者(通常是软件开发商)掌握代码修改的权力,其他人没办法获取“底稿”,只能向软件开发商购买成品。

开源和闭源的优劣都非常明显。大模型开源后无疑会吸引更多开发者,大模型的应用也将更加丰富,但相应的监管和商业化将成为难题,容易出现“替人做嫁衣”的尴尬局面。毕竟,开源考虑的是生态共荣,到底能赚多少钱的经济账,这一阶段很难算清楚,而这些难题恰好是闭源的机遇。

开源还是闭源,这是一道大模型的生死题,国际巨头已给出答案。

Facebook母公司Meta在上个月发布了大模型Llama2,开源免费给开发者和商业伙伴使用,而OpenAI则坚定地选择了GPT-4闭源发展,不仅能保持OpenAI在生成式AI行业的领先地位,还能赚取更多营收。根据权威杂志《Fast Company》预测,OpenAI在2023年的收入将达到2亿美元,包括提供API数据接口服务、聊天机器人订阅服务费等。

国内大模型也逐渐开始“分道扬镳”。阿里云的通义大模型早在今年4月宣布向企业开放,Qwen-7B模型的开源将开放之路走的更远一些。百度的文心一言也在近期宣布,将逐步开放插件生态给第三方开发者,帮助开发者基于文心大模型打造自己的应用。

相比之下,华为则不走寻常路。在发布盘古大模型3.0时,华为云公开表示,盘古大模型全栈技术均由华为自主创新的,没有采用任何开源技术,同时盘古大模型将聚集无数行业大数据(涉及行业机密等),因此盘古大模型在未来也不会开源。

大参数还是小而美

除此之外,Qwen-7B模型的开源,还带来了另一个思考:我们到底需要多大参数的大模型?

不可否认,大模型的参数规模正在不断膨胀。以OpenAI旗下的GPT大模型为例,GPT-1仅包含1.17亿参数,GPT-3的参数已经高达1750亿,几年时间内增长了1000多倍,而GPT-4的参数已超过万亿级别。

国内大模型亦是如此。百度文心大模型为2600亿参数,腾讯混元大模型达到千亿级参数,华为盘古大模型参数规模推测接近GPT-3.5,阿里通义大模型官宣已达10万亿参数……据不完全统计,中国10亿参数规模以上的大模型至少有79个。

遗憾的是,参数越大并不代表大模型的能力越强。在世界人工智能大会上,腾讯云副总裁吴运声有一个很恰当的比喻:“就像运动员练体力,举重运动员要举200斤杠铃,游泳运动员举100斤就够了,不同类型的运动员不需要每个人都练习200斤重的杠铃。”

众所周知,大模型的参数越高,消耗的资源和成本也越相应增加。而深耕行业的垂直类大模型,并不需要一味追求“规模大”或是“参数高”,更应该根据客户需求制定相关的模型参数。比如生物大模型BioGPT-Large仅有15亿参数,而在生物医学专业测试中的准确率,却优于千亿级别参数的通用大模型。

OpenAI联合创始人Sam Altman也公开表示,OpenAI正接近LLM(大型语言模型)规模的极限,规模越大并不一定意味着模型越好,参数规模不再是衡量模型质量的重要指标。

火山引擎智能算法负责人吴迪也有类似观点,长期来看,降低成本将成为大模型应用落地的重要因素,“一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用大模型,而成本可仅为原来的十分之一。”

当下,国内科技大厂几乎都拿到了大模型的入场券,但真正的道路抉择才刚开始。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1955年大授衔时,3000多名老红军无法安排,毛主席只说了5个字

1955年大授衔时,3000多名老红军无法安排,毛主席只说了5个字

百年历史老号
2024-06-14 20:49:30
四类食物被叫“毁肾王”,有人还天天端上桌…

四类食物被叫“毁肾王”,有人还天天端上桌…

爱肾网
2024-06-13 15:03:04
信仰已经崩塌,大多数人只是活着

信仰已经崩塌,大多数人只是活着

鹿和犀
2024-05-28 20:39:06
你知道有钱人有多毁三观吗?网友:玩的真花!我十辈子都想不出来

你知道有钱人有多毁三观吗?网友:玩的真花!我十辈子都想不出来

文雅笔墨
2024-06-16 22:52:38
曝曼联截胡拜仁抢6000万铁腰,可替代卡塞米罗!恐影响签德里赫特

曝曼联截胡拜仁抢6000万铁腰,可替代卡塞米罗!恐影响签德里赫特

罗米的曼联博客
2024-06-17 11:44:09
莫伊塞斯重回中超!100万欧!签约1年!新东家不是山东泰山

莫伊塞斯重回中超!100万欧!签约1年!新东家不是山东泰山

建哥说体育
2024-06-17 07:13:32
奇迹出现了!蔡磊走出病房,不用鼻管和轮椅,正常工作气色极佳!

奇迹出现了!蔡磊走出病房,不用鼻管和轮椅,正常工作气色极佳!

小咪侃娱圈
2024-06-15 11:18:56
大陆男子驾艇成功登台湾细节曝光:突破5亿监控系统后,自己报警

大陆男子驾艇成功登台湾细节曝光:突破5亿监控系统后,自己报警

消失的电波
2024-06-13 10:01:58
美女大赏,最后一个是你喜欢的类型吗

美女大赏,最后一个是你喜欢的类型吗

娱记掌门
2024-06-17 10:48:10
清华大学“立功”了!“中国芯”换道超车,美企集体“破防”了

清华大学“立功”了!“中国芯”换道超车,美企集体“破防”了

科技丰
2024-06-17 09:38:42
北大吴谢宇弑母通灵记录:通灵人自曝与其交流,得知弑母真实动机

北大吴谢宇弑母通灵记录:通灵人自曝与其交流,得知弑母真实动机

古今档案
2024-05-29 18:42:08
一位北京老股民:十几年前6124点买入1000手格力,到现在能赚多少

一位北京老股民:十几年前6124点买入1000手格力,到现在能赚多少

金少财经
2024-06-17 09:42:14
广东这所学校火了!教室开空调一节课收费24元,网友:吃相真难看

广东这所学校火了!教室开空调一节课收费24元,网友:吃相真难看

小鬼头体育
2024-06-16 22:49:31
俄媒:若没收俄资产,G7国家将损失约830亿美元

俄媒:若没收俄资产,G7国家将损失约830亿美元

参考消息
2024-06-16 09:57:08
老黄埔这5个楼盘,房价曾破6万/㎡!如今咋样了...

老黄埔这5个楼盘,房价曾破6万/㎡!如今咋样了...

房二娃
2024-06-17 09:44:16
高中生模仿宋徽宗瘦金体,被老师打0分,评语:不要挑战考试底线

高中生模仿宋徽宗瘦金体,被老师打0分,评语:不要挑战考试底线

熙熙说教
2024-06-16 12:08:10
小S疑言论又有失,火上浇油,大S很被动,大S和小S或终有“一战”

小S疑言论又有失,火上浇油,大S很被动,大S和小S或终有“一战”

娱记掌门
2024-06-15 02:24:47
再见山东!CBA第一狠人离队 上赛季怒推深圳小外援导致其赛季报销

再见山东!CBA第一狠人离队 上赛季怒推深圳小外援导致其赛季报销

狼叔评论
2024-06-17 11:05:12
欧洲杯2-1!莱万全场未登场阴沉着脸,替补席意外瞬间无法直视

欧洲杯2-1!莱万全场未登场阴沉着脸,替补席意外瞬间无法直视

bwb足球算个球
2024-06-17 01:04:59
发工资了,小米汽车内部员工实发工资曝光

发工资了,小米汽车内部员工实发工资曝光

音乐时光的娱乐
2024-06-17 01:29:23
2024-06-17 12:26:44
上观新闻
上观新闻
站上海,观天下
132654文章数 739086关注度
往期回顾 全部

科技要闻

OpenAI可能会迎来重大变化

头条要闻

清华博士庞众望:洗澡时热水浇头来灵感 有了第一篇SCI

头条要闻

清华博士庞众望:洗澡时热水浇头来灵感 有了第一篇SCI

体育要闻

欧洲杯15亿豪阵险翻车:半场梦游 王牌打废

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

枝江酒业的补税单,张道红的下马威

汽车要闻

传奇新篇章 全新一代大众迈腾来了

态度原创

手机
亲子
健康
旅游
房产

手机要闻

AI体验成购机首要因素!今年618手机应该如何选择?

亲子要闻

好享受的样子,网友:我竟然不如一个婴儿

晚餐不吃or吃七分饱,哪种更减肥?

旅游要闻

游客放狗进赛里木湖追天鹅,景区回应!

房产要闻

强!全国第三!海口房价正在止跌!

无障碍浏览 进入关怀版