网易首页 > 网易号 > 正文 申请入驻

某公司宣布开源大模型,但它的大模型多少含金量?不值一提

0
分享至

估计大家看到了,某个公司宣布开源了自己的模型。看上去大家云里雾里的,我给大家说明一下。

先看图,这个公司推出的大模型呢,和他发布会一样是很多定语的。它只在数学推理和代码竞赛方面表现优异。这是个什么意思呢?

在大模型领域,有个技术叫“模型蒸馏”。什么意思呢?就是把一些开源的大型复杂模型的知识高效迁移到小型高效模型中。直白一点说,大型复杂模型叫老师模型,是很全能的,它在各个方面的能力都很突出。但是这个小型高效模型叫学生模型,它模型老师的输出,只训练某个方面的能力。

然后我们就发现,这个世界的大模型其实分为两类。第一类是基座型大模型。这一种大模型参数量庞大、训练数据广泛、任务泛化能力强。说白了,这种大模型是全能的,全场景适用的,不是偏科的。这些基本需要顶级大公司长期的培育和大投入才行,比如阿里的通义千问、华为的盘古大模型等。

第二类就是很多蒸馏型大模型。这类蒸馏型大模型有个好处,就是成本低廉,能在某些方面专精。说白了就是完全偏科,老师模型是琴棋书画样样精通,但是学生型可能只会画画,但是这些蒸馏模型比较简单,所以在一些特定场景的能力上会有轻装上阵的优势。严格意义上说,这个DeepSeek早期就是蒸馏型大模型,DeepSeek早期蒸馏6个模型,其中有4个是阿里的,两个是谷歌的。

这种蒸馏型大模型的成本有多低呢?在2025年初,斯坦福教授李飞飞以50美元的成本,蒸馏提炼谷歌的模型,又以阿里模型为基座,成功训练出世界一流模型。也就是说,一个做蒸馏大模型的企业就是另一个版本的拿来主义。它们做出来的所谓大模型一般只能赢老版本或者阉割版本,而没办法和基座型大模型的旗舰模型匹敌。

就比如,阿里在2025年4月发布了Qwen3系列,新增了8个开源版本,持续强化数学、代码等专项能力。而这家公司现在展示的是它的模型只是超越了Qwen2.5的版本。而且OpenAI01-mini版本也是OpenAI满血版本蒸馏出来的只需要推理不需要广泛世界知识的应用。也就是说,这个OpenAI01-mini版本其实优势不在数学推理和代码竞赛。

通过以上分析,我们知道了,这个公司的大模型说白了,应该是把阿里通义千问和DeepSeek的开源大模型拿来蒸馏提炼以后的产物。然后这个公司去学了画画,然后现在把数据摆出来,说我现在的画画能力比老师婴儿时期的能力强,我现在画画能力比一个只会弹琴的人的强。这本质上也是一种神奇的对比法则。

所以,我就一直强调一件事,这家公司的营销是无敌的!用各种神奇的对比法则来彰显自己的能力,说好听是营销,说不好听其实就是骗人!

声明:个人原创,仅供参考

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
今日最惨股:主力跑了,散户踩踏式封跌停,17万股民套在山顶!

今日最惨股:主力跑了,散户踩踏式封跌停,17万股民套在山顶!

丁丁鲤史纪
2026-05-27 11:10:33
央视赚翻!4亿拿下美加墨世界杯,不到2周已签2家分销,进账32亿

央视赚翻!4亿拿下美加墨世界杯,不到2周已签2家分销,进账32亿

十点街球体育
2026-05-27 16:14:22
景甜急卖1.5亿江景房!疑似为筹钱还富豪男友,难怪突然不爆料了

景甜急卖1.5亿江景房!疑似为筹钱还富豪男友,难怪突然不爆料了

萌神木木
2026-05-27 11:42:30
朱芳雨谈引进哈登:不惜一切办法,这对广东甚至CBA都有很大提升

朱芳雨谈引进哈登:不惜一切办法,这对广东甚至CBA都有很大提升

多特体育说
2026-05-27 15:11:03
女子坐网约车对司机心动,高情商追爱!客服:我只是个工具人罢了

女子坐网约车对司机心动,高情商追爱!客服:我只是个工具人罢了

用车指南
2026-05-27 10:02:03
塞尔维亚总统夫人上海购物清单大揭秘

塞尔维亚总统夫人上海购物清单大揭秘

上观新闻
2026-05-27 12:38:05
中国被曝限制AI人才出境,阿里DeepSeek核心人员出国要先获批

中国被曝限制AI人才出境,阿里DeepSeek核心人员出国要先获批

桂系007
2026-05-26 23:43:08
被做局了?!NBA官网剧透总决赛双方!!

被做局了?!NBA官网剧透总决赛双方!!

柚子说球
2026-05-27 12:35:17
鲁比奥离开印度,留下此行唯一遗憾,中印卖掉美债,美国开始救市

鲁比奥离开印度,留下此行唯一遗憾,中印卖掉美债,美国开始救市

近史博览
2026-05-27 14:10:20
被央媒怒批,目不识丁、德不配位,这几位“文盲”明星到底凭啥火

被央媒怒批,目不识丁、德不配位,这几位“文盲”明星到底凭啥火

汉字笔迹心理分析
2026-05-27 07:12:08
大连一商场楼顶部分垮塌,当地称无人受伤,正现场处置,商场影城全天暂停放映

大连一商场楼顶部分垮塌,当地称无人受伤,正现场处置,商场影城全天暂停放映

极目新闻
2026-05-27 12:21:30
午评:沪指半日跌超1% 全市场超4600只个股下挫

午评:沪指半日跌超1% 全市场超4600只个股下挫

财联社
2026-05-27 11:32:15
上海泳渡女子露胸事件后续!网友:相片看了是哺乳期,选手很漂亮

上海泳渡女子露胸事件后续!网友:相片看了是哺乳期,选手很漂亮

老猫观点
2026-05-27 14:27:16
一个赌徒引发的启发:赌到一半怎么分钱?逼出了改变世界的概率论

一个赌徒引发的启发:赌到一半怎么分钱?逼出了改变世界的概率论

知识圈
2026-05-27 12:09:19
航天员黎家盈年收入多少?回来后享受什么待遇?

航天员黎家盈年收入多少?回来后享受什么待遇?

混沌录
2026-05-26 22:05:52
全民不接电话!中国要成首个抛弃电话的国家,真相太扎心

全民不接电话!中国要成首个抛弃电话的国家,真相太扎心

番外行
2026-05-25 15:19:56
官方回应稻城亚丁景区截断省道收费争议:将尽快向公众答复

官方回应稻城亚丁景区截断省道收费争议:将尽快向公众答复

南方都市报
2026-05-27 12:34:06
在美日资企业工厂爆炸致多人死伤

在美日资企业工厂爆炸致多人死伤

澎湃新闻
2026-05-27 09:07:51
熔断!韩国股市暴涨!

熔断!韩国股市暴涨!

证券时报
2026-05-27 08:45:09
阿里宣布薪资调整

阿里宣布薪资调整

第一财经资讯
2026-05-27 15:54:37
2026-05-27 18:52:49
一桢见血
一桢见血
专注中美博弈,见证民族复兴… 《轮回之天泣传说》作者 笔名:天马修罗 孤月吃荔枝
234文章数 37关注度
往期回顾 全部

科技要闻

韬定律:全球在卷纳米数 华为换了一把尺子

头条要闻

男子婚内打赏女主播超1700万 两人首次见面就确定关系

头条要闻

男子婚内打赏女主播超1700万 两人首次见面就确定关系

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

中国半导体的阳谋

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

亲子
房产
数码
教育
手机

亲子要闻

一粒顶多粒?健敏思集智DHA多维配方,精准满足孕期刚需

房产要闻

地产投资又跌30%!连跌15月!海南房子将越来越少?

数码要闻

交流电机 vs 无刷变频电机 哪款才是厨房垃圾处理器的真香选择?

教育要闻

视频丨“怎么能慢点长大?”“享受当下” 各地护航青少年心理健康出新招

手机要闻

华为nova 16系列代言人明天官宣 时代少年团来了

无障碍浏览 进入关怀版