网易首页 > 网易号 > 正文 申请入驻

4o-mini只有8B,o1也才300B!微软论文意外曝光GPT核心机密

0
分享至

微软又把OpenAI的机密泄露了??在论文中明晃晃写着:

o1-preview约300B参数,GPT-4o约200B,GPT-4o-mini约8B……

英伟达2024年初发布B200时,就摊牌了GPT-4是1.8T MoE也就是1800B,这里微软的数字更精确,为1.76T

除此之外,论文中给OpenAI的mini系列,Claude3.5 Sonnet也都附上了参数,总结如下:

  • o1-preview约300B;o1-mini约100B
  • GPT-4o约200B;GPT-4o-mini约8B
  • Claude 3.5 Sonnet 2024-10-22版本约175B
  • 微软自己的Phi-3-7B,这个不用约了就是7B

虽然论文中后面也有免责声明:

确切数据尚未公开,这里大部分数字是估计的。

但还是有不少人觉得事情没这么简单。

比如为什么唯独没有放谷歌Gemini模型的参数估计?或许他们对放出来的数字还是有信心的。

也有人认为,大多数模型都是在英伟达GPU上运行的,所以可以通过token生成速度来估计。

只有谷歌模型是在TPU上运行的,所以不好估计。

而且微软也不是第一次干这事了。

23年10月,微软就在一篇论文里“意外”曝出GPT-3.5-Turbo模型的20B参数,在后续论文版本中又删除了这一信息。

就说你是故意的还是不小心的?

微软这篇论文说了什么

实际上,原论文介绍了一项与医学相关的benchmark——MEDEC。

12月26日就已经发布,不过是比较垂直领域的论文,可能非相关方向的人都不会看,年后才被列文虎克网友们发现。

研究起因是,据美国医疗机构调查显示,有1/5的患者在阅读临床笔记时报告发现了错误,而40%的患者认为这些错误可能影响他们的治疗。

而且另一方面,LLMs(大语言模型)被越来越多的用于医学文档任务(如生成诊疗方法)。

因此,MEDEC此番有两个任务。一是识别并发现临床笔记中的错误;二是还能予以改正。

为了进行研究,MEDEC数据集包含3848份临床文本,其中包括来自三个美国医院系统的488份临床笔记,这些笔记之前未被任何LLM见过。

它涵盖五种类型的错误(诊断、管理、治疗、药物治疗和致病因子),这些错误类型是通过分析医学委员会考试中最常见的问题类型选择的,并由8位医疗人员参与错误标注。

而参数泄露即发生在实验环节

按照实验设计,研究者将选取近期主流的大模型和小模型来参与笔记识别和纠错。

而就在介绍最终选定的模型时,模型参数、发布时间一下子都被公开了。

对了,省去中间过程,这项研究得出的结论是:Claude 3.5 Sonnet在错误标志检测方面优于其他LLM方法,得分为70.16,第二名是o1-mini。

网友:按价格算合理

每一次,ChatGPT相关模型架构和参数泄露,都会引起轩然大波,这次也不例外。

23年10月,微软论文声称GPT-3.5-Turbo只有20B参数的时候,就有人感叹:难怪OpenAI对开源模型这么紧张。

24年3月,英伟达确认GPT-4是1.8T MoE,而2000张B200可以在90天内完成训练的时候,大家觉得MoE已经且仍将是大模型架构趋势。

这一次,基于微软估计的数据,网友们主要有几个关注点:

如果Claude 3.5 Sonnet真的比GPT-4o还小, 那Anthropic团队就拥有技术优势。

以及不相信GPT-4o-mini只有8B这么小。

不过此前也有人根据推理成本来算,4o-mini的价格是3.5-turbo的40%,如果3.5-turbo的20B数字准确,那么4o-mini刚好是8B左右。

不过这里的8B也是指MoE模型的激活参数。

总之,OpenAI大概是不会公布确切数字了。

此前奥特曼征集2024年新年愿望,最后公布的清单中还有“开源”。2025年的最新版本里,开源已经被去掉了。

论文地址:
https://arxiv.org/pdf/2412.19260

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
51岁男子突发心梗猝死!不想得心梗,牢记晚饭4不吃,睡前4不要!

51岁男子突发心梗猝死!不想得心梗,牢记晚饭4不吃,睡前4不要!

健康之光
2026-03-20 17:05:06
香港这批终身不婚不育的女星已经老了,她们晚年真的孤独凄惨吗?

香港这批终身不婚不育的女星已经老了,她们晚年真的孤独凄惨吗?

八卦宝宝
2026-03-17 11:08:51
网友莫斯科遇见58岁伊能静与47岁秦昊,女方脸型紧致比男方还年轻

网友莫斯科遇见58岁伊能静与47岁秦昊,女方脸型紧致比男方还年轻

明星私服穿搭daily
2026-03-21 14:25:06
水果骗局大揭秘!这些水果其实全是假的,买了你就上当了!

水果骗局大揭秘!这些水果其实全是假的,买了你就上当了!

时评人李文君
2026-03-25 19:32:21
重返广东!李春江有了新工作,亮相篮球场,岗位曝光,杜锋期待

重返广东!李春江有了新工作,亮相篮球场,岗位曝光,杜锋期待

萌兰聊个球
2026-03-26 13:02:53
大势已去,53%反对票创纪录,梅洛尼公投惨败,意大利政坛要变

大势已去,53%反对票创纪录,梅洛尼公投惨败,意大利政坛要变

时尚的弄潮
2026-03-26 18:02:15
发生了什么?鲁尼儿子凯夺冠后发社媒:将缺阵本赛季剩余比赛

发生了什么?鲁尼儿子凯夺冠后发社媒:将缺阵本赛季剩余比赛

懂球帝
2026-03-26 21:17:50
全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

全球首次!俄军10倍音速锆石高超音速导弹发射车:最后一刻被摧毁

Ck的蜜糖
2026-03-26 12:30:25
2026 期刊分区大变天!中科院分区正式退场,一区毕业神刊被标注审查,新兴国产期刊强势崛起

2026 期刊分区大变天!中科院分区正式退场,一区毕业神刊被标注审查,新兴国产期刊强势崛起

生物学霸
2026-03-26 17:13:44
痛别张雪峰!峰学蔚来接班人确定,事业将继续

痛别张雪峰!峰学蔚来接班人确定,事业将继续

大熊欢乐坊
2026-03-26 19:17:05
油价调整:注意,预计下调120元/吨,油价突破下调红线!

油价调整:注意,预计下调120元/吨,油价突破下调红线!

金投网
2026-03-26 11:16:05
唱衰国安新援!揭经纪公司勾结媒体人黑幕:85万引援动了谁的奶酪

唱衰国安新援!揭经纪公司勾结媒体人黑幕:85万引援动了谁的奶酪

体坛鉴春秋
2026-03-26 18:17:46
多个省级党委组织部部长调整

多个省级党委组织部部长调整

上观新闻
2026-03-26 12:48:05
俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

俄罗斯宣传三天攻占爱沙尼亚!炮制公投,又是特别军事行动?

项鹏飞
2026-03-24 20:28:43
因祸得福!烧129年的地下火被灭,新疆凭空多了个金饭碗

因祸得福!烧129年的地下火被灭,新疆凭空多了个金饭碗

混沌录
2026-03-24 23:03:10
大众中国回应斯柯达退出中国市场

大众中国回应斯柯达退出中国市场

澎湃新闻
2026-03-26 17:33:03
朝鲜权力格局再洗牌!金正恩连任背后

朝鲜权力格局再洗牌!金正恩连任背后

新浪财经
2026-03-26 00:04:55
意大利附加赛半决赛名单:斯卡马卡、坎比亚索、坎比亚吉缺席

意大利附加赛半决赛名单:斯卡马卡、坎比亚索、坎比亚吉缺席

懂球帝
2026-03-26 19:42:06
出狱后的雷政富沧桑感袭面而来,前后对比引人唏嘘

出狱后的雷政富沧桑感袭面而来,前后对比引人唏嘘

霹雳炮
2026-03-14 22:49:47
法拉利发布F1日本大奖赛海报,画风帅气但“铃鹿”拼错了

法拉利发布F1日本大奖赛海报,画风帅气但“铃鹿”拼错了

懂球帝
2026-03-26 16:09:08
2026-03-26 23:16:49
量子位 incentive-icons
量子位
追踪人工智能动态
12348文章数 176425关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
亲子
游戏
公开课
军事航空

数码要闻

Intel IBOT加速技术揭秘!硬件不变 白嫖22%游戏性能

亲子要闻

你好,我是馒头,快开门!

50万销量达成!这款IGN 9分独游走红 官方发推庆贺

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版