网易首页 > 网易号 > 正文 申请入驻

JetBrains开源12B代码模型,专治“断网”部署焦虑

0
分享至

如果你所在的团队因为合规要求,所有代码都不能流出公司机房,那些火热的云端AI编程助手就一下子全成了摆设。JetBrains本周把Mellum 2放上了Apache 2.0许可,目标明确指向这类场景——完全自托管,推理全程不经过任何外部应用程序接口。这款120亿参数模型被他们称为“焦点模型”,不做通用对话里的全能选手,只做工程师每天最频繁调用那些活:子代理调度、检索管线里的上下文压缩,还有高频补全。

JetBrains在官方博客里给了一个清晰的定位:“前沿模型会不断冲击极限,但实用的AI产品还需要‘焦点模型’——快速、专用,能高效吃掉高频任务。”这句话背后是一个刻意收窄的训练思路。他们没有去追赶百科全书式的覆盖,而是把训练数据集中倾斜到代码和开发者文档上。所以看基准跑分,Mellum 2在通用推理项目GPQA Diamond和MMLU-Redux上依旧打不过通义千问3.5-9B,但JetBrains自己大方承认了:“这个差距反映了一种刻意的取舍,我们选择的就是代码而不是通识。”对于想用AI接管软件工程流水线的团队来说,要的就是这种取舍。

模型架构走的是混合专家路线,120亿参数虽大,但每个令牌只激活25亿参数,在64个专家中动态路由子集。这让它在吞吐上玩出了很有意思的数据:单请求模式下,一张H100上每秒跑192个令牌,跟Qwen2.5-7B的193几乎持平;一旦压上并发负载,立刻比Qwen2.5-7B快出21%,比Qwen3-8B快79%。在EvalPlus基准上,思考增强版本冲到78.4%,把Qwen3.5-9B的71.8%和Seed-Coder-8B的73.8%都甩在了身后。JetBrains同时放出了两个变体:一个指令版给直接回答,一个思考版会显式产出推理链,盯的是多步骤、代智体类任务——性能跟速度的账,都在那摆着。

最打动合规敏感团队的一点还不是跑分,而是“不靠别人”。Claude Code虽然能在本地跑,但推理调用终归要回Anthropic的服务器;OpenAI Codex类似,Cursor的能耐也绑在自家平台和xAI合作线上。这些工具都等于把每一次猜测交到别人的基础设施上。Mellum 2则全部开源权重,想怎么部署就怎么部署,对于有空气隔离需求的组织、需要严格核算大模型推理成本的团队来说,控制权这个事从来没有“过时”一说。

JetBrains这笔押注很直白:当AI嵌进工程工作流的每一层,部署的灵活度和运维的自主权只会越来越重,而不是越来越轻。最早的Mellum曾只是藏在IDE里做代码补全的40亿参数小模型,2024年底以专有形式发布,2025年4月才开源到Apache 2.0。而Mellum 2这次一上来就开源,一下子从“写完下一行代码”跳到了“帮你管好整个AI流水线”的角色里。对于正在评估工具怎么落地的你来说,这个模型至少提供了一个明确的选项——自己握着推理开关,总比永远仰赖外部应用程序接口多一分踏实。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
导弹铺天盖地,俄军创纪录发射,乌克兰被炸出绿光

导弹铺天盖地,俄军创纪录发射,乌克兰被炸出绿光

兵国大事
2026-06-02 22:09:15
绝境求生!广厦力克上海追至1-3,杨鸣赛后四句话精准复盘战局!

绝境求生!广厦力克上海追至1-3,杨鸣赛后四句话精准复盘战局!

田先生篮球
2026-06-02 23:04:57
一张斩首照,让澳洲全国暴怒:百万人报名参军,追杀到天涯海角

一张斩首照,让澳洲全国暴怒:百万人报名参军,追杀到天涯海角

凉州辞
2026-06-03 07:25:03
成都一汉庭酒店未按规定对顾客用品用具进行清洗、消毒、保洁,官方:停业整顿

成都一汉庭酒店未按规定对顾客用品用具进行清洗、消毒、保洁,官方:停业整顿

界面新闻
2026-06-03 11:18:07
伊能静狂砸7位数!飞韩国剪刘海花上万,发面馒头脸上都是真金白银

伊能静狂砸7位数!飞韩国剪刘海花上万,发面馒头脸上都是真金白银

八卦王者
2026-06-02 15:55:47
强烈建议普通家庭还是老老实实买燃油车,先不要碰新能源汽车

强烈建议普通家庭还是老老实实买燃油车,先不要碰新能源汽车

小怪吃美食
2026-06-03 17:13:24
耿同学被dy永久限流,正能量博主扣帽子: 过往发了很多逆天言论

耿同学被dy永久限流,正能量博主扣帽子: 过往发了很多逆天言论

读鬼笔记
2026-06-03 20:16:29
历史重演了!19年前乔布斯颠覆了手机,昨天黄仁勋颠覆了电脑软件

历史重演了!19年前乔布斯颠覆了手机,昨天黄仁勋颠覆了电脑软件

哄动一时啊
2026-06-03 12:00:25
高盛将中国台湾地区股市评级上调至超配

高盛将中国台湾地区股市评级上调至超配

财联社
2026-06-03 10:57:04
留洋机会浮现!德甲球队紧盯王钰栋,国足新星面临关键抉择!

留洋机会浮现!德甲球队紧盯王钰栋,国足新星面临关键抉择!

田先生篮球
2026-06-03 21:45:57
梁安琪妈妈罕现身,八十多岁依旧雍容华贵,和四太长得很像!

梁安琪妈妈罕现身,八十多岁依旧雍容华贵,和四太长得很像!

翰飞观事
2026-06-03 10:11:29
库里兄弟欧洲度假,一个赚5亿,一个赚0.5亿,老婆都很漂亮

库里兄弟欧洲度假,一个赚5亿,一个赚0.5亿,老婆都很漂亮

大西体育
2026-06-03 11:01:56
梁安琪妈妈罕现身,八十多岁依旧雍容华贵,和四太长得很像

梁安琪妈妈罕现身,八十多岁依旧雍容华贵,和四太长得很像

草莓解说体育
2026-06-02 05:34:14
美国洛马拒缴中国990亿罚单,后果严重超预期

美国洛马拒缴中国990亿罚单,后果严重超预期

原来仙女不讲理
2026-06-03 11:55:28
中国男篮等来了!留洋内线确定归队,郭士强的双塔计划要启动了

中国男篮等来了!留洋内线确定归队,郭士强的双塔计划要启动了

酷侃体坛
2026-06-03 22:21:05
彻底炸锅!儿媳月子里喂奶,公公5次闯入房间,最终爆发家庭矛盾

彻底炸锅!儿媳月子里喂奶,公公5次闯入房间,最终爆发家庭矛盾

火山詩话
2026-06-02 10:33:01
霍汶希现身深圳体验焕新极氪009 直言“堪比极品好车”

霍汶希现身深圳体验焕新极氪009 直言“堪比极品好车”

CNMO科技
2026-06-03 10:38:15
6月1日通车!上海网红沿海公路,限速60越慢越舒服

6月1日通车!上海网红沿海公路,限速60越慢越舒服

林子说事
2026-06-03 16:26:32
小宝与王某雷,谁探访花的数量更多?

小宝与王某雷,谁探访花的数量更多?

挪威森林
2026-01-31 12:15:26
张成渊任福建省自然资源厅副厅长

张成渊任福建省自然资源厅副厅长

人民资讯
2026-06-03 19:51:04
2026-06-03 23:48:49
固件更新中
固件更新中
有态度网友ytd
5498文章数 45关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

游戏
本地
时尚
教育
公开课

LPL决赛门票开售2分钟秒空,前后差距太大!网友:谁说LPL凉了?

本地新闻

用杨柳青年画的方式,打开天津

月经、初潮与生育真相,那些藏在动画片里的性启蒙

教育要闻

高考减少45万人|“带入考场即构成作弊”!高考安检新变化,多地提醒

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版