网易首页 > 网易号 > 正文 申请入驻

ollama v0.12.2 版本更新详解:Qwen3 架构支持、Multi-Regex 分词器、新引擎前后缀匹配等功能升级

0
分享至


2025 年 9 月 25 日,Ollama 发布了v0.12.2版本,这是一次对底层引擎和模型支持进行重要优化的更新。该版本不仅提升了对Qwen3架构(包括 MoE 混合专家模型)的运行支持,还在分词器、内置工具渲染、张量加载等方面做出重大调整。本文将详细解析本次更新的技术细节和影响。

一、核心更新摘要

  1. 1.Qwen3 架构模型(含 MoE)切换到 Ollama 新引擎运行

  • • 新引擎更好地支持 Qwen3 系列权重加载与推理,包括 Qwen3-MoE(混合专家)模型。

  • • 推理性能、兼容性的提升,对未来更多模型加载是关键一步。

2.修复 gpt-oss 内置工具渲染问题

  • • 在聊天输出中,某些内置工具(如浏览器、Python)名称被意外重命名,导致识别异常。

  • • v0.12.2 中明确了“内置函数不重命名”逻辑,保障工具调用的一致性。

3.支持 Multi-Regex 分词器(Multi-Regex pretokenizers)

  • • BytePairEncoding(BPE)分词器支持传入多个 regex 模式,实现复杂的分词规则组合。

  • • 例如同时针对数字、中文、符号进行独立匹配,提升多语言处理精度。

4.新引擎支持张量名前缀(pre:)与后缀(suf:)匹配加载

  • • 允许模型权重 Tag 中指定前缀/后缀,以便灵活组合子张量名称。

  • • 对复杂网络层结构(如 shexp、b 前缀)有更好的权重绑定能力。

二、分词器(BytePairEncoding)重大调整

此前的NewBytePairEncoding方法只接受一个 regex 作为预分词器,这在实际应用中不足以应对多语言和特殊字符的组合处理。本次更新:
.

func NewBytePairEncoding(vocab *Vocabulary, pretokenizers ...string) BytePairEncoding

关键变化:

  • • 支持多正则表达式数组,依次分割文本。

  • • 默认预分词器覆盖缩写、字母、数字、符号、空格等典型模式。

  • • 新增split()实现链式 regex 切分,确保各类特殊序列被精确识别。

测试示例:

  • 默认模式Hello, WORLD!! How's it going? 123 一二三

  • Unicode模式:单独匹配中文字符[一-龥],数字分割为整体或单个数字。

  • 数码逐位模式:将123切为1,2,3

这意味着 Ollama 在文本预处理环节获得更高的灵活度,尤其在多语言 NLP 场景中表现更佳。

三、Tag 系统优化:前缀/后缀匹配

模型权重文件在加载时通常通过 Tag 名匹配张量,v0.12.2 新增了pre:suf:标签支持:
.

type Tag struct {     name         string     prefix       string     suffix       string     alternatives []string }

功能说明:

  • pre:指定在张量名匹配前插入的前缀,例如b_

  • suf:指定附加到张量名的后缀,例如_c

  • • 支持alt:提供备用名称,并在无主名时自动提升为主名。

应用场景:
例如,模型结构中有以下权重名:
.

blk.0.a.weight blk.0.b_weight blk.0.weight_c blk.0.x_weight_y

通过 Tag 配置可以快速映射到对应结构体字段,减少硬编码。

四、内置工具不重命名

在 Harmony 解析器中,确认以下内置工具名称保持原样:
.

browser.open browser.search browser.find python

这解决了 v0.12.1 中用户报告的调用工具名被改写问题,确保工具调用的稳定性和兼容性,尤其是与外部插件交互时。

五、各模型加载代码调整

为了适配 Multi-Regex 方案和新引擎,本次更新重构了多个模型的加载方法,包括:

  • • llama / llama4 系列

  • • mistral3

  • • mllama

  • • qwen2、qwen25vl、qwen3
    所有这些模型均由单一 regex pretokenizer 改为可以传入多条 regex,提升可扩展性。

六、开发者影响与升级建议

对模型作者:

  • • 通过在 GGUF 标签中添加pre:/suf:,可以更精准地映射复杂张量名。

  • • 使用多 regex 分词能显著提升非英文文本的处理效果。

对推理系统维护者:

  • • 新引擎对 Qwen3 MoE 支持,意味着可以在 Ollama 中稳定部署混合专家模型。

  • • 内置工具不重命名修正,提升与工具 API 对接的稳定性。

七、总结

ollama v0.12.2是一次针对核心引擎、分词器、模型加载逻辑的全面升级,尤其是:

  • 新引擎全面支持 Qwen3 MoE

  • 多 Regex 分词器

  • Tag 前后缀功能

  • 内置工具渲染修复

这些改动不仅提升了模型运行的稳定性和灵活性,也为未来多语言 NLP 和复杂模型加载奠定了基础。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
莫迪目睹!印度议员当场拆iPhone,震惊全场的真相曝光!

莫迪目睹!印度议员当场拆iPhone,震惊全场的真相曝光!

丹徒生
2025-11-02 07:57:35
《澎湖海战》争议的不是历史

《澎湖海战》争议的不是历史

求实处
2025-11-01 21:15:02
上海63岁儿子与94岁父亲一起居家养老:父亲负责买菜做饭,“除了吃饭各做各的”

上海63岁儿子与94岁父亲一起居家养老:父亲负责买菜做饭,“除了吃饭各做各的”

黄河新闻网吕梁频道
2025-11-01 09:19:32
感觉刘强东已经掌控不住奶茶了奶茶的情商、气场都太强了

感觉刘强东已经掌控不住奶茶了奶茶的情商、气场都太强了

乡野小珥
2025-11-02 15:25:51
玩笑开大了:俄将军们向普京承诺在 11 月1日前攻克乌军前线落空

玩笑开大了:俄将军们向普京承诺在 11 月1日前攻克乌军前线落空

火星宏观
2025-11-01 14:03:15
又一家电巨头官宣造车!夏普联合富士康推出首款纯电MPV,计划于2027年上市

又一家电巨头官宣造车!夏普联合富士康推出首款纯电MPV,计划于2027年上市

红星资本局
2025-11-01 20:51:08
奚梦瑶全家在迪士尼!女儿正脸曝光鼻子有点塌,保姆保镖时刻跟着

奚梦瑶全家在迪士尼!女儿正脸曝光鼻子有点塌,保姆保镖时刻跟着

仙味少女心
2025-11-01 18:17:22
91年我在医院照顾舅舅,顺便帮了邻床大叔,后来才发现他身份特殊

91年我在医院照顾舅舅,顺便帮了邻床大叔,后来才发现他身份特殊

燕无衣
2024-10-05 07:42:26
斯诺克国锦赛:赵心童、肖国栋顺利晋级,奥沙利文6-5绝杀

斯诺克国锦赛:赵心童、肖国栋顺利晋级,奥沙利文6-5绝杀

懂球帝
2025-11-02 18:45:07
牛鬼蛇神现原形!刘欢女儿大婚不到24小时,恶心的一幕出现了

牛鬼蛇神现原形!刘欢女儿大婚不到24小时,恶心的一幕出现了

牛牛叨史
2025-10-31 14:32:11
果然,见完中方,高市早苗连续2天会见台独,外交部的回应不简单

果然,见完中方,高市早苗连续2天会见台独,外交部的回应不简单

林子说事
2025-11-02 05:56:22
翩翩起舞的小姐姐,黑色瑜伽裤一穿身材好到犯规,时尚感直接拉满

翩翩起舞的小姐姐,黑色瑜伽裤一穿身材好到犯规,时尚感直接拉满

小乔古装汉服
2025-11-01 18:52:37
警惕!广东某广场现“马戏团”团队,把人吸引过来后开始推销药酒…

警惕!广东某广场现“马戏团”团队,把人吸引过来后开始推销药酒…

广东活动
2025-11-02 12:06:45
港星冯淬帆去世,无儿无女无人送终!晚年因一个举动口碑暴跌

港星冯淬帆去世,无儿无女无人送终!晚年因一个举动口碑暴跌

史行途
2025-11-01 12:26:21
你做过最疯狂的事是什么?网友:在公园亲了一小时

你做过最疯狂的事是什么?网友:在公园亲了一小时

解读热点事件
2025-10-11 00:20:03
我妈53岁没一根白发!吃了20年的早餐方子,气血足到素颜发光

我妈53岁没一根白发!吃了20年的早餐方子,气血足到素颜发光

男女那点事儿儿
2025-11-01 14:43:04
初三学生被霸凌者打断肋骨,母亲不去派出所,隔天校园来六辆商务车

初三学生被霸凌者打断肋骨,母亲不去派出所,隔天校园来六辆商务车

悬案解密档案
2025-10-21 09:24:49
安世中国:已建立充足的成品与在制品库存 能够稳定、持续地满足广大客户直至年底乃至更长时间的订单需求

安世中国:已建立充足的成品与在制品库存 能够稳定、持续地满足广大客户直至年底乃至更长时间的订单需求

财联社
2025-11-02 07:34:06
应急管理部副部长、水利部副部长王道席,出任湖南省委常委

应急管理部副部长、水利部副部长王道席,出任湖南省委常委

澎湃新闻
2025-11-02 19:06:31
2025佛山市环两江马拉松取消公告

2025佛山市环两江马拉松取消公告

珠江时报
2025-11-02 18:14:06
2025-11-02 19:39:00
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1019文章数 49关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

19岁男生被邻居驾车故意撞死 事发时再过几天就要高考

头条要闻

19岁男生被邻居驾车故意撞死 事发时再过几天就要高考

体育要闻

这个日本人,凭啥值3.25亿美元?

娱乐要闻

陈道明被王家卫说他是阴阳同体的极品

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

艺术
时尚
房产
健康
军事航空

艺术要闻

她被誉为东方梦露,年过半百依然迷倒众生

推广|| 每天都在穿!这件外套,轻松搞定秋冬所有搭配

房产要闻

中粮(三亚)国贸中心ITC首期自贸港政策沙龙圆满举行

核磁VS肌骨超声,谁更胜一筹?

军事要闻

俄在日本海演习击沉假想敌潜艇

无障碍浏览 进入关怀版