网易首页 > 网易号 > 正文 申请入驻

ollama v0.12.2 版本更新详解:Qwen3 架构支持、Multi-Regex 分词器、新引擎前后缀匹配等功能升级

0
分享至


2025 年 9 月 25 日,Ollama 发布了v0.12.2版本,这是一次对底层引擎和模型支持进行重要优化的更新。该版本不仅提升了对Qwen3架构(包括 MoE 混合专家模型)的运行支持,还在分词器、内置工具渲染、张量加载等方面做出重大调整。本文将详细解析本次更新的技术细节和影响。

一、核心更新摘要

  1. 1.Qwen3 架构模型(含 MoE)切换到 Ollama 新引擎运行

  • • 新引擎更好地支持 Qwen3 系列权重加载与推理,包括 Qwen3-MoE(混合专家)模型。

  • • 推理性能、兼容性的提升,对未来更多模型加载是关键一步。

2.修复 gpt-oss 内置工具渲染问题

  • • 在聊天输出中,某些内置工具(如浏览器、Python)名称被意外重命名,导致识别异常。

  • • v0.12.2 中明确了“内置函数不重命名”逻辑,保障工具调用的一致性。

3.支持 Multi-Regex 分词器(Multi-Regex pretokenizers)

  • • BytePairEncoding(BPE)分词器支持传入多个 regex 模式,实现复杂的分词规则组合。

  • • 例如同时针对数字、中文、符号进行独立匹配,提升多语言处理精度。

4.新引擎支持张量名前缀(pre:)与后缀(suf:)匹配加载

  • • 允许模型权重 Tag 中指定前缀/后缀,以便灵活组合子张量名称。

  • • 对复杂网络层结构(如 shexp、b 前缀)有更好的权重绑定能力。

二、分词器(BytePairEncoding)重大调整

此前的NewBytePairEncoding方法只接受一个 regex 作为预分词器,这在实际应用中不足以应对多语言和特殊字符的组合处理。本次更新:
.

func NewBytePairEncoding(vocab *Vocabulary, pretokenizers ...string) BytePairEncoding

关键变化:

  • • 支持多正则表达式数组,依次分割文本。

  • • 默认预分词器覆盖缩写、字母、数字、符号、空格等典型模式。

  • • 新增split()实现链式 regex 切分,确保各类特殊序列被精确识别。

测试示例:

  • 默认模式Hello, WORLD!! How's it going? 123 一二三

  • Unicode模式:单独匹配中文字符[一-龥],数字分割为整体或单个数字。

  • 数码逐位模式:将123切为1,2,3

这意味着 Ollama 在文本预处理环节获得更高的灵活度,尤其在多语言 NLP 场景中表现更佳。

三、Tag 系统优化:前缀/后缀匹配

模型权重文件在加载时通常通过 Tag 名匹配张量,v0.12.2 新增了pre:suf:标签支持:
.

type Tag struct {     name         string     prefix       string     suffix       string     alternatives []string }

功能说明:

  • pre:指定在张量名匹配前插入的前缀,例如b_

  • suf:指定附加到张量名的后缀,例如_c

  • • 支持alt:提供备用名称,并在无主名时自动提升为主名。

应用场景:
例如,模型结构中有以下权重名:
.

blk.0.a.weight blk.0.b_weight blk.0.weight_c blk.0.x_weight_y

通过 Tag 配置可以快速映射到对应结构体字段,减少硬编码。

四、内置工具不重命名

在 Harmony 解析器中,确认以下内置工具名称保持原样:
.

browser.open browser.search browser.find python

这解决了 v0.12.1 中用户报告的调用工具名被改写问题,确保工具调用的稳定性和兼容性,尤其是与外部插件交互时。

五、各模型加载代码调整

为了适配 Multi-Regex 方案和新引擎,本次更新重构了多个模型的加载方法,包括:

  • • llama / llama4 系列

  • • mistral3

  • • mllama

  • • qwen2、qwen25vl、qwen3
    所有这些模型均由单一 regex pretokenizer 改为可以传入多条 regex,提升可扩展性。

六、开发者影响与升级建议

对模型作者:

  • • 通过在 GGUF 标签中添加pre:/suf:,可以更精准地映射复杂张量名。

  • • 使用多 regex 分词能显著提升非英文文本的处理效果。

对推理系统维护者:

  • • 新引擎对 Qwen3 MoE 支持,意味着可以在 Ollama 中稳定部署混合专家模型。

  • • 内置工具不重命名修正,提升与工具 API 对接的稳定性。

七、总结

ollama v0.12.2是一次针对核心引擎、分词器、模型加载逻辑的全面升级,尤其是:

  • 新引擎全面支持 Qwen3 MoE

  • 多 Regex 分词器

  • Tag 前后缀功能

  • 内置工具渲染修复

这些改动不仅提升了模型运行的稳定性和灵活性,也为未来多语言 NLP 和复杂模型加载奠定了基础。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
A股每年炒作都有一套固定规律,主力已经玩了30年。

A股每年炒作都有一套固定规律,主力已经玩了30年。

流苏晚晴
2026-02-25 18:08:17
恒大到底如何亏出八千亿的?终于搞懂了!许家印不跑是有原因的!

恒大到底如何亏出八千亿的?终于搞懂了!许家印不跑是有原因的!

历史伟人录
2026-02-25 18:17:16
女子返程被堵高速,发现20多辆私家车占用应急车道行驶,花半小时挨个拍照举报,当事人发声;交警回应:处理中

女子返程被堵高速,发现20多辆私家车占用应急车道行驶,花半小时挨个拍照举报,当事人发声;交警回应:处理中

扬子晚报
2026-02-24 16:27:31
宝马车顶载21只鸡鸭鹅开800公里返程 一路被网友拍下 当事人:都是爷爷奶奶特意准备的

宝马车顶载21只鸡鸭鹅开800公里返程 一路被网友拍下 当事人:都是爷爷奶奶特意准备的

闪电新闻
2026-02-25 17:21:14
回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

回顾“91女神”琪琪:五官出众,却因天真让自己“受伤”

就一点
2025-11-22 10:36:39
勇士爆冷惜败鹈鹕:梅尔顿28分赛季新高 锡安26+6穆雷赛季首秀

勇士爆冷惜败鹈鹕:梅尔顿28分赛季新高 锡安26+6穆雷赛季首秀

醉卧浮生
2026-02-25 11:34:46
中国50后还有多少人?多少人能活到80岁?权威数据告诉你

中国50后还有多少人?多少人能活到80岁?权威数据告诉你

芭比衣橱
2026-02-19 21:00:42
一路走好!2026春节才过7天,已有6位大佬离世,最年轻的才40岁

一路走好!2026春节才过7天,已有6位大佬离世,最年轻的才40岁

鲸探所长
2026-02-24 19:34:36
广州,有雷又有雨!连续一周

广州,有雷又有雨!连续一周

广州生活美食圈
2026-02-25 12:32:38
美国记者批谷爱凌傲慢,TNT著名主持回击:凭什么要对成就故作谦虚

美国记者批谷爱凌傲慢,TNT著名主持回击:凭什么要对成就故作谦虚

砚底沉香
2026-02-25 21:18:04
金价,彻底沸了!

金价,彻底沸了!

天津人
2026-02-25 12:00:10
网传被判赔小米500万元的自媒体账号实控人为李斌,相关人士否认

网传被判赔小米500万元的自媒体账号实控人为李斌,相关人士否认

IT之家
2026-02-25 20:14:13
爱泼斯坦专机腐烂曝光:婴儿油混着霉斑,这张大床曾藏多少罪恶?

爱泼斯坦专机腐烂曝光:婴儿油混着霉斑,这张大床曾藏多少罪恶?

眼界看视野
2026-02-25 20:55:30
谷爱凌外婆冯国珍走了,交通部一封感谢信,信息量巨大!

谷爱凌外婆冯国珍走了,交通部一封感谢信,信息量巨大!

达文西看世界
2026-02-25 19:39:16
国家正式公布:3月30日起,全国统一执行,老坟有新规定

国家正式公布:3月30日起,全国统一执行,老坟有新规定

老特有话说
2026-02-24 23:23:24
人在工位,南京小吃店都开门了吗?

人在工位,南京小吃店都开门了吗?

南京有个号
2026-02-24 14:41:24
国乒混双辉煌被彻底终结,背后离不开王励勤的战略调整:拔苗助长

国乒混双辉煌被彻底终结,背后离不开王励勤的战略调整:拔苗助长

杨哥乒乓
2026-02-25 23:17:41
烧光10亿,下载暴跌!腾讯元宝,输惨了!

烧光10亿,下载暴跌!腾讯元宝,输惨了!

功夫财经
2026-02-25 08:57:30
逛公园要先付69元拍照费?深圳一免费公园现收费“园中园”引质疑

逛公园要先付69元拍照费?深圳一免费公园现收费“园中园”引质疑

深圳晚报
2026-02-25 12:16:54
杨某(男,46岁)被抓获,移交上海警方!还有人开价15万元打包干这事儿

杨某(男,46岁)被抓获,移交上海警方!还有人开价15万元打包干这事儿

新民晚报
2026-02-25 10:34:02
2026-02-25 23:51:00
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1135文章数 58关注度
往期回顾 全部

科技要闻

“机器人只跳舞,没什么用”

头条要闻

女子爬山失联10天后遗体被找到 丈夫:她登顶神情恐惧

头条要闻

女子爬山失联10天后遗体被找到 丈夫:她登顶神情恐惧

体育要闻

勇士爆冷惜败鹈鹕 梅尔顿28分赛季新高

娱乐要闻

黄晓明新恋情!与小22岁美女同游新加坡

财经要闻

上海楼市放大招,地产预期别太大

汽车要闻

750km超长续航 2026款小鹏X9纯电版将于3月2日上市

态度原创

教育
房产
家居
公开课
军事航空

教育要闻

教育部:将严查挤占体育课、课间不准学生出教室等行为

房产要闻

海南楼市春节热销地图曝光!三亚、陵水又杀疯了!

家居要闻

艺居办公 温度与效率

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

俄乌冲突四周年:和平谈判希望渺茫

无障碍浏览 进入关怀版