网易首页 > 网易号 > 正文 申请入驻

ollama v0.12.3 最新版本详解:新模型、功能修复与深度技术更新

0
分享至


发布时间:
预发布:2025年9月26日
正式发布:2025年9月27日

一、版本亮点概述

ollama v0.12.3中,官方带来了两款重量级新模型,并针对此前版本的多项功能问题进行了修复与优化,同时还引入了新的模型架构实现及更健壮的解析逻辑。

本次更新的核心变化主要包括:

  • • 新增DeepSeek-V3.1-Terminus混合模型

  • • 新增Kimi-K2-Instruct-0905MoE 模型

  • • 改进工具调用参数解析与 CLI 登录流程

  • • 修复 qwen3-coder 的 Unicode 解析问题

  • • 优化/load模型加载失败的回滚处理

  • • 新增DeepSeek2模型实现

  • • 加强流式解析的多语言与 Emoji 支持

二、新增模型介绍 1. DeepSeek-V3.1-Terminus
  • • 混合架构,支持思考模式非思考模式

  • • 比上一版本在各类基准测试中输出更加稳定可靠

  • • 两种运行方式:

    • • 云端运行:
      .

ollama run deepseek-v3.1:671b-cloud
  • • 本地运行(需 500GB+ 显存):
    .

ollama run deepseek-v3.1
2. Kimi-K2-Instruct-0905
  • • 最新且最强大的 Kimi K2 系列版本

  • MoE(混合专家模型)架构

  • • 启用参数:32B

  • • 总参数量:1T

  • • 云端运行方式:
    .

ollama run kimi-k2:1t-cloud
三、功能修复与改进 1. 工具调用参数解析

修复了某些情况下工具调用参数以字符串化 JSON形式传递时未正确解析的问题,保障了调用数据的可用性。

2. CLI 登录体验优化

ollama push命令在推送模型时,若需要登录,将直接提供可点击的 URL,方便设备进行登录操作。

3. Unicode 输出问题修复

针对qwen3-coder模型,修复了其输出时Unicode 字符编码错误的问题,包括 emoji、阿拉伯文等多语言场景。

4. 模型加载回退机制

在交互模式下,当使用/load加载模型失败(如模型未找到)时,会自动恢复之前的运行参数runOptions,避免交互会话状态丢失。

四、技术实现细节 1. DeepSeek2 模型实现

  • • 基于DeepSeek 2架构,但参考了DeepSeek 3的设计理念

  • • 支持稀疏 MoE密集 MLP混合网络结构

  • • 引入RoPE(旋转位置编码)多参调整机制

  • • 完整实现注意力机制专家路由与加权BPE 分词器等模块

  • • 支持多语言分词,包括中文、日文、符号等

2. runOptions 拷贝功能增强

新增Copy()方法实现深浅拷贝混合逻辑,确保:

  • MessagesImagesOptions等可变结构深拷贝

  • • 指针类型如KeepAlive保持浅拷贝(共享引用)

  • Think对象新建副本,避免思考模式状态污染
    并提供多组单元测试验证:

  • • 数据一致性

  • • 空值与空集合保持原样

  • • 修改原始对象不影响副本

3. qwen3-coder Unicode 解析优化
  • • 新增基于utf8.DecodeLastRuneInString的末尾空白字符统计逻辑

  • • 正确处理多语言字符、emoji、阿拉伯文、非断行空格等场景

  • • 流式解析测试案例覆盖:

    • • Emoji 原样保留

    • • 阿拉伯文本连续性

    • • 中文、英文混合段落

    • • 非断行空格跨数据块保留

五、测试增强
  • • 为PushHandler增加多种登录与权限测试场景

  • • runOptions 的拷贝方法增加空、非空多组合测试

  • • qwen3-coder 流式解析新增 unicode/emoji 的精细化测试用例

六、ROCm 兼容性修复

本次更新修复了 ROCm 6.4 ~ 7.0 Docker 运行失败的问题,新增必要库依赖:

  • libroctx64.so.4

  • librocroller.so.1

七、总结

ollama v0.12.3不仅带来了两款高性能的新模型,还从 CLI 用户体验、模型解析准确性、容错回退机制等多个方面进行了优化,同时引入了新的 DeepSeek2 架构实现与 Unicode 流式解析支持,使得多语言场景处理更加稳定。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这两个新闻放一起看,讽刺得让人无话可说

这两个新闻放一起看,讽刺得让人无话可说

清书先生
2025-11-12 15:55:46
何立峰会见美中关系全国委员会负责人时指出  中美双方应共同维护好、落实好元首会晤重要共识和成果,推动中美经贸关系稳定发展

何立峰会见美中关系全国委员会负责人时指出  中美双方应共同维护好、落实好元首会晤重要共识和成果,推动中美经贸关系稳定发展

新华社
2025-11-12 22:08:01
连连数字(02598.HK)宣布管理层人事任命:章征宇2026年3月正式接任首席执行官 带领公司迈入技术驱动新时代

连连数字(02598.HK)宣布管理层人事任命:章征宇2026年3月正式接任首席执行官 带领公司迈入技术驱动新时代

时代投研
2025-11-12 11:24:06
日本出现内讧!高市早苗向中国做承诺,台当局:有一事,奉劝大陆

日本出现内讧!高市早苗向中国做承诺,台当局:有一事,奉劝大陆

健身狂人
2025-11-12 14:23:11
远离“造神陷阱”,这一次,返台遭围剿的馆长,给所有网红提了醒

远离“造神陷阱”,这一次,返台遭围剿的馆长,给所有网红提了醒

洲洲影视娱评
2025-11-12 15:58:05
罕见!央媒对高市早苗火力全开,骂得相当难听,奉劝她别满嘴喷粪

罕见!央媒对高市早苗火力全开,骂得相当难听,奉劝她别满嘴喷粪

时时有聊
2025-11-12 20:45:52
高市早苗通知全球,不撤回涉台言论,话音刚落,解放军攻击11亮相

高市早苗通知全球,不撤回涉台言论,话音刚落,解放军攻击11亮相

大白话瞰世界
2025-11-12 13:26:25
香港一对兄弟被发现陈尸家中!初查死因令人唏嘘

香港一对兄弟被发现陈尸家中!初查死因令人唏嘘

看看新闻Knews
2025-11-12 14:56:02
小天才灰色产业链曝光:点赞50万账号卖500元,有学生每天花6小时养号

小天才灰色产业链曝光:点赞50万账号卖500元,有学生每天花6小时养号

南国今报
2025-11-12 23:18:04
高市早苗凌晨3点开会,原因让官员“惊掉下巴”

高市早苗凌晨3点开会,原因让官员“惊掉下巴”

鲁中晨报
2025-11-12 10:11:03
高市早苗涉台言论后,急盼美国支持,特朗普:日本也不算美国朋友

高市早苗涉台言论后,急盼美国支持,特朗普:日本也不算美国朋友

临云史策
2025-11-11 22:00:26
套路太深!知名软件被指看人下菜,你的电脑正沦为“提款机”

套路太深!知名软件被指看人下菜,你的电脑正沦为“提款机”

电脑报
2025-11-12 17:30:28
请神容易送神难!有一说一,现役NBA最无交易市场的5大巨星如下

请神容易送神难!有一说一,现役NBA最无交易市场的5大巨星如下

毒舌NBA
2025-11-12 14:45:50
泪目,C罗重磅官宣41岁告别世界杯,1.83亿年薪也难弥补毕生遗憾

泪目,C罗重磅官宣41岁告别世界杯,1.83亿年薪也难弥补毕生遗憾

削桐作琴
2025-11-12 18:25:46
尘埃落定!曾医生事件处理结果公布,“撤职留岗”引发舆论两极化

尘埃落定!曾医生事件处理结果公布,“撤职留岗”引发舆论两极化

史行途
2025-11-12 17:10:24
疯传!大批媒体曝:吴亦凡监狱中绝食死亡?

疯传!大批媒体曝:吴亦凡监狱中绝食死亡?

澳洲红领巾
2025-11-11 11:25:36
李连杰 “换心” 惹争议!向太披露内幕,“一夜回春” 原因曝光

李连杰 “换心” 惹争议!向太披露内幕,“一夜回春” 原因曝光

白面书誏
2025-11-12 22:35:37
高市支持率82%,薛领事被围攻,日防卫省称先发制人,特朗普发声

高市支持率82%,薛领事被围攻,日防卫省称先发制人,特朗普发声

科普100克克
2025-11-12 06:11:34
夏洛特公主新照:10岁身高1米6,腿形超美,温莎优越基因都归她了

夏洛特公主新照:10岁身高1米6,腿形超美,温莎优越基因都归她了

夜深爱杂谈
2025-11-12 23:25:16
撞倒3小孩后先扶车,苏州女骑警技能失误的背后更是责任意识的缺失

撞倒3小孩后先扶车,苏州女骑警技能失误的背后更是责任意识的缺失

少爷写春秋
2025-11-12 00:04:28
2025-11-13 03:28:49
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1032文章数 51关注度
往期回顾 全部

科技要闻

前阿里人亲述: “经济上行”期双11什么样

头条要闻

涉赌诈头目佘智江被引渡回中国 涉案资金超2.7万亿元

头条要闻

涉赌诈头目佘智江被引渡回中国 涉案资金超2.7万亿元

体育要闻

消磨你上千小时的足球游戏,走过第20年

娱乐要闻

再王珞丹和白百何 明白两人"差别"在哪

财经要闻

段永平最新访谈:聊企业经营 投资理念

汽车要闻

7座皆独立座椅/新增5座版 体验第三代吉利豪越L

态度原创

教育
艺术
本地
家居
公开课

教育要闻

人民网专访!陈经纶中学校长独家揭秘

艺术要闻

春色满园,惊艳美女写真让你目不转睛!

本地新闻

云游安徽 | 凌滩玉魄淬千年,诗意钢城马鞍山

家居要闻

情感之所 生活教会设计

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版