网易首页 > 网易号 > 正文 申请入驻

ollama v0.12.6 更新详解:搜索支持、性能优化与 Vulkan 实验性支持

0
分享至


一、版本发布时间

  • • 预发布日期:2025 年 10 月 15 日

  • • 正式发布日期:2025 年 10 月 17 日

二、主要更新内容
  1. 1.模型搜索功能扩展

  • • 在运行 DeepSeek-V3.1、Qwen3 等支持工具调用的模型时,Ollama 应用现在支持搜索功能,大幅提升了模型交互和数据检索效率。

2.性能优化

  • • 对 Gemma 3 模型默认启用 Flash Attention,提高了推理性能并优化了内存使用率。

  • • 修复了生成响应过程中偶发的卡死问题。

  • • 改进了模型驱逐逻辑,当num_gpu参数设置时能够正确清理未使用模型。

3.模型相关修复与改进

  • • 修复了 Qwen3-Coder 在使用/api/generateollama run qwen3-coder 时进入原始模式的问题。

  • • 修复了 Qwen3-Embedding 返回无效结果的情况。

  • • 修复了tool_index值为 0 时未正确传递给模型的问题。

  • • Qwen3-Coder 增加了在解析工具调用时对anyOf的支持。

4.Vulkan 实验性支持

  • • 新增本地构建时的 Vulkan 实验性支持,允许运行在目前不支持的 AMD 和 Intel GPU 上,为更广泛的硬件环境提供可能性。

  • • 构建步骤:安装 Vulkan SDK,并在环境变量中设置VULKAN_SDK,然后按照开发者指南进行本地编译。未来版本将会把 Vulkan 支持集成到二进制发行版中。

5.其他改进

  • • NVML 实现支持 Linux 系统。

  • • 增加 NVML 对统一内存 GPU 的降级支持。

  • • 改进 CUDA 对 iGPU 调度的性能。

  • • 默认连接到ollama.com时使用端口 443。

  • • 重新启用 CUDA CC 5.2 支持。

6.Bug 修复

  • • 修复日志中错误显示 “0 MiB free” 的问题。

  • • 修复部分 API 生成器在渲染时的内置渲染器问题。

  • • 修复文件系统与 ggml 中的注释函数名错误。

  • • 修复 Qwen3 模型的 distill 问题。

三、总结

Ollama v0.12.6 是一次以功能增强与性能优化为核心的更新版本,尤其在模型搜索、Flash Attention 默认开启以及 Vulkan 实验性支持方面为用户带来了更高的运行效率与更广的硬件兼容性。同时,一系列针对 Qwen3 系列模型和 GPU 支持的修正,让该版本更加稳定、适用范围更广。对于开发者而言,本次更新不仅改善了现有工作流程,还为未来硬件适配提供了新的可能。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
舅舅借走30万,7年不还,他儿子当兵政审那天,我一个电话打过去

舅舅借走30万,7年不还,他儿子当兵政审那天,我一个电话打过去

清茶浅谈
2025-10-13 12:51:38
欧美和日韩都没料到,如今在国际成为焦点的,竟然是中国的陕西省

欧美和日韩都没料到,如今在国际成为焦点的,竟然是中国的陕西省

八斗小先生
2025-11-04 10:51:31
东北大米产地广州被市民质疑 市监局:东北大米是一个品牌

东北大米产地广州被市民质疑 市监局:东北大米是一个品牌

闪电新闻
2025-11-04 12:42:33
央视提醒:免疫力是最好的医生,用8个方法激活它

央视提醒:免疫力是最好的医生,用8个方法激活它

诗词中国
2025-11-03 21:30:33
尼日尔撕毁4亿美元合同,驱逐中国高管,我方暗藏后手,给它狠狠教训

尼日尔撕毁4亿美元合同,驱逐中国高管,我方暗藏后手,给它狠狠教训

诡谲怪谈
2025-04-30 23:32:55
迷你罗助葡萄牙U16夺冠,乔治娜和C罗母亲现场见证

迷你罗助葡萄牙U16夺冠,乔治娜和C罗母亲现场见证

懂球帝
2025-11-05 03:05:14
小姐姐紫色连体瑜伽套装太绝,身材妆容双在线,尽显女神范

小姐姐紫色连体瑜伽套装太绝,身材妆容双在线,尽显女神范

小乔古装汉服
2025-11-04 16:49:09
又是首开记录,麦卡在欧冠最近两球都是对皇马打进的

又是首开记录,麦卡在欧冠最近两球都是对皇马打进的

懂球帝
2025-11-05 05:33:24
夺冠不到72小时,央视3次点名全红婵,释放2大信号,果然不简单

夺冠不到72小时,央视3次点名全红婵,释放2大信号,果然不简单

有范又有料
2025-11-04 15:20:52
马洛塔谈出售阿什拉夫:决定很艰难,但为了俱乐部不得不这样

马洛塔谈出售阿什拉夫:决定很艰难,但为了俱乐部不得不这样

懂球帝
2025-11-04 13:15:07
日本连开3枪,全方位反华?王毅开始上场,第一击就让日本老实了

日本连开3枪,全方位反华?王毅开始上场,第一击就让日本老实了

田园小归
2025-11-04 09:11:29
山姆评论区刷屏抵制背后:阿里高管为何触发800万会员的信任危机

山姆评论区刷屏抵制背后:阿里高管为何触发800万会员的信任危机

查查小喇叭
2025-11-04 14:29:15
爸爸去哪儿6孩子现状:子承父业、进国家队、国外读书,个个不同

爸爸去哪儿6孩子现状:子承父业、进国家队、国外读书,个个不同

书雁飞史oh
2025-11-04 17:26:59
特朗普已经不装了,直接对台湾“改口”,中国统一进入高速车道?

特朗普已经不装了,直接对台湾“改口”,中国统一进入高速车道?

李博世财经
2025-11-04 17:07:08
60亿日本动画内地定档,评分8.8,中国观众将助其超越《哪吒2》

60亿日本动画内地定档,评分8.8,中国观众将助其超越《哪吒2》

影视高原说
2025-11-03 18:56:47
那年,我受命去调查于幼军

那年,我受命去调查于幼军

霹雳炮
2025-11-02 19:38:51
乌克兰两名朝鲜战俘 向韩国“投诚” 开启新的生活

乌克兰两名朝鲜战俘 向韩国“投诚” 开启新的生活

原某报记者
2025-11-03 17:21:05
5款!华为Mate80 变化巨大,这新技术有点猛

5款!华为Mate80 变化巨大,这新技术有点猛

科技堡垒
2025-11-03 10:58:24
南非大选惊天逆转:腐败总统“王者归来”,30年执政神话破灭

南非大选惊天逆转:腐败总统“王者归来”,30年执政神话破灭

云上乌托邦
2025-11-04 17:15:48
这两天,上海满城都是!千万别乱吃,容易中毒,有人可能还会过敏窒息

这两天,上海满城都是!千万别乱吃,容易中毒,有人可能还会过敏窒息

新民晚报
2025-11-04 15:06:52
2025-11-05 05:59:00
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1023文章数 49关注度
往期回顾 全部

科技要闻

硅谷甄嬛传:奥特曼优雅挑衅马斯克狠狠回击

头条要闻

普京:俄罗斯对任何国家都不构成威胁

头条要闻

普京:俄罗斯对任何国家都不构成威胁

体育要闻

27岁热刺门将,夺冠后退役当导演

娱乐要闻

爸爸去哪儿6孩子现状,个个不同

财经要闻

马斯克"万亿薪酬"计划,突爆重大利空

汽车要闻

把海岸诗意织进日常 法拉利Amalfi重塑超跑生活方式

态度原创

数码
教育
游戏
家居
公开课

数码要闻

盖世小鸡手柄新品曝光,小米 REDMI 产品经理专门定制牛仔蓝配色

教育要闻

新东方举办第十七届家庭教育论坛,俞敏洪:人作为人的能力,是AI不能取代的

《鬼灭:无限城篇》引进版无删改? 博主因名誉权侵权被判赔偿米哈游11万元

家居要闻

年轻态度 功能舒适兼备

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版