网易首页 > 网易号 > 正文 申请入驻

ollama v0.19.0 发布!Web 搜索插件上线、多模型兼容修复、MLX 与 KV 缓存全面优化,本地大模型体验再升级

0
分享至




ollama v0.19.0于2026年3月30日正式发布,作为本地大模型部署与运行的核心工具,本次更新聚焦用户体验优化、功能增强与底层问题修复,覆盖应用交互、插件能力、API性能、模型兼容、MLX运行器、注意力机制等多个核心维度,同时包含26次提交、58个文件改动,全面提升ollama的稳定性、兼容性与实用性。

一、核心功能更新

  1. 1.应用体验优化
    ollama应用将不再错误显示“模型已过时”提示,彻底解决此前版本中模型状态判断异常的问题,避免用户被无效提示干扰,提升使用流畅度。

  2. 2.Web搜索插件集成
    ollama launch pi功能新增内置Web搜索插件,该插件直接使用ollama官方Web搜索能力,无需额外配置即可让本地模型具备联网搜索能力,拓展本地大模型的信息获取边界,支持实时检索最新数据。

  3. 3.Anthropic兼容API性能提升
    优化使用Anthropic兼容API时的KV缓存命中率,减少重复计算与资源消耗,提升API调用的响应速度与效率,尤其在高频、长对话场景下效果显著。

  4. 4.Qwen3.5模型工具调用修复
    修复Qwen3.5模型工具调用解析问题,解决此前版本中工具调用内容被错误输出在思考模块的问题,确保工具调用逻辑清晰、结果准确,保障Qwen3.5模型的函数调用能力正常生效。

  5. 5.MLX运行器增强

  • • MLX运行器在提示词处理过程中会创建周期性快照,实现状态的持续备份,避免处理中断导致的进度丢失;

  • • 修复MLX运行器中KV缓存快照的内存泄漏问题,优化内存资源占用,提升长时间运行的稳定性;

  • • 优化MLX运行器的缓存驱逐与LRU跟踪逻辑,提升缓存管理效率;

  • • 合并setStateRaw与setStateDetached为setState,简化API调用逻辑,降低开发与使用复杂度。

  1. 6.模型兼容与机制修复

  • • 修复Grok模型的Flash Attention错误启用问题,确保Grok模型在ollama中运行时,注意力机制配置符合模型特性,避免性能异常或兼容性问题;

  • • 解决qwen3-next:80b模型无法在ollama中加载的问题,完善对该大参数模型的支持,拓展ollama可运行的模型范围。

二、提交与改动详情(按时间梳理) 2026年3月25日
  • • ggml模块:强制关闭Grok模型的Flash Attention,从底层解决Grok模型注意力机制配置错误问题。

2026年3月26日
  • • MLX模块:修复KV缓存快照内存泄漏,优化内存管理;

  • • MLX运行器:改进缓存驱逐与LRU跟踪逻辑,提升缓存效率;

  • • MLX运行器:在预填充阶段调度周期性快照,实现状态自动备份;

  • • MLX运行器:合并setState相关接口,简化调用逻辑;

  • • 文档:更新VS Code相关文档,完善开发工具集成说明;

  • • launch模块:隐藏VS Code集成入口、Cline集成入口;

  • • launch/vscode模块:优先使用已知VS Code路径,而非PATH中的code命令,提升工具调用准确性。

2026年3月27日
  • • TUI模块:更新聊天标题,优化交互界面展示;

  • • CI模块:在Linux系统中包含MLX JIT头文件,完善编译依赖;

  • • launch模块:对本地模型,当服务器上下文长度低于64k时发出警告,帮助用户提前规避长文本处理问题;

  • • CI模块:强化CUDA包含路径处理,提升GPU环境兼容性;

  • • 模型解析器:修复Qwen3.5工具块在思考块中启动时的关闭逻辑,解决工具调用解析异常;

  • • 解析器:优化Qwen3.5流式工具调用解析,并添加回归测试,保障功能稳定性;

  • • 应用模块:修复模型“过时”错误提示,优化用户体验;

  • • Anthropic模块:修复因工具调用参数重排序导致的KV缓存复用降级问题,提升API性能;

  • • launch模块:跳过MLX模型的上下文长度警告,并显示模型名称,优化提示逻辑;

  • • Anthropic模块:修复内容块中的空输入问题,避免API调用异常;

  • • 服务器模块:拉取模型时保留原始清单字节,保障模型完整性。

2026年3月28日
  • • MLX模块:修复视觉能力与最低版本兼容问题,完善多模态支持;

  • • launch模块:自动安装pi并管理Web搜索生命周期,简化插件使用流程;

  • • launch模块:优化已添加模型的多选功能,提升操作便捷性;

  • • 回滚上下文长度警告变更,调整提示策略。

2026年3月29日
  • • 模型模块:为qwen3-next添加对传统ssm_in投影的兼容性,解决模型加载失败问题;

  • • 命令模块:在配置中设置OpenCode默认模型,优化模型调用默认配置。

三、更新总结

代码地址:bgithub.xyz/ollama/ollama

ollama v0.19.0版本从用户体验、功能拓展、底层性能、模型兼容四大方向发力,新增Web搜索插件拓展本地模型能力,修复多模型(Qwen3.5、Grok、qwen3-next:80b)的核心问题,优化MLX运行器与KV缓存机制,同时完善API、CI、工具集成等模块的细节,全面提升ollama的稳定性、兼容性与易用性,为本地大模型开发者与用户提供更优质的运行环境。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本富婆来中国旅游,回国7天后哭诉:日本跟中国相比还需努力

日本富婆来中国旅游,回国7天后哭诉:日本跟中国相比还需努力

千秋文化
2026-03-24 21:49:28
恩爱剧本不演了?奚梦瑶提离婚,何猷君掀桌子私生子传闻真相大白

恩爱剧本不演了?奚梦瑶提离婚,何猷君掀桌子私生子传闻真相大白

秋姐居
2026-04-04 22:23:29
家暴打死老婆,他在行刑前尿了裤子:终于怕了

家暴打死老婆,他在行刑前尿了裤子:终于怕了

大道微言
2026-04-04 14:49:29
周杰伦演唱会口碑崩塌,3小时划水2小时,万元门票听了个寂寞

周杰伦演唱会口碑崩塌,3小时划水2小时,万元门票听了个寂寞

观察者海风
2026-04-04 22:06:54
美国油价飙涨!但最离谱的是:加州几乎已经是有些州的两倍了

美国油价飙涨!但最离谱的是:加州几乎已经是有些州的两倍了

华人生活网
2026-04-05 04:11:36
三石弟弟被三里屯公主始乱终弃!

三石弟弟被三里屯公主始乱终弃!

八卦疯叔
2026-04-05 10:43:18
黄晓明晒娃骑行,网友:快停!违法了

黄晓明晒娃骑行,网友:快停!违法了

深圳晚报
2026-04-05 17:02:14
饶毅:中国未来最大的挑战,是对待真理和自然的态度

饶毅:中国未来最大的挑战,是对待真理和自然的态度

霹雳炮
2026-02-28 22:33:30
亏损17亿!江淮汽车年报发布

亏损17亿!江淮汽车年报发布

新浪财经
2026-04-05 16:41:15
郴州小伙清明一天内爬多座山祭祀16位先祖:根在这里,年年都会来,祈求祖先保佑

郴州小伙清明一天内爬多座山祭祀16位先祖:根在这里,年年都会来,祈求祖先保佑

潇湘晨报
2026-04-05 21:40:18
被售后工人怒斥:你的筒自洁,纯粹是在浪费时间!

被售后工人怒斥:你的筒自洁,纯粹是在浪费时间!

装修秀
2026-04-04 11:35:03
我在火车上拒绝大妈换下铺请求,她骂了一夜,我下车后递给她一封信

我在火车上拒绝大妈换下铺请求,她骂了一夜,我下车后递给她一封信

起喜电影
2026-04-05 07:41:59
李亚鹏直播笑着回应助手否认收标哥豪车或捐款:这种鬼话你也信?

李亚鹏直播笑着回应助手否认收标哥豪车或捐款:这种鬼话你也信?

南方健哥
2026-04-05 10:43:49
教育部发布“教师二十严禁”!这回,老师不准做的事,全写清楚了

教育部发布“教师二十严禁”!这回,老师不准做的事,全写清楚了

笑熬浆糊111
2026-04-05 00:05:25
50岁蒋勤勤在意大利街头被撞见,妆容忒浓,脸不自然,看着怪怪的

50岁蒋勤勤在意大利街头被撞见,妆容忒浓,脸不自然,看着怪怪的

观鱼听雨
2026-04-04 18:10:35
扎哈罗娃:俄罗斯目前在三条战线上同时作战

扎哈罗娃:俄罗斯目前在三条战线上同时作战

环球网资讯
2026-04-05 11:48:11
国米5-2打爆罗马!“新本泽马”独造3球,皇马快买他搭档姆巴佩

国米5-2打爆罗马!“新本泽马”独造3球,皇马快买他搭档姆巴佩

仰卧撑FTUer
2026-04-06 08:12:13
一次闯红灯换来刑事拘留 上海一女子闯红灯拒罚 先打交警再打增援民警 涉嫌袭警被拘

一次闯红灯换来刑事拘留 上海一女子闯红灯拒罚 先打交警再打增援民警 涉嫌袭警被拘

闪电新闻
2026-04-05 13:35:13
全红婵陈芋汐微信群事件:全红婵被爆遭遇集体霸凌,多名跳水界业内人士牵涉其中。

全红婵陈芋汐微信群事件:全红婵被爆遭遇集体霸凌,多名跳水界业内人士牵涉其中。

贴小君
2026-04-05 08:44:50
伊朗导弹打击为何如此精准?

伊朗导弹打击为何如此精准?

大象新闻
2026-04-05 11:45:02
2026-04-06 08:27:00
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1169文章数 63关注度
往期回顾 全部

科技要闻

花200薅5千算力,Claude冷血断供“龙虾”

头条要闻

伊朗媒体:多名美士兵在营救行动中身亡 美军试图摧毁遗体

头条要闻

伊朗媒体:多名美士兵在营救行动中身亡 美军试图摧毁遗体

体育要闻

CBA最老球员,身价7500万美元

娱乐要闻

王灿兮否认婆媳不和 晒与杜淳妈合影

财经要闻

谁造出了优思益这头“怪物”?

汽车要闻

家用SUV没驾驶乐趣?极氪8X第一个不同意

态度原创

手机
房产
数码
公开课
军事航空

手机要闻

OPPO Find X9s Pro银色哈苏专业增距镜亮相:观赛神器 颜值拉满

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

数码要闻

大胆复古美学,海盗船推出原子紫配色K65 PLUS WIRELESS机械键盘

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美飞行员获救细节:美伊发生激烈交火 至少4死1伤

无障碍浏览 进入关怀版