网易首页 > 网易号 > 正文 申请入驻

ollama v0.15.5正式发布:全新Qwen3-Coder-Next与GLM-OCR模型登场,上下游功能全面进化

0
分享至




一、版本发布概览

2026年2月6日,ollama 推出了v0.15.5最新版本。本次更新在模型阵容、性能优化和开发者体验多个层面上都有实质性突破,尤其是对多模型协作、上下文管理本地开发流程的深度优化,为开发者提供更高效、更智能的调用体验。

二、新增模型:Qwen3-Coder-Next与GLM-OCR

1. Qwen3-Coder-Next
这是来自阿里巴巴 Qwen 团队的全新编码型语言模型,专注于智能代码生成与本地开发代理工作流。该模型在代码理解、自动补全和多步骤代理执行方面进行了全面优化,特别适用于需要持续上下文调用的开发者场景。

2. GLM-OCR
GLM-OCR 是一款多模态文档理解 OCR 模型,基于 GLM-V 编码-解码架构构建,聚焦于复杂文档的图像—文本解析任务。该模型的引入使 ollama 能够支持更复杂的视觉+文本混合输入,适配文档、表单等应用。

三、ollama launch 功能改进

1. 支持参数传入
现在可在启动时直接提供模型参数,例如:

ollama launch claude -- --resume

允许用户在启动模型时追加自定义指令或运行参数。

2. 支持子代理运行
在执行ollama launch claude等命令时,系统可运行子代理(sub-agent),支持多层规划、深度研究与协同任务执行。

3. 优化上下文自动设定
当使用ollama launch opencode时,系统将根据模型类型自动设置上下文上限,避免代码模型调用时内存溢出或性能下降。

四、VRAM分级上下文长度新机制

根据显存容量,ollama 将默认采用分级上下文长度:

VRAM容量

默认上下文长度

< 24 GiB

4,096 context

24–48 GiB

32,768 context

≥ 48 GiB

262,144 context

这一机制确保了不同硬件环境下的最优模型加载性能,充分利用 GPU 资源。

五、核心引擎与交互改进

1. GLM-4.7-Flash 支持
在实验性 MLX 引擎中新增对GLM-4.7-Flash的支持,进一步提高模型推理速度与压缩能力。

2. ollama signin 浏览器登录优化
执行ollama signin时将自动打开浏览器窗口,简化登录流程并直接跳转至连接页面。

六、错误与稳定性修复

  • • 修复num_predict参数出现的 off-by-one 错误,保证预测的 Token 数量准确。

  • • 修复上一次序列的 Token 误返回问题。

  • • 改进加载请求的错误提示,使问题更易定位。

  • • 优化chatPrompt机制以减少不必要的 Token 化调用,提高响应效率。

  • • 修复当批次中序列被替换时计算结果错误的情况,保证推理稳定性。

  • • 新增对远程模型的错误提示,使远程调用过程更清晰易调试。

七、任务执行与脚本更新
  • • 默认为 Qwen3-Next 与 LFM 模型设置parallel=1,保证推理序列一致性。

  • • 增强 macOS 平台支持,install.sh脚本现可在 macOS 系统中直接执行。

  • ollama launch命令进一步优化执行逻辑,改进参数和上下文管理机制。

  • • 云端模型在opencode模式下可自动设置上下文限制,提高云端并行调用稳定性。

八、版本总结

ollama v0.15.5是对开发者体验和模型性能的双重升级版本。核心亮点包括:

  • 双新模型接入:Qwen3-Coder-Next、GLM-OCR

  • Sub-agent 支持与参数化启动机制完善

  • 显存分级上下文长度智能设定

  • GLM-4.7-Flash 实验性引擎支持

  • 登录与错误提示体验优化

  • 跨平台支持与稳定性增强

这一版本不仅提升了大规模模型在多任务环境下的执行效率,也进一步降低了开发者的使用门槛。无论是代码生成、文档识别还是多代理协作,ollama v0.15.5 都为智能化的本地开发提供了强劲的动力。

结语:

代码地址:github.com/ollama/ollama

ollama v0.15.5 是一次面向开发者生态的核心进化。从模型到体验,它体现了开源 LLM 平台的持续迭代与深度融合趋势,为构建更强大的智能开发环境奠定了坚实基础。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
巴拿马港口冷清,中方未宣行动见效,小国陷两难抉择

巴拿马港口冷清,中方未宣行动见效,小国陷两难抉择

王楔晓
2026-02-06 10:19:00
软件股大跌,是耐心持有还是逢低买入?

软件股大跌,是耐心持有还是逢低买入?

华尔街见闻官方
2026-02-06 20:26:23
太震撼了!北美懦夫威震全球!面对御林军,美国人拿出了王炸!

太震撼了!北美懦夫威震全球!面对御林军,美国人拿出了王炸!

一个坏土豆
2026-02-02 19:45:52
还剩48小时,特朗普通告全球,高市彻底稳了,台海或将地动山摇

还剩48小时,特朗普通告全球,高市彻底稳了,台海或将地动山摇

阿离家居
2026-02-06 15:39:10
李国强任泰安市人民政府代理市长

李国强任泰安市人民政府代理市长

齐鲁壹点
2026-02-06 21:41:18
香港史上“最丑小三”,长相平平上不了桌,富豪却上赶着跟她求婚

香港史上“最丑小三”,长相平平上不了桌,富豪却上赶着跟她求婚

珺瑶婉史
2026-02-06 19:05:05
佩工谈0-5马竞:要是可以,我本想在中场把十一名球员都换了

佩工谈0-5马竞:要是可以,我本想在中场把十一名球员都换了

懂球帝
2026-02-06 09:50:06
微软开源 AI 量化交易神器,狂揽 3.6 万 Star!

微软开源 AI 量化交易神器,狂揽 3.6 万 Star!

冒泡泡的鱼儿
2026-02-06 02:08:29
周冬雨回应整容争议:没整容,只是在化妆方面花了更多的时间,秘诀是贴假睫毛

周冬雨回应整容争议:没整容,只是在化妆方面花了更多的时间,秘诀是贴假睫毛

潇湘晨报
2026-02-06 22:00:16
特斯拉Model 3在-36°C冻一夜:续航、充电速度与能耗表现大幅下滑

特斯拉Model 3在-36°C冻一夜:续航、充电速度与能耗表现大幅下滑

IT之家
2026-02-04 19:40:57
北大哈佛双硕士语出惊人:美国留学就是全世界最大的杀猪盘!

北大哈佛双硕士语出惊人:美国留学就是全世界最大的杀猪盘!

李砍柴
2026-02-04 12:54:49
港中大校长段崇智,默许港独学生暴行,被英国颁奖,如今怎么样?

港中大校长段崇智,默许港独学生暴行,被英国颁奖,如今怎么样?

鬼菜生活
2026-02-03 18:35:49
为啥很多人说共情前要保护好自己?网友:太奇葩了,这些人

为啥很多人说共情前要保护好自己?网友:太奇葩了,这些人

带你感受人间冷暖
2026-01-25 00:15:06
连续19个跌停!000638,去年营收或将低于3亿元

连续19个跌停!000638,去年营收或将低于3亿元

大众证券报
2026-02-06 20:04:42
恩比德“巅峰之战”:高光与争议并存

恩比德“巅峰之战”:高光与争议并存

麦咪熊熊
2026-02-07 01:17:16
亏麻了!苹果CarPlay 这些隐藏功能,90%车主开 5 年都没发现!

亏麻了!苹果CarPlay 这些隐藏功能,90%车主开 5 年都没发现!

沙雕小琳琳
2026-02-05 07:26:14
华裔二、三代为啥越来越不像中国人?餐桌与阳光能重塑东方面孔?

华裔二、三代为啥越来越不像中国人?餐桌与阳光能重塑东方面孔?

向航说
2026-02-06 00:20:03
32+6+4+2+3!29+11+6+2+3!双状元神仙打架,文班亚马盛赞弗拉格

32+6+4+2+3!29+11+6+2+3!双状元神仙打架,文班亚马盛赞弗拉格

世界体育圈
2026-02-06 15:06:59
新工作,辛纳现身意大利火车站为列车检票

新工作,辛纳现身意大利火车站为列车检票

懂球帝
2026-02-06 14:58:18
阿斯:皇马决定不计卡瓦哈尔伤病后的恢复疑虑,与他续约1年

阿斯:皇马决定不计卡瓦哈尔伤病后的恢复疑虑,与他续约1年

懂球帝
2026-02-07 07:37:05
2026-02-07 07:56:49
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1123文章数 55关注度
往期回顾 全部

科技要闻

独角兽版图巨变:SpaceX奔万亿 中美差在哪

头条要闻

大V称生活被助理"复制":她在我家穿我的衣服拍照

头条要闻

大V称生活被助理"复制":她在我家穿我的衣服拍照

体育要闻

西甲射手榜第2,身价不到姆巴佩1/40

娱乐要闻

微博之夜抢C风波 杨幂工作室9字讨说法

财经要闻

爱尔眼科董事长旗下7家精神病院骗保

汽车要闻

宝马"本命年"关键词:20款新车与"新世代"耐力赛

态度原创

健康
游戏
教育
艺术
数码

转头就晕的耳石症,能开车上班吗?

T2总裁回应GTA6争议:给他爱新DLC力证老作热度不减

教育要闻

怎样找旋转中心?两种方法都要会!

艺术要闻

过年,邻居家贴的对联,差点没把我笑死……

数码要闻

【IT之家开箱】罗技GPW5雪豹电竞鼠标图赏,业界首发可调电磁微动

无障碍浏览 进入关怀版