网易首页 > 网易号 > 正文 申请入驻

ollama v0.15.1更新:全面优化 GLM-4.7-Flash 性能、增强 Claude 与 OpenCode 集成、提升跨平台构建效率

0
分享至




2026年1月25日,Ollama 发布了最新版本v0.15.1。这一版本在性能优化、工具集成、跨平台兼容性和文档完善方面带来了显著提升,标志着该项目在本地大模型运行环境上的又一次重要进步。本文将带你全面了解此版本的全部更新点。

一、GLM-4.7-Flash 模型优化

本次更新对GLM-4.7-Flash模型进行了大幅性能优化与正确性修复,解决了部分重复回答与工具调用质量问题。同时,在量化策略上进行了改进:

  • • 量化更多张量为q8_0格式。

  • • 避免了双重 BOS Token 的问题。

  • • 修复了注意力机制中scale计算的错误,提升注意力计算精度和生成稳定性。

此外,server/quantization.go中针对多头注意力(MLA)相关权重进行了精度提升,确保模型在高压缩量化下仍能保持高质量输出。

二、跨平台性能改进

Ollama v0.15.1 修复了macOSarm64 Linux上的性能问题,并在各平台构建脚本中增加了高效优化编译参数:

  • CGO 优化标志:增加-O3编译优化。

  • macOS 构建脚本(scripts/build_darwin.sh):
    启用-O3优化并保持-mmacosx-version-min限定版本。

  • Windows 构建脚本(scripts/build_windows.ps1):
    若没有手动设置,会自动为CGO_CFLAGSCGO_CXXFLAGS添加-O3优化。

这些改动显著提升了编译后可执行文件的运行效率。

三、工具集成:Claude 与 OpenCode 全新增强

本次更新最大亮点之一,是对Claude Code与全新集成项目OpenCode的支持完善。

1. Claude Code 一键启动优化

  • • 新增ollama launch claude命令的智能路径检测机制
    可在系统 PATH 未找到claude时自动回退查找~/.claude/local/claude(Windows 系统为claude.exe)。

  • • 若仍无法找到,将提示用户从官方站点下载安装。

  • • 测试文件claude_test.go覆盖了 PATH 检测、fallback 查找以及异常路径三种场景,确保健壮性。

2. OpenCode 集成正式登场

新版本引入了OpenCode这一开源终端 AI 编码助手,并提供完整的 Ollama 集成方案。

命令行支持:

ollama launch opencode

或仅配置不启动:

ollama launch opencode --config

配置文件(~/.config/opencode/opencode.json)示例中默认支持添加本地与云端模型:

  • • 本地模型示例:qwen3-coder

  • • 云端模型示例:glm-4.7:cloud

对应逻辑实现涵盖:

  • • 避免重复条目;

  • • 保留用户自定义字段;

  • • 自动将旧[Ollama]后缀条目迁移为_launch标记;

  • • 精确区分由 Ollama 管理的模型条目。

四、命令行增强:新增 launch 命令全面指南

文档提供了详细 CLI 使用说明:

ollama launch

支持的集成:

  • • OpenCode – 开源代码助手

  • • Claude Code – Anthropic 编码智能体

  • • Codex – OpenAI 编码助手

  • • Droid – Factory AI 编码代理

可快速使用指定模型和配置项:

ollama launch claude --model qwen3-coder
ollama launch droid --config
五、文档体系大跃进

文档部分更新极为丰富,帮助开发者快速上手并接入主流开发工具,主要包括以下几个方面:

1. Anthropic API 兼容性更新

  • • 明确推荐模型:glm-4.7,minimax-m2.1,qwen3-coder

  • • 环境变量统一使用:

    export ANTHROPIC_AUTH_TOKEN=ollama
    export ANTHROPIC_API_KEY=ollama
    export ANTHROPIC_BASE_URL=http://localhost:11434
  • • 新增对ollama launch claude自动配置的说明。

2. 上下文长度提升

上下文窗口默认推荐调整至64000 tokens,更适用于 web 搜索、AI agents 和大型代码模型。

设置示例:

OLLAMA_CONTEXT_LENGTH=64000 ollama serve
3. Quickstart 新增编程模型说明
  • • 推荐使用glm-4.7-flash作为本地编程模型(23GB 显存需求)。

  • • 支持云模型glm-4.7:cloud

  • • 新增 “快速接入编程助手” 分节,引导使用ollama launch快速集成多款工具。

六、README 与构建说明同步更新
  • README.md替换为更受欢迎的 Ruby 客户端链接。

  • Dockerfileapp/README.md更新增加-O3优化参数。

  • • 修复启动时Claude 检测失败OpenCode 配置误更新问题。

七、小结

代码地址:github.com/ollama/ollama

Ollama v0.15.1 是一次全方位的优化版本,重点围绕以下核心展开:

  • 性能与精度升级:GLM-4.7-Flash 模型深度优化。

  • 跨平台支持增强:macOS 与 Linux arm64 性能修复,构建优化全面升级。

  • 生态集成扩展:新增 OpenCode 一键集成,完善 Claude 启动逻辑。

  • 开发体验提升:CLI 命令增强与文档体系全面进化。

这次更新不仅让 Ollama 在模型执行效率上更进一步,也让其在 AI 编程助手生态中更具连接性与易用性。

总结

Ollama v0.15.1 不只是一次修复版本,而是一场性能、生态与开发体验的综合升级。从模型底层优化到工具链集成,从跨平台编译加速到文档统一更新,这次迭代让 Ollama 离“本地通用 AI 工作平台”的愿景更近了一步。

我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
狂输25分!森林狼复仇勇士,库里缺席这一战!我不得不承认4事实

狂输25分!森林狼复仇勇士,库里缺席这一战!我不得不承认4事实

篮球扫地僧
2026-01-27 21:41:11
围甲易帜门:双龙反目,马晓春与聂卫平关系跌至冰点

围甲易帜门:双龙反目,马晓春与聂卫平关系跌至冰点

月满大江流
2026-01-27 18:36:45
强得可怕!夺冠热门踢疯了,狂揽11连胜+赛季不败,高居榜首

强得可怕!夺冠热门踢疯了,狂揽11连胜+赛季不败,高居榜首

乌龙球OwnGoal
2026-01-27 13:35:38
赛微电子:预计2025年度净利润约14.14亿元~15.04亿元

赛微电子:预计2025年度净利润约14.14亿元~15.04亿元

每日经济新闻
2026-01-27 20:20:19
北京周五还有雪,最高气温再次跌到冰点

北京周五还有雪,最高气温再次跌到冰点

北青网-北京青年报
2026-01-27 15:08:57
电力超级周期爆发,真正的机会不在发电端?

电力超级周期爆发,真正的机会不在发电端?

华尔街见闻官方
2026-01-27 20:37:54
外交部发言人毛宁两会建议:路边店红火,公园全天开!

外交部发言人毛宁两会建议:路边店红火,公园全天开!

流年顛簸
2026-01-27 10:43:46
沉默24小时后,卡尼终于发声,否认与中国签协议,美财长得寸进尺

沉默24小时后,卡尼终于发声,否认与中国签协议,美财长得寸进尺

娱乐圈的笔娱君
2026-01-27 10:12:25
1月下旬,开始走好运的三个星座,贵人到位,机会一件接一件出现

1月下旬,开始走好运的三个星座,贵人到位,机会一件接一件出现

小晴星座说
2026-01-26 19:04:14
中央纪委国家监委对群众身边不正之风和腐败问题集中整治工作再动员再部署

中央纪委国家监委对群众身边不正之风和腐败问题集中整治工作再动员再部署

澎湃新闻
2026-01-26 20:45:07
美国流浪汉把番茄酱丢路人身上,恐被判刑五年??网友:不是,至于吗…

美国流浪汉把番茄酱丢路人身上,恐被判刑五年??网友:不是,至于吗…

英国那些事儿
2026-01-26 23:27:08
美媒:“林肯”号航母打击群一两天内即可对伊朗动武

美媒:“林肯”号航母打击群一两天内即可对伊朗动武

国际在线
2026-01-27 08:09:14
因冻伤从高原退役,团长念完命令后,来视察的战区司令突然叫住我

因冻伤从高原退役,团长念完命令后,来视察的战区司令突然叫住我

卡西莫多的故事
2026-01-24 13:00:07
委内瑞拉和伊朗这一手“反水”,直接给中国上一堂最昂贵的战略课

委内瑞拉和伊朗这一手“反水”,直接给中国上一堂最昂贵的战略课

南权先生
2026-01-16 16:22:00
定了!她将于今年5月嫁给年下男友!

定了!她将于今年5月嫁给年下男友!

奋斗在韩国
2026-01-26 13:28:53
国外狼队博主:徐彬是有留洋经历的防守型中场,预计先去青年队

国外狼队博主:徐彬是有留洋经历的防守型中场,预计先去青年队

懂球帝
2026-01-27 19:33:22
1月28日前瞻 I 广东主场战吉林,「大学生之夜」重磅来袭!

1月28日前瞻 I 广东主场战吉林,「大学生之夜」重磅来袭!

广东华南虎
2026-01-27 22:01:57
吃他汀一颗花生不能碰?医生提醒:不止花生,这5样食物也要小心

吃他汀一颗花生不能碰?医生提醒:不止花生,这5样食物也要小心

路医生健康科普
2026-01-26 10:09:49
狂轰17-0逆转步行者!麦科勒姆领衔3人得分20+ 老鹰喜获3连胜

狂轰17-0逆转步行者!麦科勒姆领衔3人得分20+ 老鹰喜获3连胜

罗说NBA
2026-01-27 06:27:15
央视紧急预警2026!3种高端菜是毒坑,孩子绝对不能吃

央视紧急预警2026!3种高端菜是毒坑,孩子绝对不能吃

辉哥说动漫
2026-01-26 12:26:01
2026-01-28 00:03:00
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1112文章数 53关注度
往期回顾 全部

科技要闻

马化腾3年年会讲话透露了哪些关键信息

头条要闻

因楼下邻居关闭水阀女子家中断水400天 起诉索赔被驳

头条要闻

因楼下邻居关闭水阀女子家中断水400天 起诉索赔被驳

体育要闻

冒充职业球员,比赛规则还和对手现学?

娱乐要闻

张雨绮风波持续发酵,曝多个商务被取消

财经要闻

多地对垄断行业"近亲繁殖"出手了

汽车要闻

标配华为乾崑ADS 4/鸿蒙座舱5 华境S体验车下线

态度原创

家居
教育
亲子
旅游
游戏

家居要闻

现代古典 中性又显韵味

教育要闻

评论丨教师期末“负担”与总结活动“初衷”,如何不再错位?

亲子要闻

双职工家庭,孩子上幼儿园后,无老人帮忙,夫妻俩能独立带娃吗?

旅游要闻

香港直达无锡!当东方之珠遇见太湖明珠

《生化危机9》注定能成功!避开了开放世界的坑

无障碍浏览 进入关怀版