网易首页 > 网易号 > 正文 申请入驻

ollama v0.12.5 发布,新增功能与重要改进详解

0
分享至


发布时间:2025年10月11日

在 v0.12.5 版本中,Ollama 带来了多项功能改进、问题修复及平台兼容性调整。本次更新主要涉及运行流程优化、错误处理改进、模型输出优化以及平台支持范围调整。以下是详细解析。

一、主要更新内容

  1. 1.应用启动等待机制优化
    Ollama 的应用在启动对话前,将等待 Ollama 服务运行完成,避免了在服务尚未启动的情况下进行会话操作。

  2. 2.Think 参数兼容性改进
    修复了在"think": false时,以前会出现错误提示的问题,现版本将改为静默忽略,提升了非思考模型的兼容性。

  3. 3.模型输出问题修复
    修正了deepseek-r1模型的输出异常问题,提升了生成结果的稳定性。

  4. 4.平台支持变更

  • • macOS 12 Monterey 与 macOS 13 Ventura不再支持

  • • AMD gfx900 和 gfx906 系列 GPU(如 MI50、MI60)不再通过 ROCm 支持,未来将尝试通过 Vulkan 提供支持。

二、代码层面变更解析 1. 内置函数 min/max 应用

在多个图像处理模块中,替换了math.Minmath.Max为 Go 语言的内置min()max()方法:

  • llama4mllama模型的process_image.go调整了分辨率计算方法,提升了代码简洁性与性能。

2. 运行时度量优化
  • llamarunnerollamarunner都引入了新的运行时间度量方式,将处理阶段与生成阶段拆分,对处理耗时生成耗时进行单独统计。

  • • 新增了processingDurationgenerationDuration/samplingDuration变量,用于区分不同阶段的运行时间。

  • • 在批量处理过程中,增加了startedAtlastUpdatedAt的记录,以便更精准地分析性能数据。

3. 批量处理与异步支持调整
  • • 在ollamarunner中,批量处理逻辑修改为使用previousBatchnextBatch交替进行。

  • • 当模型支持异步运算时(pooling_type == none),批处理计算会并行执行,提升模型运行效率。

4. Thinking 能力判断优化
  • • 在server/routes.go中,GenerateHandlerChatHandler的逻辑调整为:

    • • 如果模型支持thinking,则默认开启;

    • • 如果模型不支持thinking且用户设置了true,将返回错误;

    • • 如果设置为false,则不报错,正常执行。

三、测试用例改动

server/routes_generate_test.go中:

  • • 错误提示信息调整为更简洁的"\"test\" does not support thinking"

  • • 新增测试用例,验证模型不支持thinkingthink=false时的执行结果,确保返回状态码 200。

四、版本影响与展望

本次ollama v0.12.5更新在性能优化、运行时度量、错误处理等方面都有显著提升,尤其是:

  • 提升模型执行阶段的时间统计精度

  • 改善非思考模型的兼容性

  • 优化批处理执行流程


我们相信人工智能为普通人提供了一种“增强工具”,并致力于分享全方位的AI知识。在这里,您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。 欢迎关注“福大大架构师每日一题”,发消息可获得面试资料,让AI助力您的未来发展。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
李国旭竞聘成功 大连5虎进国家队!邵佳一接手,段学霸徐彬迎机会

李国旭竞聘成功 大连5虎进国家队!邵佳一接手,段学霸徐彬迎机会

刀锋体育
2025-11-04 19:12:04
星巴克中国易主,博裕投资40亿美元拿下至多60%股权

星巴克中国易主,博裕投资40亿美元拿下至多60%股权

界面新闻
2025-11-04 08:33:42
皇马主帅乱来!客场变阵+3次换人没用,西班牙21岁天才大战遭弃

皇马主帅乱来!客场变阵+3次换人没用,西班牙21岁天才大战遭弃

体育知多少
2025-11-05 07:37:22
爸爸去哪儿6孩子现状:子承父业、进国家队、国外读书,个个不同

爸爸去哪儿6孩子现状:子承父业、进国家队、国外读书,个个不同

书雁飞史oh
2025-11-04 17:26:59
1-2爆冷!亚冠离谱一战:开局送乌龙,补时遭绝杀,蓉城队被反超

1-2爆冷!亚冠离谱一战:开局送乌龙,补时遭绝杀,蓉城队被反超

何老师呀
2025-11-04 20:34:52
广东队跳水第三金!王伟莹稳健发挥再夺冠,赛后透露全红婵状态

广东队跳水第三金!王伟莹稳健发挥再夺冠,赛后透露全红婵状态

阿纂看事
2025-11-04 22:53:40
钱再多有什么用?好友曝62岁屠颖离世细节,给所有老年人敲响警钟

钱再多有什么用?好友曝62岁屠颖离世细节,给所有老年人敲响警钟

银河史记
2025-11-03 22:06:17
11月4日俄乌最新:普京的KPI

11月4日俄乌最新:普京的KPI

西楼饮月
2025-11-04 20:50:16
三亚海滩“长满”了俄罗斯人!网友调侃:我在这里反而成了“老外”

三亚海滩“长满”了俄罗斯人!网友调侃:我在这里反而成了“老外”

封面新闻
2025-11-02 12:57:02
“饿了么”将更名为“淘宝闪购”?骑手已同步更换橙黑新工服

“饿了么”将更名为“淘宝闪购”?骑手已同步更换橙黑新工服

澎湃新闻
2025-11-04 11:32:28
女性出轨率最高的几大职业

女性出轨率最高的几大职业

微微热评
2025-11-04 12:27:00
方颖,为特定关系人谋利

方颖,为特定关系人谋利

新京报
2025-11-04 21:59:52
43岁阿隆索蔫了!带皇马4次大考3次不及格 2次对阵利物浦被揍0-5

43岁阿隆索蔫了!带皇马4次大考3次不及格 2次对阵利物浦被揍0-5

风过乡
2025-11-05 07:22:42
山姆翻车再上热搜!商品头图全是假的,网友刷屏“辞退高管”

山姆翻车再上热搜!商品头图全是假的,网友刷屏“辞退高管”

雷科技
2025-11-04 14:50:05
家电三巨头差距断崖:美的净利润385亿,海尔187亿,格力令人意外

家电三巨头差距断崖:美的净利润385亿,海尔187亿,格力令人意外

法老不说教
2025-11-04 13:33:37
俄原子能集团:将在中国建设俄罗斯设计的核电站

俄原子能集团:将在中国建设俄罗斯设计的核电站

俄罗斯卫星通讯社
2025-11-04 15:04:32
豪掷10亿!前衡水首富跨界押注1600亿巨头,冲上430亿

豪掷10亿!前衡水首富跨界押注1600亿巨头,冲上430亿

财经八卦
2025-11-04 21:37:05
中央通报后,湖南省政府表态

中央通报后,湖南省政府表态

新京报政事儿
2025-11-04 19:51:49
向太陈岚直播时狂怼王家卫:他没有张叔平是个屁,投资他的老板基本都亏钱,还称自己绝不录用他,他不受控

向太陈岚直播时狂怼王家卫:他没有张叔平是个屁,投资他的老板基本都亏钱,还称自己绝不录用他,他不受控

观威海
2025-11-04 14:58:03
分享解剖学知识,破除多年来的G点谣传

分享解剖学知识,破除多年来的G点谣传

远方青木
2025-10-25 00:06:11
2025-11-05 08:48:49
moonfdd incentive-icons
moonfdd
福大大架构师每日一题
1023文章数 49关注度
往期回顾 全部

科技要闻

亚马逊发函叫停:AI替你购物,平台有权阻止吗

头条要闻

郑丽文:让唾弃民进党力量重新汇集 取得2028选举胜利

头条要闻

郑丽文:让唾弃民进党力量重新汇集 取得2028选举胜利

体育要闻

27岁热刺门将,夺冠后退役当导演

娱乐要闻

爸爸去哪儿6孩子现状,个个不同

财经要闻

飞天跌破1700元 茅台迎来最不确定的冬天

汽车要闻

把海岸诗意织进日常 法拉利Amalfi重塑超跑生活方式

态度原创

本地
手机
游戏
时尚
公开课

本地新闻

秋颜悦色 | 在榆中,秋天是一场盛大的视觉交响

手机要闻

4000元以上谁最具性价比?iQOO 15笑而不语

魔兽时光服:团本取消H难度,全民工程成过去式?这些点很重要

2025羽绒服8大流行趋势,温暖时髦过冬天!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版