网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

ollama v0.6.6 震撼发布！推理能力翻倍、下载提速 50%，对比 vLLM/LMDeploy 谁更强

2025-04-18 00:11:02　来源: moonfdd

北京举报

0

分享至

ollama v0.6.6 重磅更新：更强推理、更快下载、更稳内存

AI 开发者们注意了！Ollama v0.6.6正式发布，带来多项重大优化，包括全新模型支持、下载速度提升、内存泄漏修复等，让本地大模型推理更高效、更稳定！

核心更新亮点 1. 两大全新模型上线

•Granite 3.3（2B & 8B）：128K 超长上下文，优化指令跟随与逻辑推理能力，适合复杂任务处理。
•DeepCoder（14B & 1.5B）：完全开源代码模型，性能对标 O3-mini，开发者可低成本部署高质量代码生成 AI！

2. 下载速度大幅提升

•实验性新下载器：通过OLLAMA_EXPERIMENT=client2 ollama serve启用，下载更快、更稳定！
•Safetensors 导入优化：ollama create导入模型时性能显著提升。

3. 关键 BUG 修复

•Gemma 3 / Mistral Small 3.1 内存泄漏问题修复，运行更稳定。
•OOM（内存不足）问题优化，启动时预留更多内存，避免崩溃。
•Safetensors 导入数据损坏问题修复，确保模型完整性。

4. API 与兼容性改进

•支持工具函数参数类型数组（如string | number[]），API 更灵活。
•OpenAI-Beta CORS 头支持，方便前端集成。

Ollama vs. vLLM vs. LMDeploy：谁才是本地部署王者？
对比维度Ollama v0.6.6vLLMLMDeploy易用性

⭐⭐⭐⭐⭐（一键安装，适合个人开发者）

⭐⭐⭐（需 Docker/复杂配置）

⭐⭐⭐⭐（零一万物优化，适合企业）

推理速度

⭐⭐⭐（适合中小模型）

⭐⭐⭐⭐⭐（PagedAttention 优化，吞吐量高）

⭐⭐⭐⭐（Turbomind 引擎，低延迟）

内存优化

⭐⭐⭐（自动 CPU/GPU 切换）

⭐⭐⭐⭐⭐（连续批处理，显存利用率高）

⭐⭐⭐⭐（W4A16 量化，省显存）

模型支持

⭐⭐⭐⭐（支持 GGUF 量化，社区丰富）

⭐⭐⭐（需手动转换模型格式）

⭐⭐⭐（主要适配 InternLM 生态）

适用场景个人开发 / 轻量级应用高并发生产环境企业级实时对话 / 边缘计算
结论：如何选择？

•个人开发者 / 快速测试→Ollama（安装简单，模型丰富）
•企业高并发 API 服务→vLLM（吞吐量最高，适合 GPU 集群）
•低延迟实时交互→LMDeploy（优化短文本，响应更快）

如何升级？

ollama upgrade

然后即可体验Granite 3.3和DeepCoder！

我们相信人工智能为普通人提供了一种“增强工具”，并致力于分享全方位的AI知识。在这里，您可以找到最新的AI科普文章、工具评测、提升效率的秘籍以及行业洞察。欢迎关注“福大大架构师每日一题”，让AI助力您的未来发展。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

120多万的卡宴只要60多万？很多网友激动了！打飞的到海南买进口车，可行吗？

都市快报橙柿互动 2025-12-19 18:00:00
8062 跟贴 8062
美国或"最快本周"再次对俄罗斯动手已和27国讨论计划

澎湃新闻 2025-12-19 07:09:46
24271 跟贴 24271

媒体：路透社"爆料"中国建造出极紫外光刻机原型机

环球网资讯 2025-12-19 00:45:05
10252 跟贴 10252

中戏院长郝戎被查刘烨、章子怡、靳东等为其学生

大风新闻 2025-12-19 11:54:20
3545 跟贴 3545
新闻多一度｜南京博物院藏品现身拍卖市场？最新回应来了

新京报 2025-12-19 20:45:08
3428 跟贴 3428

南博在犯一个很危险的错

第一财经资讯 2025-12-19 21:13:02
420 跟贴 420

西北两省将有第一家麦当劳，宁夏银川三店齐开、青海首店落户西宁

大风新闻 2025-12-19 10:41:03
166 跟贴 166
海南封关，楼市怎么样？知名房企斥资近50亿元接连拿地，“有山东客户拿下上百套小户型商办房”

每日经济新闻 2025-12-19 13:17:46
9412 跟贴 9412

公园回应永历帝趴泥中雕塑引争议

现代快报 2025-12-15 17:39:59
3743 跟贴 3743
马文峰任广东省外事办公室主任

中国经济网 2025-12-19 14:20:06
143 跟贴 143
美国海军F-18战斗机出现在委内瑞拉首都附近空域

极目新闻 2025-12-19 15:53:56
2038 跟贴 2038
"插座一哥"被同行质疑误导消费者索赔420万公牛回应

中国新闻周刊 2025-12-19 15:32:41
1136 跟贴 1136
男子被下病危通知书后，最后一次帮孩子剪指甲，妻子问丈夫是否舍不得孩子：“癌痛那么久，他第一次哭”

环球网资讯 2025-12-19 09:51:03
243 跟贴 243
罕见中的罕见！广西发现一例稀有血型“恐龙血”，该名男子是由基因突变导致的，全球仅有2例，都在广西

观威海 2025-12-19 09:42:08
308 跟贴 308
26岁郑州小伙伦敦闹市开店卖胡辣汤：一碗售价130元

极目新闻 2025-12-19 21:19:26
1 跟贴 1
到底是什么肉？消费者：必胜客实物牛排与菜单差距大，口感奇怪；暗访发现

上观新闻 2025-12-19 14:17:05
549 跟贴 549
辽宁舰航母编队远海训练更多细节公布

央视新闻客户端 2025-12-19 12:06:37
834 跟贴 834
美媒：美国下水一艘新军舰中国已造好三艘差距惊人

澎湃新闻 2025-12-19 07:32:34
351 跟贴 351
嵩山少林景区推50元接驳车引发游客吐槽，景区回应：新方案已暂缓

上游新闻 2025-12-15 15:48:13
3630 跟贴 3630
"情歌王子"张信哲个人藏品在沪免费展出含近80件旗袍

上观新闻 2025-12-19 15:37:15
226 跟贴 226
2025“年度字词”揭晓

界面新闻 2025-12-19 10:33:56
2773 跟贴 2773
外媒：泰国轰炸柬埔寨“赌场小镇”建筑

参考消息 2025-12-19 11:46:09
217 跟贴 217
《纽约时报》记者：在中国农村我看到震撼一幕

澎湃新闻 2025-12-20 07:05:33
0 跟贴 0
安徽一高校大一学子校内溺水身亡，疑参与线下游戏时不慎坠湖，具体情况如何？有哪些问题值得关注？

卷阿 2025-12-20 07:55:09
0 跟贴 0
轿车刹车失灵以时速115狂奔490公里多方联动组成“护航编队”化险为夷

板扎在线 2025-12-20 07:34:57
0 跟贴 0

钱再多有什么用，64岁郎平如今的现状，给所有运动员们提了个醒

钱再多有什么用，64岁郎平如今的现状，给所有运动员们提了个醒

削桐作琴

2025-12-10 16:53:18

安世半导体中国与荷兰，进一步分离！

安世半导体中国与荷兰，进一步分离！

芯片志

2025-12-19 22:09:32

青岛：坚决拥护党中央决定

新京报政事儿

2025-12-19 09:11:00

太通透！63岁何超琼与16岁王诗龄合影，一个动作格局拉满！

太通透！63岁何超琼与16岁王诗龄合影，一个动作格局拉满！

君好伴读

2025-12-19 21:36:14

牡丹花下死，“纵欲过度”的张雨绮，终究为自己的行为付出了代价

牡丹花下死，“纵欲过度”的张雨绮，终究为自己的行为付出了代价

娱乐看阿敞

2025-12-17 14:11:15

2600万对换！曼联天才成香饽饽马竞抢着要，红魔或用他换中场核心

2600万对换！曼联天才成香饽饽马竞抢着要，红魔或用他换中场核心

夜白侃球

2025-12-19 19:53:27

中国农历有多厉害？王蒙：世界上没有任何历法同时知道太阳和月亮

中国农历有多厉害？王蒙：世界上没有任何历法同时知道太阳和月亮

芳芳历史烩

2025-12-08 19:17:49

王志文：不要对水平太低的人太好，认知水平越低，越不懂你的好

王志文：不要对水平太低的人太好，认知水平越低，越不懂你的好

杏花烟雨江南的碧园

2025-12-03 13:10:03

失地不收是高明之策？被强占60年的藏南，已成印度摆脱不了的噩梦

失地不收是高明之策？被强占60年的藏南，已成印度摆脱不了的噩梦

我心纵横天地间

2025-12-15 16:44:20

弹劾成案可要赖清德赴台民意机构答辩，邱毅：若拒绝将坐实“独裁”

弹劾成案可要赖清德赴台民意机构答辩，邱毅：若拒绝将坐实“独裁”

海峡导报社

2025-12-19 12:04:02

这可能是厦门跌幅最大的二手房小区从7万到2万，当价格开始退潮

这可能是厦门跌幅最大的二手房小区从7万到2万，当价格开始退潮

石辰搞笑日常

2025-12-19 14:25:00

刘亦菲在家玩自拍，不料被镜子“出卖”了，网友直呼：好女人啊！

刘亦菲在家玩自拍，不料被镜子“出卖”了，网友直呼：好女人啊！

阿晪美食

2025-12-19 15:31:31

后妃侍寝规矩严：全程禁声成铁律，另有一条更羞耻却不见史书记载

后妃侍寝规矩严：全程禁声成铁律，另有一条更羞耻却不见史书记载

晓艾故事汇

2025-12-09 17:00:16

普京两女儿公开亮相，预示什么情况！

普京两女儿公开亮相，预示什么情况！

新民周刊

2024-06-12 09:11:58

万亿顺差背后，为什么“扩大内需”成了最紧迫的事？

万亿顺差背后，为什么“扩大内需”成了最紧迫的事？

知本设

2025-12-13 10:32:01

美国检方：布朗大学枪手也是杀害麻省理工学院教授的凶手

美国检方：布朗大学枪手也是杀害麻省理工学院教授的凶手

新华社

2025-12-19 14:45:05

陆小曼晚年爆黑料：徐志摩父亲和张幼仪“爬灰”，徐志摩伤心离婚

陆小曼晚年爆黑料：徐志摩父亲和张幼仪“爬灰”，徐志摩伤心离婚

云霄纪史观

2025-12-19 23:25:56

51岁林志玲和老公黑泽良平现身东京机场，林志玲又瘦又高夫妻甜蜜

51岁林志玲和老公黑泽良平现身东京机场，林志玲又瘦又高夫妻甜蜜

阿废冷眼观察所

2025-12-19 13:32:14

1980年光绪墓开棺老照片：尸体脸朝下左腿断裂，毛发检测竟藏砒霜

1980年光绪墓开棺老照片：尸体脸朝下左腿断裂，毛发检测竟藏砒霜

抽象派大师

2025-11-26 06:22:16

中方大手一挥，再抛118亿美债，加拿大动作更大，特朗普开始换人

中方大手一挥，再抛118亿美债，加拿大动作更大，特朗普开始换人

三农老历

2025-12-20 05:30:53

福大大架构师每日一题

1075文章数 51关注度

往期回顾全部

科技要闻

许四清：具身智能的"ChatGPT时刻"还未到来

头条要闻

普京罕见回应私人生活大方承认正在恋爱中

头条要闻

普京罕见回应私人生活大方承认正在恋爱中

体育要闻

“恶龙”埃托奥，正在毁灭喀麦隆足球

娱乐要闻

曲协表态仅6天，郭德纲担心的事还是发生

财经要闻

日元加息，恐慌来了？货币三国杀

汽车要闻

“一体压铸”再引热议一旦受损真的修不起吗？

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

房产

亲子

健康

教育

家居要闻

高端私宅理想隐居圣地

房产要闻

广州有态度，一座国际化社区给出的城市答案

亲子要闻

宝妈必学，为什么教孩子不舒服的触摸要拒绝是错误的？

这些新疗法，让化疗不再那么痛苦

教育要闻

教育部这次动真格的了！教育界泰斗：不能让80%学生为20%精英陪跑

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版