网易首页

注册免费邮箱

网易首页 > 网易号 > 正文申请入驻

Ollama，危？

2025-11-05 14:12:52　来源: 机器学习与Python社区

北京举报

0

分享至

大家好，我是 Ai 学习的老章

Ollama 是咱们公众号的常客了，比较重要的几个功能升级我都写过文章介绍

Ollama 背后执行推理的核心技术其实是由 llama.cpp 承担的，GGUF 模型格式也是由 llama.cpp 的作者所开发。

现在 llama.cpp 迎来重大更新，它也有了自己的 Web UI，我测试了安装部署和自行打包，很多地方确实比 Ollama 还有方便好用。

官方介绍，优势如下：

完全免费、开源且由社区驱动
在所有硬件上表现出色
高级上下文和前缀缓存
并行和远程用户支持
极其轻量级且内存高效
充满活力且富有创造力的社区
100% 隐私

使用之前需要先安装 llama.cpp server

我还是喜欢命令行直接安装


## Winget (Windows)
winget install llama.cpp

 ## Homebrew (Mac and Linux)

 brew install llama.cpp

然后启动 UI，也是命令行，为了快速测试，我调用 Qwen2.5 的 0.5b

llama-server -hf Qwen/Qwen2.5-0.5B-Instruct-GGUF --jinja -c 0 --host 127.0.0.1 --port 8033

量化后模型文件来到不到 500Mb，我发现它默认选 q4_k_m

然后浏览器打开

随便问个问题，速度 97t/s

对比 Ollama 82t/s的样子

其他功能也都挺实用

从磁盘或剪贴板添加多个文本文件到对话的上下文中

将一个或多个 PDF 附件添加到对话中。默认情况下，PDF 的内容将被转换为纯文本，不包括任何视觉元素。

也可以在 AI 模型支持的情况下将 PDF 处理为图像。

当所选的 AI 模型具有视觉输入能力时，可以在对话中插入图片：

图片可以与文本上下文一起插入：

可以渲染数学表达式：

使用 Import/Export 选项直接管理私人对话：

新的 WebUI 对移动设备友好：

其他功能还有，比如：

支持通过 URL 参数传递输入
根据之前的讨论点编辑或重新生成消息以创建分支
同时运行多个聊天对话
并行图像处理
支持嵌入式渲染生成的 HTML/JS 代码
指定一个自定义的 JSON 模式以约束生成的输出到特定格式

目前硬伤是只能浏览器，想打包成 app 也可以，我使用的是 tw93 开发的 pake，一行命令即可，本地服务也可以打包成 app

然后它就将只能浏览器访问的 web 应用打包成 app 了

如此轻量舒服的应用，我与这位网友有相同的期待——支持其他模型的接入

总结来看，，但是 Ollama 玩了这么久也不是吃素的 1、Ollama 有更加方便的 app，随时切换本地模型甚是方便 2、Ollama 还有免费云模型可以调用呢，deepseek-v3.1:671b-cloud都敢给 3、网络问题，它目前只能支持 HF 下载模型，国内用户不友好 4、网络搜索和 MCP 也不支持

最后再说一句，它和 ollama 一样，都适合个人用户使用，企业就别折腾了，并发太差：

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐

热点推荐

大模型公司不搞浏览器搞Agent，实测找到原因了

量子位 2025-10-31 16:54:34
2 跟贴 2
这个 pubmed 插件自带全文下载通道，校外可用

生物学霸 2025-10-31 17:26:22
0 跟贴 0

10个Agent一键组队：并行智能体协作，端到端交付从24h缩减到4h！

新智元 2025-10-04 13:15:17
5 跟贴 5

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

量子位 2025-11-14 13:44:05
1 跟贴 1
多模态检索新突破，用软标签打破传统刚性映射约束，全面超越CLIP

量子位 2025-11-15 13:18:07
0 跟贴 0

3B参数MLLM Rex-Omni首度超越Grounding DINO，统一10+视觉任务

机器之心Pro 2025-11-13 16:52:27
0 跟贴 0

2.4万亿参数原生全模态，文心5.0一手实测来了

量子位 2025-11-13 17:30:09
4 跟贴 4
如何为LLM智能体编写工具？Anthropic官方教程来了

机器之心Pro 2025-09-12 21:50:08
0 跟贴 0

又一推理新范式：将LLM自身视作改进操作符，突破长思维链极限

机器之心Pro 2025-10-04 18:35:49
0 跟贴 0
视觉压缩称王？谷歌死守AI黑科技，DeepSeek一夜开源

新智元 2025-11-14 22:10:46
6 跟贴 6
商务部等部门：严控新车以二手车名义出口

财联社 2025-11-14 17:24:02
9389 跟贴 9389
贵州盘州亿元建“世界最大人造月亮”运行不到百天，停运5年成闲置项目：希望有注资盘活项目

红星新闻 2025-11-14 22:16:21
9480 跟贴 9480
陈冬、陈中瑞、王杰全部顺利出舱

央视新闻客户端 2025-11-14 17:26:30
10010 跟贴 10010
iPhone 通话录音还能这么玩？安卓用户看呆了！

雷科技 2025-08-13 17:37:06
643 跟贴 643
颠覆互联网的下一波浪潮：Agentic Web来了！

机器之心Pro 2025-08-07 18:59:55
85 跟贴 85
续航1300km+4.5秒破百！实测钛7：85%用户选顶配！

汽车有文化 2025-11-14 19:42:11
2 跟贴 2
日共要求高市撤回涉台言论：安倍在任时都不敢说

澎湃新闻 2025-11-15 08:24:40
4480 跟贴 4480
紫牛热点｜绝味鸭脖标价方式遭吐槽：半斤鸭舌89元，消费者结账直呼太贵

扬子晚报 2025-11-10 19:59:10
6708 跟贴 6708
关注 | 三大航司：日本机票免费退改！

天津广播 2025-11-15 15:29:10
1235 跟贴 1235
PixelRefer ：让AI从“看大图”走向“看懂每个对象”

机器之心Pro 2025-11-11 12:49:23
0 跟贴 0
OpenAI新论文拆解语言模型内部机制：用「稀疏电路」解释模型行为

机器之心Pro 2025-11-14 19:12:10
1 跟贴 1
OpenAI拆开AI「黑箱」，终于可以看懂GPT在想什么了

新智元 2025-11-14 22:09:58
0 跟贴 0
Jeff Dean盛赞姚班校友AI新研究，目前人已到Meta

量子位 2025-11-15 13:12:03
0 跟贴 0
SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控

机器之心Pro 2025-11-14 19:18:57
0 跟贴 0
全球最大开源具身大模型！中国机器人跑完马拉松后开始学思考

新智元 2025-11-14 19:18:23
0 跟贴 0
智能体驱动：企业从“界面操作”到“智能助力”的必然路径

钛媒体APP 2025-10-20 16:40:12
0 跟贴 0
从印度二本到Meta副总裁！被世界拒绝15次的他，撑起AI时代地基

新智元 2025-11-15 13:05:14
5 跟贴 5
魔兽：暴雪超惊艳更新！自带伤害统计史诗更新，比插件还牛！

魔兽世界研究所 2025-11-15 11:56:14
3 跟贴 3
西班牙国王访华收获满满！全程享受高规格待遇，成功签下10份文件

军卫防务 2025-11-12 18:38:15
0 跟贴 0
求三角形面积，根据比例模型求解

公考客栈店小二 2025-11-12 14:33:00
0 跟贴 0
求△CDF 的面积，根据任意四边形的一半模型求解

公考客栈店小二 2025-11-14 10:33:00
0 跟贴 0
梦幻西游：175级帮派联赛狮驼岭，16+10硬件加身，拿武状元称谓！

浩仔说梦 2025-11-14 14:18:02
1 跟贴 1
两次运用等高模型求解，有难度

公考客栈店小二 2025-11-13 15:35:00
0 跟贴 0
航行警告黄海中部实弹射击

澎湃新闻 2025-11-15 12:51:06
97 跟贴 97
沧州中信银行纵容违规催收！砸门、尾随、恐吓家人，这都是他们干的事儿

指尖狮城 2025-11-15 10:10:35
0 跟贴 0
就是个模型，有啥大惊小怪的

沙雕动画 2025-11-15 15:50:41
0 跟贴 0
广东一县环卫所招聘博士监管垃圾转运站，入职等级为管理岗9级以上，当地人社局回应

大象新闻 2025-11-14 21:50:12
186 跟贴 186
诗人握持！《星鸣特攻》复活上PC！纯浪费磁盘空间！《使命召唤22》Steam褒贬不一

Steam社区 2025-11-15 11:35:13
2 跟贴 2
发布即开放：百度猎户座葫芦里卖的什么药？

量子位 2025-11-14 13:59:58
0 跟贴 0
梁文锋代表DeepSeek，他代表梁文锋

量子位 2025-11-15 13:20:30
0 跟贴 0

日本野心藏不住了？一旦开战，我军将如何吊打日军？

日本野心藏不住了？一旦开战，我军将如何吊打日军？

兵国大事

2025-11-15 00:45:04

高市早苗涉台错误言论，在日本国内遭到多方质疑

高市早苗涉台错误言论，在日本国内遭到多方质疑

环球时报新闻

2025-11-15 14:08:40

日本民众82%支持涉台武力表态中日军力对决风险下的亚太局势变局

日本民众82%支持涉台武力表态中日军力对决风险下的亚太局势变局

行者聊官

2025-11-12 16:59:14

库里49+4福克斯失绝杀勇士再胜马刺，巴特勒21+8文班亚马26+12+4

库里49+4福克斯失绝杀勇士再胜马刺，巴特勒21+8文班亚马26+12+4

湖人崛起

2025-11-15 13:12:37

关注 | 三大航司：日本机票免费退改！

关注 | 三大航司：日本机票免费退改！

天津广播

2025-11-15 15:29:10

遭逆转！王楚钦感慨：虽然一年没打什么比赛樊振东依旧是世界第1

遭逆转！王楚钦感慨：虽然一年没打什么比赛樊振东依旧是世界第1

风过乡

2025-11-15 14:57:13

人民日报撕开32岁周深处境：那英淘汰他时那句话，如今全部应验

人民日报撕开32岁周深处境：那英淘汰他时那句话，如今全部应验

动物奇奇怪怪

2025-11-13 01:23:59

颠覆认知！全球95%的人都携带的病毒，竟是100%红斑狼疮根源

颠覆认知！全球95%的人都携带的病毒，竟是100%红斑狼疮根源

徐德文科学频道

2025-11-14 21:02:26

中国武术大师露馅了！遇上真扳手根本砸不弯，承认：只能砸假的

中国武术大师露馅了！遇上真扳手根本砸不弯，承认：只能砸假的

念洲

2025-11-15 13:04:43

大反转！狗主人上门打砸遭反杀续：重要证据出现，谁杀了谁不好说

大反转！狗主人上门打砸遭反杀续：重要证据出现，谁杀了谁不好说

吭哧有力

2025-11-14 10:22:35

钟嘉欣婚变风波升级！曝其签婚前协议被骗婚，狂接工作争抚养权

钟嘉欣婚变风波升级！曝其签婚前协议被骗婚，狂接工作争抚养权

萌神木木

2025-11-15 12:42:02

就在今天！樊振东4-2王楚钦，创造全运会史无前例66年纪录，奇迹

就在今天！樊振东4-2王楚钦，创造全运会史无前例66年纪录，奇迹

侃球熊弟

2025-11-15 13:58:24

狂妄至极！日本大使：从未接受过“一个中国”政策，不需要撤回

狂妄至极！日本大使：从未接受过“一个中国”政策，不需要撤回

梁讯

2025-11-15 14:35:07

随着樊振东4-2逆转王楚钦，产生了两大不可思议：连续4届杀进决赛

随着樊振东4-2逆转王楚钦，产生了两大不可思议：连续4届杀进决赛

侃球熊弟

2025-11-15 13:24:14

杨兰兰最新消息！拒绝认罪，第四次庭审仍不现身

杨兰兰最新消息！拒绝认罪，第四次庭审仍不现身

霹雳炮

2025-11-14 19:22:49

26胜7负！樊振东回应4-2逆转王楚钦：他现在是国乒的绝对领军人物

26胜7负！樊振东回应4-2逆转王楚钦：他现在是国乒的绝对领军人物

风过乡

2025-11-15 14:36:33

热搜离谱的“广东缆车口老仙女打砸”事件：光看衣服，就强的可怕

热搜离谱的“广东缆车口老仙女打砸”事件：光看衣服，就强的可怕

嫹笔牂牂

2025-11-14 07:23:33

刘强东铁腕 “斩” 老臣！京东副总裁邵京平双 11 被开除

刘强东铁腕 “斩” 老臣！京东副总裁邵京平双 11 被开除

诗意世界

2025-11-14 15:06:16

致15死1失踪，湖南怀化沅水流域重大水上交通事故调查报告公布

致15死1失踪，湖南怀化沅水流域重大水上交通事故调查报告公布

界面新闻

2025-11-15 15:13:18

今年以来，中国已经垮塌了3座特大桥

今年以来，中国已经垮塌了3座特大桥

基本常识

2025-11-14 23:37:04

机器学习与Python社区

机器学习算法与Python

3195文章数 11068关注度

往期回顾全部

科技要闻

撕掉流量外衣，小米还剩什么？

头条要闻

山西"狗咬人被摔死"案狗主家10人进院喊"弄死你全家"

头条要闻

山西"狗咬人被摔死"案狗主家10人进院喊"弄死你全家"

体育要闻

樊振东和他的尖子班勇闯地表最强乒乓球赛

娱乐要闻

争议！评委张艺谋被质疑保送易烊千玺

财经要闻

小米之“惑”

汽车要闻

限时10.59万起新款星海S9将11月19日上市

态度原创

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

时尚

旅游

本地

数码

亲子

冬天的“销冠”，已被羽绒服预定

旅游要闻

跟“风”游，大理冬季热度不减

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

数码要闻

曝疑似小米Watch S5将支持UWB技术采用表冠设计

亲子要闻

呼吸道合胞病毒感染高发，1岁以内宝宝可在家门口接种疫苗

© 1997-2025 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 不良信息举报 Complaint Center | 廉正举报 | 侵权投诉

无障碍浏览进入关怀版