网易首页 > 网易号 > 正文 申请入驻

Ollama,危?

0
分享至

大家好,我是 Ai 学习的老章

Ollama 是咱们公众号的常客了,比较重要的几个功能升级我都写过文章介绍

Ollama 背后执行推理的核心技术其实是由 llama.cpp 承担的,GGUF 模型格式也是由 llama.cpp 的作者所开发。

现在 llama.cpp 迎来重大更新,它也有了自己的 Web UI,我测试了安装部署和自行打包,很多地方确实比 Ollama 还有方便好用。

官方介绍,优势如下:

  • 完全免费、开源且由社区驱动

  • 在所有硬件上表现出色

  • 高级上下文和前缀缓存

  • 并行和远程用户支持

  • 极其轻量级且内存高效

  • 充满活力且富有创造力的社区

  • 100% 隐私

使用之前需要先安装 llama.cpp server


我还是喜欢命令行直接安装


## Winget (Windows)
winget install llama.cpp

## Homebrew (Mac and Linux)

brew install llama.cpp

然后启动 UI,也是命令行,为了快速测试,我调用 Qwen2.5 的 0.5b

llama-server -hf Qwen/Qwen2.5-0.5B-Instruct-GGUF --jinja -c 0 --host 127.0.0.1 --port 8033

量化后模型文件来到不到 500Mb,我发现它默认选 q4_k_m


然后浏览器打开


随便问个问题,速度 97t/s


对比 Ollama 82t/s的样子


其他功能也都挺实用

从磁盘或剪贴板添加多个文本文件到对话的上下文中


将一个或多个 PDF 附件添加到对话中。默认情况下,PDF 的内容将被转换为纯文本,不包括任何视觉元素。


也可以在 AI 模型支持的情况下将 PDF 处理为图像。


当所选的 AI 模型具有视觉输入能力时,可以在对话中插入图片:


图片可以与文本上下文一起插入:


可以渲染数学表达式:


使用 Import/Export 选项直接管理私人对话:


新的 WebUI 对移动设备友好:


其他功能还有,比如:

  • 支持通过 URL 参数传递输入

  • 根据之前的讨论点编辑或重新生成消息以创建分支

  • 同时运行多个聊天对话

  • 并行图像处理

  • 支持嵌入式渲染生成的 HTML/JS 代码

  • 指定一个自定义的 JSON 模式以约束生成的输出到特定格式

目前硬伤是只能浏览器,想打包成 app 也可以,我使用的是 tw93 开发的 pake,一行命令即可,本地服务也可以打包成 app


然后它就将只能浏览器访问的 web 应用打包成 app 了


如此轻量舒服的应用,我与这位网友有相同的期待——支持其他模型的接入


总结来看,,但是 Ollama 玩了这么久也不是吃素的 1、Ollama 有更加方便的 app,随时切换本地模型甚是方便 2、Ollama 还有免费云模型可以调用呢,deepseek-v3.1:671b-cloud都敢给 3、网络问题,它目前只能支持 HF 下载模型,国内用户不友好 4、网络搜索和 MCP 也不支持

最后再说一句,它和 ollama 一样,都适合个人用户使用,企业就别折腾了,并发太差:

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
日本野心藏不住了?一旦开战,我军将如何吊打日军?

日本野心藏不住了?一旦开战,我军将如何吊打日军?

兵国大事
2025-11-15 00:45:04
高市早苗涉台错误言论,在日本国内遭到多方质疑

高市早苗涉台错误言论,在日本国内遭到多方质疑

环球时报新闻
2025-11-15 14:08:40
日本民众82%支持涉台武力表态 中日军力对决风险下的亚太局势变局

日本民众82%支持涉台武力表态 中日军力对决风险下的亚太局势变局

行者聊官
2025-11-12 16:59:14
库里49+4福克斯失绝杀勇士再胜马刺,巴特勒21+8文班亚马26+12+4

库里49+4福克斯失绝杀勇士再胜马刺,巴特勒21+8文班亚马26+12+4

湖人崛起
2025-11-15 13:12:37
关注 | 三大航司:日本机票免费退改!

关注 | 三大航司:日本机票免费退改!

天津广播
2025-11-15 15:29:10
遭逆转!王楚钦感慨:虽然一年没打什么比赛 樊振东依旧是世界第1

遭逆转!王楚钦感慨:虽然一年没打什么比赛 樊振东依旧是世界第1

风过乡
2025-11-15 14:57:13
人民日报撕开32岁周深处境:那英淘汰他时那句话,如今全部应验

人民日报撕开32岁周深处境:那英淘汰他时那句话,如今全部应验

动物奇奇怪怪
2025-11-13 01:23:59
颠覆认知!全球95%的人都携带的病毒,竟是100%红斑狼疮根源

颠覆认知!全球95%的人都携带的病毒,竟是100%红斑狼疮根源

徐德文科学频道
2025-11-14 21:02:26
中国武术大师露馅了!遇上真扳手根本砸不弯,承认:只能砸假的

中国武术大师露馅了!遇上真扳手根本砸不弯,承认:只能砸假的

念洲
2025-11-15 13:04:43
大反转!狗主人上门打砸遭反杀续:重要证据出现,谁杀了谁不好说

大反转!狗主人上门打砸遭反杀续:重要证据出现,谁杀了谁不好说

吭哧有力
2025-11-14 10:22:35
钟嘉欣婚变风波升级!曝其签婚前协议被骗婚,狂接工作争抚养权

钟嘉欣婚变风波升级!曝其签婚前协议被骗婚,狂接工作争抚养权

萌神木木
2025-11-15 12:42:02
就在今天!樊振东4-2王楚钦,创造全运会史无前例66年纪录,奇迹

就在今天!樊振东4-2王楚钦,创造全运会史无前例66年纪录,奇迹

侃球熊弟
2025-11-15 13:58:24
狂妄至极!日本大使:从未接受过“一个中国”政策,不需要撤回

狂妄至极!日本大使:从未接受过“一个中国”政策,不需要撤回

梁讯
2025-11-15 14:35:07
随着樊振东4-2逆转王楚钦,产生了两大不可思议:连续4届杀进决赛

随着樊振东4-2逆转王楚钦,产生了两大不可思议:连续4届杀进决赛

侃球熊弟
2025-11-15 13:24:14
杨兰兰最新消息!拒绝认罪,第四次庭审仍不现身

杨兰兰最新消息!拒绝认罪,第四次庭审仍不现身

霹雳炮
2025-11-14 19:22:49
26胜7负!樊振东回应4-2逆转王楚钦:他现在是国乒的绝对领军人物

26胜7负!樊振东回应4-2逆转王楚钦:他现在是国乒的绝对领军人物

风过乡
2025-11-15 14:36:33
热搜离谱的“广东缆车口老仙女打砸”事件:光看衣服,就强的可怕

热搜离谱的“广东缆车口老仙女打砸”事件:光看衣服,就强的可怕

嫹笔牂牂
2025-11-14 07:23:33
刘强东铁腕 “斩” 老臣!京东副总裁邵京平双 11 被开除

刘强东铁腕 “斩” 老臣!京东副总裁邵京平双 11 被开除

诗意世界
2025-11-14 15:06:16
致15死1失踪,湖南怀化沅水流域重大水上交通事故调查报告公布

致15死1失踪,湖南怀化沅水流域重大水上交通事故调查报告公布

界面新闻
2025-11-15 15:13:18
今年以来,中国已经垮塌了3座特大桥

今年以来,中国已经垮塌了3座特大桥

基本常识
2025-11-14 23:37:04
2025-11-15 17:23:00
机器学习与Python社区 incentive-icons
机器学习与Python社区
机器学习算法与Python
3195文章数 11068关注度
往期回顾 全部

科技要闻

撕掉流量外衣,小米还剩什么?

头条要闻

山西"狗咬人被摔死"案狗主家10人进院 喊"弄死你全家"

头条要闻

山西"狗咬人被摔死"案狗主家10人进院 喊"弄死你全家"

体育要闻

樊振东和他的尖子班 勇闯地表最强乒乓球赛

娱乐要闻

争议!评委张艺谋被质疑保送易烊千玺

财经要闻

小米之“惑”

汽车要闻

限时10.59万起 新款星海S9将11月19日上市

态度原创

时尚
旅游
本地
数码
亲子

冬天的“销冠”,已被羽绒服预定

旅游要闻

跟“风”游,大理冬季热度不减

本地新闻

沈阳都市圈“冷资源”点燃“热联动” “组团”北上“圈粉”哈尔滨

数码要闻

曝疑似小米Watch S5将支持UWB技术 采用表冠设计

亲子要闻

呼吸道合胞病毒感染高发,1岁以内宝宝可在家门口接种疫苗

无障碍浏览 进入关怀版