网易首页 > 网易号 > 正文 申请入驻

Docker Model Runner终结了我的本地AI工具链

0
分享至

我曾经的本地AI配置堪称灾难。Ollama作为后台服务运行。给LangChain实验单独建了一个Python虚拟环境。另一个终端跑着llama.cpp,因为我想测试量化模型。三种不同的API格式,三个不同的端口号,三个每次macOS更新都会独立崩溃的东西。

然后Docker推出了Model Runner,我把这些全删了。


Model Runner到底是什么


它内置于Docker Desktop,无需单独安装。拉取模型的方式和拉取镜像一样:

docker model pull ai/llama3.1

docker model pull ai/phi3-mini

docker model pull ai/mistral

运行推理:

docker model run ai/llama3.1 "Explain NUMA topology in two sentences"

或者直接调用API端点,兼容OpenAI格式:

curl http://localhost:12434/engines/llama3.1/v1/chat/completions \

-H "Content-Type: application/json" \

"messages": [{"role": "user", "content": "What is OKE?"}],

"max_tokens": 100

就这样。不需要Python,不需要虚拟环境,不需要pip install,不需要CUDA驱动(Mac上用Metal,其他平台用CPU)。直接就能跑。

为什么我从Ollama切换过来

Ollama还行。我用了好几个月。但有几件事让我烦:

端口冲突。Ollama默认占用11434。我总是忘了它在运行,然后纳闷11434端口怎么被占用了。Docker Model Runner跑在Docker虚拟机内部,不会以同样方式占用宿主机端口——它通过一个固定的端点访问。

更新管理。Ollama是单独的二进制文件,得单独更新。Model Runner的更新跟着Docker Desktop走。少操一份心。

API兼容性。我在OKE生产环境部署的是vLLM。vLLM暴露的是OpenAI兼容API。Model Runner也暴露OpenAI兼容API。我的客户端代码在本地和生产环境之间不用改。用Ollama的时候,我得不断在Ollama原生格式和OpenAI格式之间转换。

Docker上下文。Model Runner的模型可以在Docker Compose文件和Dockerfile里引用。这意味着我的本地开发栈可以把LLM作为服务,和API服务器、数据库、缓存放在一起——一个docker compose up全起来。

在Docker Compose里用Model Runner

这部分真正改变了我的工作流:

# docker-compose.yml

services:

api:

build: .

ports:

- "8080:8080"

environment:


- LLM_ENDPOINT=http://host.docker.internal:12434/engines/llama3.1/v1

depends_on:

- db

db:

image: postgres:16-alpine

environment:

POSTGRES_PASSWORD: dev

我的API服务器通过host.docker.internal:12434和Model Runner通信。在OKE生产环境,那个环境变量指向我的vLLM服务。同样的客户端代码,同样的prompt格式,不同的后端。

// 同样的代码,本地用Model Runner,OKE上用vLLM

func callLLM(prompt string) (string, error) {

endpoint := os.Getenv("LLM_ENDPOINT") + "/chat/completions"

body := map[string]interface{}{

"messages": []map[string]string{

{"role": "user", "content": prompt},

},

"max_tokens": 200,

jsonBody, _ := json.Marshal(body)

resp, err := http.Post(endpoint, "application/json", bytes.NewBuffer(jsonBody))

环境变量切换,代码不动。本地开发完,直接上生产。

实际体验

第一次跑docker model pull ai/llama3.1的时候,我以为会等很久。结果比想象中快。模型存在Docker的存储层里,和镜像共用一套管理机制。磁盘占用、清理、版本控制,都是熟悉的那套。

Metal后端在M3 Pro上的表现:7B模型推理速度够用,13B模型稍微慢一点,但能接受。没有量化模型的精细控制,但省下来的配置时间远超这点损失。

最意外的是稳定性。过去三个月macOS更新了两次,以前每次都得重新折腾Ollama和llama.cpp的依赖。这次什么都没坏。

谁适合用这个

如果你已经在用Docker Desktop,这是白送的功能。不用额外装任何东西,学习成本几乎为零。

如果你还在用Ollama但经常被端口冲突和格式转换烦到,值得试试。切换成本很低,docker model pull完就能跑。

如果你需要精细控制量化级别、自定义推理参数、或者跑特别大的模型,可能还是得用llama.cpp或者vLLM本地部署。Model Runner走的是"够用就好"的路线。

我的判断:本地AI工具链正在从"拼配置"转向"拼集成"。Docker把模型当成另一种容器资源来管理,这个抽象层省掉的心力,比多出来的那点性能损失值钱得多。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
正式取消!知名985高校:公众进校不用预约了

正式取消!知名985高校:公众进校不用预约了

南方都市报
2026-05-14 13:02:01
趁着大半个美国高层都在北京,坐镇白宫的万斯“杀伐果断”

趁着大半个美国高层都在北京,坐镇白宫的万斯“杀伐果断”

健身狂人
2026-05-15 01:35:03
参加中美国宴的中国公司名单曝光

参加中美国宴的中国公司名单曝光

野渡商业评论
2026-05-14 21:44:22
张雪宣布停产!博主:雷军出问题你建议退款 自己出问题只补偿

张雪宣布停产!博主:雷军出问题你建议退款 自己出问题只补偿

念洲
2026-05-14 14:29:33
特朗普这次访华,给中国经济带来的机遇……

特朗普这次访华,给中国经济带来的机遇……

微评社
2026-05-15 09:43:58
特朗普国宴吃北京烤鸭,照顾口味搭配牛排冰淇淋,爬天坛气喘吁吁

特朗普国宴吃北京烤鸭,照顾口味搭配牛排冰淇淋,爬天坛气喘吁吁

译言
2026-05-15 06:09:29
三角连体服引争议!28岁田径美女回应:不是穿给你看的 眼光低俗

三角连体服引争议!28岁田径美女回应:不是穿给你看的 眼光低俗

念洲
2026-05-14 14:28:32
美国主持人北京报道因违停被罚,恼羞成怒吐槽监控,反遭网友群嘲

美国主持人北京报道因违停被罚,恼羞成怒吐槽监控,反遭网友群嘲

译言
2026-05-15 06:06:28
川普访华国宴菜单曝光:雷军马斯克世纪同框,特朗普破例举杯!

川普访华国宴菜单曝光:雷军马斯克世纪同框,特朗普破例举杯!

大稻网络科技
2026-05-14 22:52:21
“中美关系新定位”,带给世界什么?

“中美关系新定位”,带给世界什么?

新民晚报
2026-05-15 09:50:45
14岁男生被蛇咬后淡定上课,看黑板模糊以为是近视,下午就医才发现是银环蛇咬的,医生:再晚一两个小时,后果不堪设想

14岁男生被蛇咬后淡定上课,看黑板模糊以为是近视,下午就医才发现是银环蛇咬的,医生:再晚一两个小时,后果不堪设想

扬子晚报
2026-05-15 10:20:33
四川武警营门推哨兵后续:大家都搞错了罪名,她面临的不是袭警罪

四川武警营门推哨兵后续:大家都搞错了罪名,她面临的不是袭警罪

奇思妙想草叶君
2026-05-13 18:25:17
特朗普爱吃的两道中国菜,好多老外都猜不到

特朗普爱吃的两道中国菜,好多老外都猜不到

老寓杂谈
2026-05-14 16:25:31
全世界都在看这场大活动,唯独这个小男孩成了最大惊喜

全世界都在看这场大活动,唯独这个小男孩成了最大惊喜

妙知
2026-05-15 10:09:34
法国公布世界杯26人名单:姆巴佩领衔 总价14.7亿欧 皇马中场落选

法国公布世界杯26人名单:姆巴佩领衔 总价14.7亿欧 皇马中场落选

我爱英超
2026-05-15 06:38:44
三胎生父被曝后,张柏芝案终于判了,好消息传来难怪早已立好遗嘱

三胎生父被曝后,张柏芝案终于判了,好消息传来难怪早已立好遗嘱

叨唠
2026-05-15 04:02:27
特朗普今晚吃的啥?国宴菜单曝光

特朗普今晚吃的啥?国宴菜单曝光

时代在线网
2026-05-15 00:42:15
35岁1个月,坎特成法国队历史入选世界杯名单第二年长外场球员

35岁1个月,坎特成法国队历史入选世界杯名单第二年长外场球员

懂球帝
2026-05-15 05:54:04
秦岭分水岭摩托车逆行致1死1伤,死者妻子:丈夫骑车很守规矩,但再也回不来了,说不恨是假的,但恨太累了

秦岭分水岭摩托车逆行致1死1伤,死者妻子:丈夫骑车很守规矩,但再也回不来了,说不恨是假的,但恨太累了

扬子晚报
2026-05-15 07:16:46
黄仁勋算不算中国人?血统追根溯源一目了然,下一代截然不同

黄仁勋算不算中国人?血统追根溯源一目了然,下一代截然不同

奇思妙想生活家
2026-05-14 00:17:49
2026-05-15 11:35:00
爬虫饲养员
爬虫饲养员
业余养了只叫“龙虾”的AI爬虫,主业是给互联网打工。
2786文章数 30关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

媒体:特朗普访华举世瞩目 又一次使用“最高级用语”

头条要闻

媒体:特朗普访华举世瞩目 又一次使用“最高级用语”

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛回应住男生单人间:女孩的配得感

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

游戏
时尚
艺术
数码
手机

《极限竞速:地平线6》评测9分:英国人递上的日本汽车文化名片

看《给阿嬷的情书》,带纸巾,别带懂王

艺术要闻

王洪文书法深得教员精髓!当下,书法是大众文化还是小众文化?

数码要闻

Mag7都在疯狂烧钱 苹果却在白嫖谷歌Gemini 分析师:这招真高!

手机要闻

对标大疆Pocket!OPPO、vivo年底齐推云台相机

无障碍浏览 进入关怀版