网易首页 > 网易号 > 正文 申请入驻

8 年老设备“逆天改命”!硬核开发者把大模型塞进 U 盘,树莓派 Zero W 变身「AI 神器」

0
分享至

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

在 AI 计算资源日益紧张的今天,如何在资源受限的设备上运行大语言模型(LLM)成为了许多开发者关注的焦点,也是他们探索的方向:Exo 工具可以在日常使用的设备上运行自己的 AI 集群、Radxa 也发布了在单板计算机上运行 DeepSeek R1 的教程……这些尝试都表明,将 LLM 部署到轻量级硬件上并非不可能。

于是在这种背景下,近来技术爱好者 Binh Pham 开始了新一轮“硬核改造”:他成功在树莓派 Zero W 上实现了本地运行 LLM,并将其封装进了一个 USB 设备,命名为 LLMStick。

某种程度上,你也可以把它看作是一款“AI U 盘”:用户只需将其插入电脑,就可以通过创建文本文件的方式与 LLM 交互,无需任何技术背景。

树莓派 Zero W:在极限环境下的 LLM 挑战

大体来说,这款自制的 AI U 盘外壳由 3D 打印而成,内部搭载了一块树莓派 Zero W 单板计算机,并配备了一块扩展板,以增加 USB 接口,使其能够直接插入主机使用。

其中,树莓派 Zero W 诞生于 2017 年,距今已有 8 年历史,其硬件规格十分有限:

● CPU:Broadcom BCM2835(ARMv6 架构,单核 1GHz)

● RAM:512MB

● 802.11n WiFi + 蓝牙 4.1(BLE)

相比之下,如今许多主流 LLM 依赖于 ARMv8-A 架构,并且通常需要 GPU 或 NPU(神经网络处理单元) 来加速推理计算——很显然,Binh Pham 选择的树莓派 Zero W 完全没有这些硬件优化。

源码魔改:llama.zero 诞生

为了让 LLM 在极限硬件上运行,Binh Pham 最初选择了 llama.cpp 作为推理引擎。

llama.cpp 是一个专为资源受限设备优化的开源 LLM 推理框架,能够在 CPU 上运行 Meta Llama 等大语言模型。可即便如此,在树莓派 Zero W 上运行 llama.cpp 依然困难重重,其中最大的障碍是:由于树莓派 Zero W 使用的是 ARMv6 架构,而 llama.cpp 的代码优化仅针对 ARMv8-A 及以上——这种架构差异会导致编译错误,因为 llama.cpp 依赖于特定的 Arm Neon 指令集,而这在树莓派 Zero W 的处理器上不可用。

面对这一挑战,Binh Pham 选择了一条十分硬核的解决方案——直接修改 llama.cpp 的源码,手动删除或调整所有不兼容 ARMv6 的部分。这意味着:

● 逐行审查源码,替换或移除了所有依赖于 ARMv8 架构的优化部分;

● 调整数据处理逻辑,使代码适配 ARMv6 指令集,确保在老旧架构上依然可以正常编译和运行;

● 优化编译流程,确保树莓派 Zero W 有限的内存不会导致编译崩溃。

这项工作不仅需要深厚的 ARM 架构知识,还要求对 llama.cpp 的底层实现极度熟悉。整个修改过程耗时数周,最终,Binh Pham 成功编写了一个适用于 ARMv6 的精简版 llama.cpp,并将其命名为 llama.zero。

打造 LLMStick:即插即用的 USB AI 设备

解决架构兼容问题后,Pham 进一步优化了 LLM 交互方式。他选择让树莓派 Zero W 运行在 USB Gadget Mode(USB 设备模式)下,这样设备可以被识别为一个 USB 存储设备,实现无缝交互。

具体来说,LLMStick 的使用方式非常简单:

(1)将 LLMStick 插入电脑的 USB 端口,它会显示为一个存储设备。

(2)用户在 USB 盘中创建一个文本文件,输入 prompt(提示词)。

(3)LLMStick 运行 llama.zero 进行推理计算,然后将生成的文本写回文件。

这种设计有效地将树莓派 Zero W 转变为一个便携式即插即用的 AI USB 设备,用户可以随时随地进行离线推理,而不需要专门的软件界面。

运行效果:性能堪忧,远未达到实用标准

不过,尽管 Binh Pham 确实成功地在树莓派 Zero W 上运行了LLM,但其性能表现仍然存在局限性。在实际测试中,Binh Pham 使用 15M 到 136M 等参数规模不同的 LLM 模型,并设定 64 tokens 为生成上限,最终测试结果如下:

● Tiny15M 模型:每个 token 生成时间为 223ms;

● Lamini-T5-Flan-77M 模型:每个 token 生成时间为 2.5s;

● SmolLM2-136M 模型:每个 token 生成时间为 2.2s。

从这些数据可以看出,即使是最小的模型,其生成速度仍然难以支撑实际应用,而规模较大的模型其速度则几乎慢得无法接受——Binh Pham 的实验虽然具有探索意义,但对于许多实际应用场景来说,在老旧、低功耗硬件上运行 LLM 并不现实。

许多开发者注意到了 Binh Pham 的这个项目,并提出了一个值得思考的问题:为什么不直接使用树莓派 Zero 2W 呢?显然,如果目标仅是实现 LLM 运行,树莓派 Zero 2W 是更好的选择:采用 ARMv8 架构,能直接运行 llama.cpp,无需大幅修改源码;四核 Cortex-A53 性能更强,能够运行更大的 LLM,提升推理速度;两者尺寸相同,Zero 2W 可作为 Zero W 的近乎无缝替代品。

然而,Binh Pham 依然坚持使用树莓派 Zero W,不少人猜测他可能是为了增加挑战性,也可能是想向开发者证明:即使是 8 年前的硬件,也能在合理优化后运行 LLM。

目前,Binh Pham 已经在 GitHub 上开源了 llama.zero 项目,并提供了完整的 llama.zero 编译教程和如何将树莓派 Zero W 作为 USB 设备使用的指南,感兴趣的开发者可前往查看:https://github.com/pham-tuan-binh/llama.zero。

https://www.tomshardware.com/raspberry-pi/raspberry-pi-zero/pi-zero-llm-usb-stick

https://www.cnx-software.com/2025/02/20/llmstick-an-ai-and-llm-usb-device-based-on-raspberry-pi-zero-w-and-optimized-llama-cpp/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
全球只剩2只了!还全都是公的,“中国神兽”该如何进行有效繁殖

全球只剩2只了!还全都是公的,“中国神兽”该如何进行有效繁殖

正经的烧杯1
2026-02-20 14:39:06
扎哈罗娃:俄不会暂停特别军事行动

扎哈罗娃:俄不会暂停特别军事行动

参考消息
2026-02-19 13:35:40
花样滑冰女单:美国华裔刘美贤夺金,坂本花织银牌,张瑞阳第19

花样滑冰女单:美国华裔刘美贤夺金,坂本花织银牌,张瑞阳第19

懂球帝
2026-02-20 06:38:04
暴涨388%,骨科帝国再度复兴!

暴涨388%,骨科帝国再度复兴!

医疗器械经销商联盟
2026-02-20 08:00:59
为什么西双版纳快变成“东北版纳”了?

为什么西双版纳快变成“东北版纳”了?

不相及研究所
2026-01-14 22:37:47
82岁大妈:先后请了5个住家保姆,才发现请保姆养老根本不靠谱

82岁大妈:先后请了5个住家保姆,才发现请保姆养老根本不靠谱

拾代谈生活
2026-02-19 12:09:53
《镖人》“武力值”排行榜:阿育娅第7,刀马第3,第1名无争议

《镖人》“武力值”排行榜:阿育娅第7,刀马第3,第1名无争议

观察鉴娱
2026-02-20 11:15:05
中国闹了个乌龙,沙漠种麦本为保粮仓,谁料金黄麦浪竟成治沙神器

中国闹了个乌龙,沙漠种麦本为保粮仓,谁料金黄麦浪竟成治沙神器

一网打尽全球焦点
2026-02-20 05:19:43
刚刚,破50亿!浙江大批人涌入

刚刚,破50亿!浙江大批人涌入

浙江之声
2026-02-19 20:41:32
亏损超5亿,吴京尽力了,2026年春节档第一票房惨案诞生了

亏损超5亿,吴京尽力了,2026年春节档第一票房惨案诞生了

靠谱电影君
2026-02-17 20:53:41
二手“苏菲”价格崩了?399起搞定Surface Pro4到底坑不坑?

二手“苏菲”价格崩了?399起搞定Surface Pro4到底坑不坑?

小兔子发现大事情
2026-02-19 20:53:16
宋慧乔抱爱犬拍新照,白衣淡妆好温柔,头发长长了一些

宋慧乔抱爱犬拍新照,白衣淡妆好温柔,头发长长了一些

笑猫说说
2026-02-20 15:16:51
正式官宣!8将加盟中超黑马,恒大名宿接手球队,新赛季值得期待

正式官宣!8将加盟中超黑马,恒大名宿接手球队,新赛季值得期待

体坛鉴春秋
2026-02-19 11:05:50
欧协附加赛1-1大冷门:英超球队遭弱旅逼平,无缘占得先机

欧协附加赛1-1大冷门:英超球队遭弱旅逼平,无缘占得先机

侧身凌空斩
2026-02-20 03:41:28
莫言:最讨厌正月里走亲戚,你拿两样破东西来我家了,我忙碌半天然后做一桌子菜给你,陪着假笑聊着家常。

莫言:最讨厌正月里走亲戚,你拿两样破东西来我家了,我忙碌半天然后做一桌子菜给你,陪着假笑聊着家常。

二胡的岁月如歌
2026-02-20 13:32:24
著名相声演员离世

著名相声演员离世

豆哥记录
2026-01-07 11:15:43
欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

欠中国的钱,委内瑞拉不还了?美财长:中国已无法继续获得委石油

我是盲流
2026-01-22 11:37:44
深度长文:为何恐龙上亿年没进化出智慧,人类百万年就产生文明?

深度长文:为何恐龙上亿年没进化出智慧,人类百万年就产生文明?

宇宙时空
2026-02-19 14:40:05
国家给我5个亿我就上交!福建男花2亿元珍藏了一张皇帝所睡的龙床

国家给我5个亿我就上交!福建男花2亿元珍藏了一张皇帝所睡的龙床

南权先生
2026-02-12 15:41:39
大批美国游客涌入中国,回国后坦言:客观对比,中国比美国强多了

大批美国游客涌入中国,回国后坦言:客观对比,中国比美国强多了

青仔的世界
2026-02-16 11:54:44
2026-02-20 16:11:00
CSDN incentive-icons
CSDN
成就一亿技术人
26330文章数 242232关注度
往期回顾 全部

数码要闻

TCL单月出货量超三星,登顶全球电视出货量第一

头条要闻

一家三口春节返乡途中患病儿子离世 服务区帮送饭捐款

头条要闻

一家三口春节返乡途中患病儿子离世 服务区帮送饭捐款

体育要闻

战胜冠军赢得冠军 宁忠岩终于翻过了那座山

娱乐要闻

苏翊鸣夺金朱易示爱,两人默契引热议

财经要闻

太疯狂!“顾客不问价直接出手”

科技要闻

莫迪举手欢呼 两大AI掌门人却握拳尴尬对峙

汽车要闻

量产甲醇插混 吉利银河星耀6甲醇插混版申报图

态度原创

本地
旅游
亲子
游戏
公开课

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

旅游要闻

云龟山万亩樱花烂漫迎客来

亲子要闻

朋友孩子生日送这个礼物,被夸了!

讲谈社《Wabisabi》《TrailRail》试玩上线 确认参展Next Fest

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版