网易首页 > 网易号 > 正文 申请入驻

真·ChatGPT平替:无需显卡,MacBook、树莓派就能运行LLaMA

0
分享至

机器之心报道

编辑:小舟

Meta 发布的开源系列模型 LLaMA,将在开源社区的共同努力下发挥出极大的价值。

Meta 在上个月末发布了一系列开源大模型 ——LLaMA(Large Language Model Meta AI),参数量从 70 亿到 650 亿不等。由于模型参数量较少,只需单张显卡即可运行,LLaMA 因此被称为 ChatGPT 的平替。发布以来,已有多位开发者尝试在自己的设备上运行 LLaMA 模型,并分享经验。

虽然相比于 ChatGPT 等需要大量算力资源的超大规模的语言模型,单张显卡的要求已经很低了,但还能更低!最近有开发者实现了在 MacBook 上运行 LLaMA,还有开发者成功在 4GB RAM 的树莓派上运行了 LLaMA 7B。

这些都得益于一个名为 llama.cpp 的新项目,该项目在 GitHub 上线三天,狂揽 4.6k star。

项目地址:https://github.com/ggerganov/llama.cpp

Georgi Gerganov 是资深的开源社区开发者,曾为 OpenAI 的 Whisper 自动语音识别模型开发 whisper.cpp。

这次,llama.cpp 项目的目标是在 MacBook 上使用 4-bit 量化成功运行 LLaMA 模型,具体包括:

  • 没有依赖项的普通 C/C++ 实现;
  • Apple silicon first-class citizen—— 通过 Arm Neon 和 Accelerate 框架;
  • AVX2 支持 x86 架构;
  • 混合 F16 / F32 精度;
  • 4-bit 量化支持;
  • 在 CPU 上运行。

llama.cpp 让开发者在没有 GPU 的条件下也能运行 LLaMA 模型。项目发布后,很快就有开发者尝试在 MacBook 上运行 LLaMA,并成功在 64GB M2 MacBook Pro 上运行了 LLaMA 7B 和 LLaMA 13B。

在 M2 MacBook 上运行 LLaMA 的方法:https://til.simonwillison.net/llms/llama-7b-m2

如果 M2 芯片 MacBook 这个条件还是有点高,没关系,M1 芯片的 MacBook 也可以。另一位开发者分享了借助 llama.cpp 在 M1 Mac 上运行 LLaMA 模型的方法。

在 M1 Mac 上运行 LLaMA 的方法:https://dev.l1x.be/posts/2023/03/12/using-llama-with-m1-mac/

除了在 MacBook 上运行,还有开发者借助 llama.cpp 在 4GB RAM Raspberry Pi 4 上成功运行了 LLaMA 7B 模型。Meta 首席 AI 科学家、图灵奖得主 Yann LeCun 也点赞转发了。

以上是 3 个在普通硬件设备上成功运行 LLaMA 模型的例子,几位开发者都是借助 llama.cpp 实现的,可见 llama.cpp 项目的实用与强大。我们来具体看一下 llama.cpp 的使用方法。

以 7B 模型为例,运行 LLaMA 的大体步骤如下:

# build this repo

git clone https://github.com/ggerganov/llama.cppcd llama.cpp

make

# obtain the original LLaMA model weights and place them in ./models

ls ./models

65B 30B 13B 7B tokenizer_checklist.chk tokenizer.model

# install Python dependencies

python3 -m pip install torch numpy sentencepiece

# convert the 7B model to ggml FP16 format

python3 convert-pth-to-ggml.py models/7B/ 1

# quantize the model to 4-bits

./quantize.sh 7B

# run the inference

./main -m ./models/7B/ggml-model-q4_0.bin -t 8 -n 128

运行更大的 LLaMA 模型,需要设备有足够的存储空间来储存中间文件。

如果想获得像 ChatGPT 一样的交互体验,开发者只需要以 - i 作为参数来启动交互模式。

./main -m ./models/13B/ggml-model-q4_0.bin -t 8 -n 256 --repeat_penalty 1.0 --color -i -r "User:" \

-p \

"Transcript of a dialog, where the User interacts with an Assistant named Bob. Bob is helpful, kind, honest, good at writing, and never fails to answer the User's requests immediately and with precision.

User: Hello, Bob.

Bob: Hello. How may I help you today?

User: Please tell me the largest city in Europe.

Bob: Sure. The largest city in Europe is Moscow, the capital of Russia.

User:"

使用 --color 区分用户输入和生成文本之后,显示效果如下:

一番操作下来,开发者就能在自己的简单设备上运行 LLaMA 模型,获得类 ChatGPT 的开发体验。以下是项目作者 Georgi Gerganov 给出的 LLaMA 7B 模型详细运行示例:

make -j && ./main -m ./models/7B/ggml-model-q4_0.bin -p "Building a website can be done in 10 simple steps:" -t 8 -n 512

I llama.cpp build info:I UNAME_S: Darwin

I UNAME_P: arm

I UNAME_M: arm64

I CFLAGS: -I. -O3 -DNDEBUG -std=c11 -fPIC -pthread -DGGML_USE_ACCELERATE

I CXXFLAGS: -I. -I./examples -O3 -DNDEBUG -std=c++11 -fPIC -pthread

I LDFLAGS: -framework Accelerate

I CC: Apple clang version 14.0.0 (clang-1400.0.29.202)I CXX: Apple clang version 14.0.0 (clang-1400.0.29.202)

make: Nothing to be done for `default'.main: seed = 1678486056

llama_model_load: loading model from './models/7B/ggml-model-q4_0.bin' - please wait ...llama_model_load: n_vocab = 32000

llama_model_load: n_ctx = 512

llama_model_load: n_embd = 4096

llama_model_load: n_mult = 256

llama_model_load: n_head = 32

llama_model_load: n_layer = 32

llama_model_load: n_rot = 128

llama_model_load: f16 = 2

llama_model_load: n_ff = 11008

llama_model_load: ggml ctx size = 4529.34 MB

llama_model_load: memory_size = 512.00 MB, n_mem = 16384

llama_model_load: .................................... done

llama_model_load: model size = 4017.27 MB / num tensors = 291

main: prompt: 'Building a website can be done in 10 simple steps:'

main: number of tokens in prompt = 15

8893 -> 'Build'

292 -> 'ing'

263 -> ' a'

4700 -> ' website'

508 -> ' can'

367 -> ' be'

2309 -> ' done'

297 -> ' in'

29871 -> ' '

29896 -> '1'

29900 -> '0'

2560 -> ' simple'

6576 -> ' steps'

29901 -> ':'

sampling parameters: temp = 0.800000, top_k = 40, top_p = 0.950000

Building a website can be done in 10 simple steps:1) Select a domain name and web hosting plan

2) Complete a sitemap

3) List your products

4) Write product descriptions

5) Create a user account

6) Build the template

7) Start building the website

8) Advertise the website

9) Provide email support

10) Submit the website to search engines

A website is a collection of web pages that are formatted with HTML. HTML is the code that defines what the website looks like and how it behaves.The HTML code is formatted into a template or a format. Once this is done, it is displayed on the user's browser.The web pages are stored in a web server. The web server is also called a host. When the website is accessed, it is retrieved from the server and displayed on the user's computer.A website is known as a website when it is hosted. This means that it is displayed on a host. The host is usually a web server.A website can be displayed on different browsers. The browsers are basically the software that renders the website on the user's screen.A website can also be viewed on different devices such as desktops, tablets and smartphones.Hence, to have a website displayed on a browser, the website must be hosted.A domain name is an address of a website. It is the name of the website.The website is known as a website when it is hosted. This means that it is displayed on a host. The host is usually a web server.A website can be displayed on different browsers. The browsers are basically the software that renders the website on the user’s screen.A website can also be viewed on different devices such as desktops, tablets and smartphones. Hence, to have a website displayed on a browser, the website must be hosted.A domain name is an address of a website. It is the name of the website.A website is an address of a website. It is a collection of web pages that are formatted with HTML. HTML is the code that defines what the website looks like and how it behaves.The HTML code is formatted into a template or a format. Once this is done, it is displayed on the user’s browser.A website is known as a website when it is hosted

main: mem per token = 14434244 bytes

main: load time = 1332.48 ms

main: sample time = 1081.40 ms

main: predict time = 31378.77 ms / 61.41 ms per token

main: total time = 34036.74 ms

看来,LLaMA 将在 Meta 和开源社区的共同努力下,成为众多开发者钻研大规模语言模型的入口。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
茶叶是血糖的“加速器”?医生忠告:不想血糖升高,少喝4种茶

茶叶是血糖的“加速器”?医生忠告:不想血糖升高,少喝4种茶

橘子约定
2026-05-12 20:44:04
谢晖现状:重返上海申花,俄罗斯妻子风韵犹存,儿女双全财富自由

谢晖现状:重返上海申花,俄罗斯妻子风韵犹存,儿女双全财富自由

梁岱爱玩车
2026-05-03 18:54:17
53岁段奕宏跑步被偶遇,住北京豪宅小区环境如公园

53岁段奕宏跑步被偶遇,住北京豪宅小区环境如公园

萧鑟科普解说
2026-05-12 19:13:13
无忧传媒发布公告:经友好协商,与王暖暖女士正式解约;3年来完成超过300次商务合作

无忧传媒发布公告:经友好协商,与王暖暖女士正式解约;3年来完成超过300次商务合作

扬子晚报
2026-05-11 16:23:20
莫名其妙!世界银行前行长竟要求中国,“不许囤积化肥和粮食”

莫名其妙!世界银行前行长竟要求中国,“不许囤积化肥和粮食”

丁丁鲤史纪
2026-05-12 18:01:22
与日本荷兰同组!瑞典世界杯26人名单:1亿神锋入选 巴萨红星无缘

与日本荷兰同组!瑞典世界杯26人名单:1亿神锋入选 巴萨红星无缘

我爱英超
2026-05-12 23:03:21
伊朗没料到:打了一仗,没灭掉以色列,反在家门口逼出一个更狠的

伊朗没料到:打了一仗,没灭掉以色列,反在家门口逼出一个更狠的

一家说
2026-05-13 07:03:01
“汉坦病毒”来袭,医生提醒:宁可每天看电视,也不要出门做6事

“汉坦病毒”来袭,医生提醒:宁可每天看电视,也不要出门做6事

路医生健康科普
2026-05-11 17:39:53
天坛公园:5月13日至14日暂停开放

天坛公园:5月13日至14日暂停开放

南方都市报
2026-05-12 12:01:58
你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

你们都是什么时候对男女之事开窍的?网友:果然还是拦不住有心人

夜深爱杂谈
2026-02-21 21:37:02
56岁张嘉益现状,住西安大别墅,二婚娶女演员,如今新剧获赞

56岁张嘉益现状,住西安大别墅,二婚娶女演员,如今新剧获赞

标体
2026-05-12 19:18:39
特朗普访华团名单大换血!多了个不该少的人,少了个不该多的人

特朗普访华团名单大换血!多了个不该少的人,少了个不该多的人

赵探长TALK
2026-05-12 17:20:15
坏消息,湖人队东契奇西班牙之行发现伤情严重,夏天复出希望渺茫

坏消息,湖人队东契奇西班牙之行发现伤情严重,夏天复出希望渺茫

好火子
2026-05-12 23:02:23
日乒赛后采访:三单派出桥本,是早已猜测国乒会派出蒯曼!

日乒赛后采访:三单派出桥本,是早已猜测国乒会派出蒯曼!

林子说事
2026-05-13 06:05:11
心理学上说:如果一个人对家人不耐烦、易发火,对外人却客客气气、够温和,不是本性凉薄,根源无外乎有两点

心理学上说:如果一个人对家人不耐烦、易发火,对外人却客客气气、够温和,不是本性凉薄,根源无外乎有两点

心理观察局
2026-05-12 09:06:23
广东5人合同到期!杜润旺+2小将或留队,王少杰租借到期买断吗?

广东5人合同到期!杜润旺+2小将或留队,王少杰租借到期买断吗?

篮球资讯达人
2026-05-13 01:31:06
有没有人敢爆自己的瓜?网友:确定玩这么大吗?

有没有人敢爆自己的瓜?网友:确定玩这么大吗?

夜深爱杂谈
2026-02-18 20:55:58
娶到小时候的女神是一种怎样体验?三天没出门,后来想想不过如此

娶到小时候的女神是一种怎样体验?三天没出门,后来想想不过如此

另子维爱读史
2026-04-04 21:35:59
妻子参加同学聚会,我扮服务员潜入,见妻子被求婚她答应,我鼓掌

妻子参加同学聚会,我扮服务员潜入,见妻子被求婚她答应,我鼓掌

千秋历史
2026-05-11 20:35:52
曾因综艺爆红,广州东山口“明星老洋房”6310万元流拍

曾因综艺爆红,广州东山口“明星老洋房”6310万元流拍

中国房地产报官方号
2026-05-12 17:05:35
2026-05-13 08:31:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12979文章数 142648关注度
往期回顾 全部

科技要闻

谷歌剧透安卓重大升级 Gemini深度集成底层

头条要闻

凯文·沃什出任美联储主席 其岳父是特朗普总统的老友

头条要闻

凯文·沃什出任美联储主席 其岳父是特朗普总统的老友

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

时尚
本地
艺术
教育
军事航空

普通人真该学学如何穿搭!多穿裙子比裤子更时髦,大方提气质

本地新闻

用苏绣的方式,打开江西婺源

艺术要闻

这位女摄影师的航拍风景照片,简直太美了!

教育要闻

600分以下想要本科就业,如何报志愿

军事要闻

知情人士披露:美国或考虑恢复对伊朗军事行动

无障碍浏览 进入关怀版