网易首页 > 网易号 > 正文 申请入驻

一行命令部署 Deepseek 并测速 0基础教程有手就行

0
分享至

关于 Deepseek R1 以及其他大模型常见的一些问题

Deepseek R1 是什么?

深度求索人工智能基础模型(简称“深度求索”或“DeepSeek”)是由深度求索(北京)科技有限公司开发的国产大语言模型。该模型基于深度学习技术,具备理解和生成人类语言的能力,可广泛应用于文本生成、对话交互、问答系统等领域。

DeepSeek-R1 是深度求索公司推出的具体模型版本,具备高性能的自然语言处理能力,能够处理复杂的文本生成任务,理解和生成自然流畅的文本,适用于多种应用场景,帮助用户高效完成各种任务。

为什么要本地部署?

虽然云端部署成本更低,很多服务商甚至提供了一键部署选项,Deepseek 官方也提供了网页/APP 访问,但我们仍有几个理由来进行本地部署:

  • 简单的学习部署方法与应用,输入代码/选择模型的时候,看到一些参数/名词然后搜索一下或者直接问大模型这些名词/参数是什么意思,也是理解 AIGC 的一种方式(请自行搜索什么是 AIGC)
  • 本地 AI 不依赖网络,部署完成后可以断网使用(不会出现某些软件/APP 结果自动加马赛克的问题)
  • 数据私密/安全性

当然从成本和性能来说,云端部署成本更低,也支持部署更大参数量的模型。受限于大部分用户的 RAM 和显卡显存大小,本地是不太可能部署诸如671B 参量的完整模型的。

参数量是什么?

在大型语言模型(如深度求索的 DeepSeek-R1)中,参数是指模型内部用于表示和处理信息的变量。这些参数是模型通过训练学习到的数值,用于描述模型如何将输入转换为输出。

简单来说,参数的数量决定了模型的复杂性和能力。一般来说,参数越多,模型的表达能力越强,但同时也会消耗更多的计算资源和内存。

例如
DeepSeek-R1-Distill-Qwen-7B-Q8,这里的 7B 就是参数量为 7Billon(70亿),而DeepSeek-R1-Distill-Qwen-14B-Q8 的参数量为 14Billon(14亿)。(这里的 Qwen 指本模型基于 Qwen 大模型进行蒸馏得来)

Q2/Q4/Q8 是什么?

量化的详细概念超出本文范畴,但下载/部署模型的时候,会有很多不同量化参数模型可供选择,我个人一般选择 Q8 来获得相对更高的精度。

Q 值越大模型文件大小和所需的 RAM/显存就越大,在零刻官方基于 SER9 Pro 系列机器测试 AI 性能的数据中,可以看到相同模型不同 Q 值所占用的 RAM 值。

我这里使用的是零刻 SER9 Pro,配置为 AMD AI 9 H365 + 32GB LPDDR5x + 1TB SSD,一般主流 16GB/32GB 的机器都可以正常安装和使用7B/14B 模型。

token 是什么?

这里我直接把问题丢给了 DeepSeek R1,它的回答其实是比较准确和清晰的,我们需要简单的记住 token 生成速度(token/s)越快,生成答案的速度也就越快。

蒸馏/Distill 是什么?

可以简单的人位蒸馏是一种压缩算法,它不是通过训练一个参数量较小的模型,而是将一个训练参数量更大的模型蒸馏为一个较小的模型。较小的模型可以使用更少的 RAM 和存储,获得更快的速度,降低部署的成本。

但蒸馏毕竟是一种类似压缩的方式,蒸馏后的相对小体积的模型能力必然是落后于更大体积的模型,以 DeepSeek-R1 官方在 AIME2024、MATH-500、GPQA、LiveCodeBench、CodeForces 等测试下的结果,可以看出随着整理模型由 32B → 14B → 7B → 1.5B,得分是依次降低的。

但好消息是
DeepSeek-R1-Distill-Qwen-32B 已经超越了 OpenAI o1-mini,而体积更小的DeepSeek-R1-Distill-Qwen-14B 和 32B 差距并不大,DeepSeek-R1-Distill-Qwen-14B 模型所需的 16GB 内存或是显存获得的成本也并不是非常高。

目前我使用的机器是零刻的 SER9 Pro,CPU 是 AMD AI9 365,GPU 部分是集成的 880M 核显,32GB 总内存。从速度上来说纯 GPU 模式会比 CPU 更快,但如果分配的显存不足,一旦从专属显存溢出到通用内存,生成速度(token/s)会受到比较明显的影响。

考虑到我这台机器并不只是运行 AI,日常也有办公、游戏、娱乐等需求,我目前使用的方案是将32GB 内存划分 16GB 给核显。模型部分则使用
DeepSeek-R1-Distill-Qwen-14B(-Q8),这样既能兼顾日常使用,同时也可以有比较大的显存供 LM Studio 和 Amuse 使用。

另外零刻官方基于 LM Studio,测试了 SER9 Pro 系列两款机器,纯 CPU、纯 GPU 模式下生成 token 的速度,大家可以参考一下。

需要说明的是 token/s 计算是存在一定误差的,这里对比了同样 GPU 模式下零刻 SER9 Pro HX370 和 H365 的成绩,相对规格稍低的 SER9 Pro AI 9 H365 生成速度比 HX370 更高,这部分差距应该就是测试误差造成的。不过反过来也说明 SER9 Pro AI 9 H365 的性能和规格稍高的 SER9 Pro HX370 基本是属于同一水准。

另外由于 AI 9 系列 CPU 性能很强,在
DeepSeek-R1-Distill-Qwen-14B-Q2 测试里,无论是 AI 9 HX370 还是 H365,CPU 生成速度都是略快于 GPU 的。如果你使用 Q2 之类的模型,或者是 7B-Q8,那么纯 CPU 模式效果会更好。

Ollama 部署 DeepSeek-R1

Ollama 和 LM Studio 都是比较方便的部署工具,不过对于初学者个人更推荐 Ollama,虽然使用 Ollama 要输入命令行。但是以实际体验来说,Ollama 的网络访问更通畅,无需换源或是对网络有额外的要求(这部分不是能说的)。软件安装也非常简单,直接官网下载后,一路下一步确认即可完成安装。

模型部分可以直接在顶部搜索栏搜索,也可以在下方主页点击模型名称进行跳转。

Windows 系统下有两个工具自带工具可以使用 Ollama,分别是传统的 CMD 和更新一些的 PowerShell,方法如下:

  • Win 键,输入 CMD,打开 CMD/命令提示符
  • Win 键,输入 PowerShell,打开 Windows PowerShell

以 CMD 为例,打开 Ollama 后输入 "ollama" 后回车,应该可以看到如下图这样多行的提示。

安装/运行模型的命令可以直接在 Ollama 的官网复制,在网页上先选择模型参数量,再点击右侧的复制按钮。回到 CMD 内,CTRL+V 快捷键粘贴命令,回车后即可开始下载/运行对应模型。

例如,我这里安装 DeepSeek-R1:14b,直接输入如下命令运行即可:

  • ollama run deepseek-r1:14b (注意单词间的空格)

第一次运行后下方会显示下载(pulling xxxx),下载完成后会自动运行该模型,已经下载过的模型则会直接运行了。(也就是对于 ollama 而言 run 即可用于下载也可以用于运行)

如果想要查看本机已经安装的模型,直接输入 ollama list 然后回车即可。

如何计算 token 生成速度?方法是加一个命令 --verbose,比如运行命令是:

  • ollama run deepseek-r1:14b

如果要计算生成速度,那么就修改为:

  • ollama run deepseek-r1:14b --verbose (注意是两个-)
  • 在生成答案结束后,会紫铜统计总用时、生成速度(eval rate)等信息

One More Thing:Chatbox 调用 Ollama

当然使用命令行只是为了安装大模型,实际调用时更建议使用单独的 UI 类工具,比如常用的 Chatbox。作为一款免费的工具,Chatbox 可以支持 Ollama 在内很多 API 的调用,无论是本地部署还是云端部署,Chatbox 都是一款值得考虑的助手类工具。

Chatbox 的安装方式也没有太多可说的,官网下载然后一路下一步即可,再配置 Chatbox 之前,建议先打开浏览器,输入:

  • 127.0.0.1:11434 (主要这里:是英文符号)并回车访问

如果看到 Ollama is running 的字样,说明 Ollama 已经在后台成功运行。

这时打开 Chatbox,选择——使用自己的 API Key 或本地模型

因为我们是本地通过 Ollama 部署,所以这里选择——Ollama API

Chatbox 默认就会填入 Ollama 的 API 域名,如果你是使用局域网设备部署,则需要替换 127.0.0.1 为对应主机的 IP 地址。页面内还需要选择模型,这里点击下方模型选择对应 Ollama 内的模型文件名(例如这里我是调用上面安装的 deepseek-r1:14b)即可。

然后在界面内,输入问题等待生成回答即可,一般没有意外这里就可以正常使用了。

Chatbox 本身也支持其他很多 API,包括但不限于本地 LM Studio,云端各种主流云服务,这部分内容大家可以自行挖掘,本文就不再赘述了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
员工一句话干掉泡泡玛特百亿市值,股价已跌40%

员工一句话干掉泡泡玛特百亿市值,股价已跌40%

蓝洞新消费
2025-11-08 09:32:36
全运女篮:李梦25分四川女篮73分大胜香港 两战狂胜171分

全运女篮:李梦25分四川女篮73分大胜香港 两战狂胜171分

醉卧浮生
2025-11-08 17:33:08
经不起查!长沙医生不雅视频升级,网传两人6个月共同出差27次…

经不起查!长沙医生不雅视频升级,网传两人6个月共同出差27次…

火山诗话
2025-11-07 13:42:14
震惊日本社会!12岁泰国少女被母亲带到日本,33天被迫接待60名男客人!

震惊日本社会!12岁泰国少女被母亲带到日本,33天被迫接待60名男客人!

东京新青年
2025-11-07 19:05:18
“三十如狼,四十如虎”,17分钟不雅视频,曾医生确实更主动一些

“三十如狼,四十如虎”,17分钟不雅视频,曾医生确实更主动一些

汉史趣闻
2025-11-07 15:54:10
听到红军城失守的消息,特朗普终于明白,自己不能再跟普京斗气了

听到红军城失守的消息,特朗普终于明白,自己不能再跟普京斗气了

影孖看世界
2025-11-08 18:18:49
2025中甲大结局:铁人夺冠携铜梁龙冲超,平果与红狮降级

2025中甲大结局:铁人夺冠携铜梁龙冲超,平果与红狮降级

懂球帝
2025-11-08 16:58:22
重磅:美国将用1850亿的俄资产支持乌克兰!特朗普豁免匈牙利

重磅:美国将用1850亿的俄资产支持乌克兰!特朗普豁免匈牙利

项鹏飞
2025-11-08 16:25:29
毛主席每年遗体防腐费用不菲,但中国人直呼:“花得值!”

毛主席每年遗体防腐费用不菲,但中国人直呼:“花得值!”

百态人间
2025-11-08 05:45:03
亲戚可以提出多离谱的要求?网友:这些严格来说不算是人了吧

亲戚可以提出多离谱的要求?网友:这些严格来说不算是人了吧

带你感受人间冷暖
2025-11-08 00:15:06
天塌了!一夜之间4家公司被立案,27万股东集体踩雷

天塌了!一夜之间4家公司被立案,27万股东集体踩雷

财经智多星
2025-11-08 08:25:14
两未成年人致7月龄婴儿死亡,因不满12岁未立案 监护人被判赔90万,只履行完10万

两未成年人致7月龄婴儿死亡,因不满12岁未立案 监护人被判赔90万,只履行完10万

红星新闻
2025-11-07 20:58:12
哪些省份被纳入“航母命名库”?海军回应

哪些省份被纳入“航母命名库”?海军回应

新京报
2025-11-08 16:23:37
40岁黄希扬泪如雨下!1265天两次落泪:终于把中超还给球迷

40岁黄希扬泪如雨下!1265天两次落泪:终于把中超还给球迷

奥拜尔
2025-11-08 17:09:49
重大突破:郑丽文放弃国民党反动顽固立场

重大突破:郑丽文放弃国民党反动顽固立场

雪中风车
2025-11-08 10:02:00
11月8日俄乌最新:重大胜利

11月8日俄乌最新:重大胜利

西楼饮月
2025-11-08 15:38:25
讲老百姓爱听、能听懂的话!多个省委宣讲团已组建,省委书记任团长

讲老百姓爱听、能听懂的话!多个省委宣讲团已组建,省委书记任团长

政知新媒体
2025-11-07 23:04:31
俄副总理自曝亲自参战:用狙击步枪在乌军袭击时还击

俄副总理自曝亲自参战:用狙击步枪在乌军袭击时还击

鲁中晨报
2025-11-08 18:52:01
人美声甜的曾琦多张靓照曝光,停职后三大困境缠身,未来渺茫

人美声甜的曾琦多张靓照曝光,停职后三大困境缠身,未来渺茫

公子麦少
2025-11-07 14:36:16
美国的选举结果利好乌克兰,可能使特朗普不得不立即转向……

美国的选举结果利好乌克兰,可能使特朗普不得不立即转向……

翻开历史和现实
2025-11-07 10:22:57
2025-11-08 20:39:00
酷潮玩数码
酷潮玩数码
最硬核的数码
178文章数 432关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

"全网最像夫妻"被喊话测DNA 妻子:做过婚检 越长越像

头条要闻

"全网最像夫妻"被喊话测DNA 妻子:做过婚检 越长越像

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

古二再度放料!秦雯王家卫吐槽出现新人物

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

艺术
手机
房产
教育
公开课

艺术要闻

40岁老板娘风流成性,同时交往多名男友!被情人痛下杀手...

手机要闻

一加15T再次被确认:规格已基本清晰!iQOO 15 mini:待定中!

房产要闻

封关倒计时!三亚主城 2.3 万 /㎡+ 即买即住,手慢无!

教育要闻

绵阳1人保送清北!第39届全国中学生化学竞赛决赛国集正式公布

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版