网易首页 > 网易号 > 正文 申请入驻

干货分享 | 智谱GLM-Edge端侧模型在Wisemodel社区部署全流程

0
分享至

始智AI wisemodel.cn开源社区

始智AI wisemodel.cn社区是源自中国的中立开放的AI开源社区。正在,欢迎加入共同成长。wisemodel社区上线,H800/H20等资源上线,价格实惠,灵活方便,支持在线微调训练模型,及和,并。

GLM-Edge系列是智谱 AI推出的一个专门针对端侧应用场景开发的大语言对话模型及多模态理解模型,包括参数规模为1.5B/4B的语言模型(GLM-Edge-1.5B-Chat、GLM-Edge-4B-Chat),以及参数规模为2B/5B的多模态模型(GLM-Edge-V-2B、GLM-Edge-V-5B)。

其中,1.5B 和 2B 模型侧重于适配手机、车机等平台, 4B和5B 模型则 面向 PC 平台。GLM-Edge系列模型现已传至始智AI wisemodel开源平台,欢迎体验。

模型地址:

https://wisemodel.cn/models/ZhipuAI/glm-edge-4b-chat-gguf

https://wisemodel.cn/models/ZhipuAI/glm-edge-1.5b-chat-gguf

https://wisemodel.cn/models/ZhipuAI/glm-edge-v-5b-gguf

https://wisemodel.cn/models/ZhipuAI/glm-edge-v-2b-gguf

01

端侧挑战

在人工智能迈向落地应用的进程中,端侧大模型场景的开发与部署充满挑战。 首先,难题是硬件限制。 端侧设备,像手机、笔记本电脑这类,算力与内存远不及云端服务器。 手机即便搭载高端芯片,面对复杂大模型运算,可承载参数量也很有限,不少高阶应用难以落地,限制了大模型端侧功能。

其次,功耗问题突出,端侧设备多靠电池供电,续航备受重视。大模型运行能耗高,电量消耗快,设备得频繁充电,不符用户对长续航、便捷使用的需求。

第三,模型优化难度大,要将大模型部署到端侧,需量化、压缩。既要精简模型,适配有限硬件,又得保住性能、精度,把握好尺度很难,给模型设计与优化技术带来考验。

第四,适配性是一大挑战,端侧设备操作系统多样、应用生态碎片化,大模型融入时,实现流畅交互、功能调用不容易,当下多数模型与端侧系统还在磨合。数据隐私和安全很关键,端侧设备存有大量私人信息,大模型本地运行稍有差池就可能致数据泄露,危及用户权益。

02

创新突破

基于GLM-4系列的技术积累,智谱 GLM-Edge针对端侧实际部署情况,对模型结构和尺寸做了针对性的调整,以求在模型表现、实机推理效果和落地便利度之间达到平衡。 同时,通过与伙伴企业的深入合作和在推理优化上的不懈努力,在一些端侧平台上,GLM-Edge系列模型能以极快的速度运行。

例如,在高通骁龙8 Elite平台上,借助其强大的NPU算力,GLM-Edge通过混合量化方案,1.5B对话模型、2B多模态模型能实现每秒60 tokens以上的解码速度。在应用投机采样技术之后,两个模型能以峰值每秒100 tokens以上的解码速度运行。

与英特尔合作是关键一步,借助酷睿Ultra处理器性能,GLM-Edge模型推理效率大幅提升,实测超70 tokens/s,减少卡顿,交互流畅。功能上,GLM-Edge系列融合语言、多模态模型,可理解用户意图、实现对话交流、完成文本创作,还涉足视觉理解领域,适配多元场景。

在隐私保护方面,GLM-Edge 也有相应举措。以端侧智谱清言为例,设有本地处理“隐私模式”,用户数据、私密文档均能得到妥善保护,降低隐私泄露风险。 在生态构建上, GLM-Edge与华硕等 PC 厂商合作,推出AI PC智能助手。 这一合作拓展了产品应用场景,利于端侧大模型在更多设备、业务里落地,推动端侧大模型生态逐步完善、走向成熟。

03

应用场景

GLM-Edge模型在多领域有着丰富实际应用案例。

在智能助手方面,智谱与英特尔携手,基于该模型不同参数规模的语言及多模态模型打造端侧智谱清言,赋予用户端侧高速推理的AI新体验,精准把握用户意图、流畅对话。

编程场景里,CodeGeeX AIPC版结合酷睿Ultra处理器与GLM-Edge模型,低功耗、高性能地助力程序员完成代码生成、补全等任务。

金融领域,它能深挖基金经理观点、市场评价等文本,提取关键信息,辅助投资者决策;游戏中,像GameSkills-无畏契约AI陪练,靠其强大语言生成力,帮玩家掌握进阶技巧。

此外,还用于图像识别,为图片分类、标注、描述,支撑图像搜索等应用;办公时实现文本自动生成、摘要提取、智能翻译;做智能客服时,精准理解用户问题、高效作答,提升客户满意度。

04

实机运行数据

数据采集日截止到2024年11月28日。智谱还在积极与合作伙伴优化这些性能。

05

部署教程

首先在wisemodel上创建一个单卡A5000和3090的开发环境,选择基础开发镜像,选择模型文件/llm/ZhipuAI/glm-edge-4b-chat,填写好基本的信息,然后直接下一步,确认计费方式之后直接提交订单,开发环境就开始创建了。

开发环境创建好之后,通过notebook或通过SSH登录到开发环境上进行部署相关的操作。

SSH登录到开发环境之后,先从github上把GLM-Edge的代码拉到开发环境。

代码下载好之后,先从hugging face仓库安装4.4 7版本transformer库

pip install git+https://github.com/huggingface/transformers.git

再安装其他所需的库,安装命令如下:

pip install -r requirements.txt

安装好所需的库之后,先修改模型代码,路径为GLM-Edge下的./inference/web_demo.py,修改为以下3个地方:

保存,然后执行

python web_demo.py

模型部署的基本工作就完成,模型部署成功之后,回到开发环境详情的页面申请一个服务端口和域名地址。

把申请好的域名地址复制到浏览器里,demo正常运行,就可以开始体验模型服务了。

06

效果实测

简单试了一下用GLM-Edge进行大模型对话非常不错。

作者:段枚佳

----- END -----

wisemodel相关:

系统升级:

系列模型:

关于wisemodel更多

1

欢迎持续关注和支持

开源社区建设需要长期坚持和投入,更需要广大用户的积极参与、贡献和维护,欢迎大家加入wisemodel开源社区的志愿者计划和开源共创计划。期待更多开发者将开源成果,包括模型、数据集和代码等发布到 wisemodel.cn 社区,共建中立、开放的AI开源社区生态。欢迎扫码添加wisemodel微信,申请加入wisemodel社群,持续关注wisemodel.cn开源社区动态。

2

欢迎加盟wisemodel开源社区

始智AI wisemodel社区自2023年9月上线以来,逐渐成为影响力日益扩大的中立开放的AI开源社区,为了加快公司发展,我们长期需要技术、运营等人才加盟,技术侧重在AI infra、后端开发,熟悉K8S、模型训练和推理等技术, 以及熟悉开发者生态运营的成员,欢迎感兴趣的朋友加盟,可以通过添加wisemodel微信,或者将简历投递到邮箱:liudaoquan@wisemodel.cn

3

欢迎投稿优质内容

欢迎投稿分享人工智能领域相关的优秀研究成果,鼓励高校实验室、大企业研究团队、个人等,在wisemodel平台上分享各类优质内容,可以是AI领域最新论文解读、最新开源成果介绍,也可以是关于AI技术实践、应用和总结等。投稿可以发邮件到liudaoquan@wisemodel.cn,也可以扫码添加wisemodel微信。

4

关于wisemodel开源社区

始智AI wisemodel.cn开源社区由清华校友总会AI大数据专委会副秘书长刘道全创立,旨在打造和建设中立开放的AI开源创新社区,将打造成“HuggingFace”之外最活跃的AI开源社区,汇聚主要AI开源模型、数据集和代码等,欢迎高校科研院所、大型互联网公司、创新创业企业、广大个人开发者,以及政府部门、学会协会、联盟、基金会等,还有投资机构、科技媒体等,共同参与建设AI开源创新生态。

向上滑动查看

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
Nano Banana 2,泄露!

Nano Banana 2,泄露!

智东西
2026-02-25 19:57:23
江苏追认:周为号同志留党察看二年,是什么意思?

江苏追认:周为号同志留党察看二年,是什么意思?

江南江南
2026-02-26 15:00:53
著名演员罗伯特自杀离世,享年71岁,被躁郁症折磨选择轻生

著名演员罗伯特自杀离世,享年71岁,被躁郁症折磨选择轻生

素素娱乐
2026-02-25 15:29:00
2025年全球汽车销量TOP 10榜单出炉:比亚迪、上汽、吉利入围

2025年全球汽车销量TOP 10榜单出炉:比亚迪、上汽、吉利入围

PChome电脑之家
2026-02-26 21:28:17
俄乌冲突四周年:战场上的那个“傻士兵”,得到了双方的怜悯眷顾

俄乌冲突四周年:战场上的那个“傻士兵”,得到了双方的怜悯眷顾

超人强动物俱乐部
2026-02-25 19:28:50
精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

深度报
2026-02-11 23:35:03
“福特”号航母650个厕所坏了近9成,近5000人上厕所排队要四五十分钟,美军只能先停靠希腊

“福特”号航母650个厕所坏了近9成,近5000人上厕所排队要四五十分钟,美军只能先停靠希腊

大象新闻
2026-02-24 12:44:26
新华社快讯:美乌在瑞士日内瓦举行会谈

新华社快讯:美乌在瑞士日内瓦举行会谈

新华社
2026-02-26 20:46:35
新加坡大满贯赛:奥运亚军被淘汰!0:3不敌朱雨玲,国乒6人出局

新加坡大满贯赛:奥运亚军被淘汰!0:3不敌朱雨玲,国乒6人出局

国乒二三事
2026-02-26 12:28:13
想取代方便面的“绿皮霸主”,没逃过时代“围剿”

想取代方便面的“绿皮霸主”,没逃过时代“围剿”

博客COVER
2026-02-25 23:38:35
美国驻华大使抵京上任,落地后第一句话,让中国不再对他抱有幻想

美国驻华大使抵京上任,落地后第一句话,让中国不再对他抱有幻想

东极妙严
2026-02-25 20:02:08
峰回路转!一度被放弃的全美第一,近5战场均21+6,有望成为核心

峰回路转!一度被放弃的全美第一,近5战场均21+6,有望成为核心

禾三千体育
2026-02-26 20:28:50
台军女飞行员郭文静:只要长官敢下令,我会毫不犹豫的击落歼20!

台军女飞行员郭文静:只要长官敢下令,我会毫不犹豫的击落歼20!

顾史
2026-01-21 21:04:39
美国女议员:谷爱凌生在美国却不尊重美国 不回中国还要回美国

美国女议员:谷爱凌生在美国却不尊重美国 不回中国还要回美国

念洲
2026-02-26 08:33:10
中英签下45亿大单后,英国宣布出手,中企也被拉黑,外交部反击

中英签下45亿大单后,英国宣布出手,中企也被拉黑,外交部反击

明天见灌装冰块
2026-02-26 21:12:09
男篮首节被日本吊打!防守+篮板全垮,进攻多人打铁,战术也不行

男篮首节被日本吊打!防守+篮板全垮,进攻多人打铁,战术也不行

篮球资讯达人
2026-02-26 18:32:56
“体坛败类”马俊仁,强迫队员集体切阑尾,亲自为女队员打禁药

“体坛败类”马俊仁,强迫队员集体切阑尾,亲自为女队员打禁药

米果说识
2026-02-22 11:29:00
14834亿!英伟达炸裂年报:日赚超20亿,中国H20收入4亿,黄仁勋爆料Groq和OpenAI

14834亿!英伟达炸裂年报:日赚超20亿,中国H20收入4亿,黄仁勋爆料Groq和OpenAI

芯东西
2026-02-26 11:53:11
奖金1200万,空中技巧摘金背后,王心迪为徐梦桃洗袜子的真实生活

奖金1200万,空中技巧摘金背后,王心迪为徐梦桃洗袜子的真实生活

篮球看比赛
2026-02-26 16:04:39
中国禁止手机搭载WiFi的禁令,为何无疾而终了?

中国禁止手机搭载WiFi的禁令,为何无疾而终了?

真的好爱你
2026-02-25 00:53:59
2026-02-26 22:00:49
wisemodel开源社区 incentive-icons
wisemodel开源社区
始智AI wisemodel.cn开源社区,打造中国版“huggingface”
458文章数 14关注度
往期回顾 全部

科技要闻

单季营收681亿净利429亿!英伟达再次炸裂

头条要闻

男子因银行系统错误"欠款1000万亿":工厂可能会被拍卖

头条要闻

男子因银行系统错误"欠款1000万亿":工厂可能会被拍卖

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

向华强公开表态 财产留给儿媳妇郭碧婷

财经要闻

中国AI调用量超美国 4款大模型霸榜前5

汽车要闻

40岁的吉利,不惑于内外

态度原创

艺术
家居
数码
房产
亲子

艺术要闻

2025第三届全国水粉画大展 | 入选作品选刊

家居要闻

归隐于都市 慢享自由

数码要闻

机械革命2026款耀世16 Pro游戏本预售,8699元

房产要闻

2.2万/m²起!三亚主城性价比标杆 海垦·桃花源实景现房春节被疯抢

亲子要闻

本想假哭逗女儿,结果她没哭,我反倒真哭了,哈哈哈。

无障碍浏览 进入关怀版