网易首页 > 网易号 > 正文 申请入驻

Stable Diffusion的魅力:苹果下场优化,iPad、Mac上快速出图

0
分享至

机器之心报道

编辑:袁铭怿

苹果亲自下场优化,在iPhone、iPad、Mac等设备上以惊人的速度运行Stable Diffusion就是这么简单。

输入一句话就能生成图像的 Stable Diffusion 已经火爆数月。它是一个开源模型,而且在消费级 GPU 上就能运行,是一项普通人就能接触到的「黑科技」。

在该模型走红之初,就有人尝试将其移植到苹果设备上运行,比如 M1 Mac、iPhone 14 Pro,并把教程传授给大家。

但令人没想到的是,前几天,苹果竟亲自下场了,手把手教大家如何直接将 Stable Diffusion 模型转换为自家 iPhone、iPad 和 Mac 可以运行的版本。

以下是生成结果示例:

在苹果设备上运行 Stable Diffusion 和 Core ML + diffusers 生成的图像。

苹果在 macOS 13.1 和 iOS 16.2 中发布了针对 Stable Diffusion 的 Core ML 优化,并通过一个代码库对部署过程进行了详细讲解。

在三款苹果设备(M1 iPad Pro 8GB、M1 MacBook Pro 16GB、M2 MacBook Air 8GB)上的测试结果表明,苹果推出的相关优化基本可以保证最新版 Stable Diffusion(SD 2.0)在半分钟内生成一张分辨率为 512x512 的图。

对于苹果的这一举动,不少人感叹,一个开源社区构建的模型已经优秀到可以让大公司主动采用,确实非常了不起。

另外,大家也开始猜测,未来,苹果会不会直接把 Stable Diffusion 放到自己的设备里?

为什么要让 Stable Diffusion 可以在苹果设备上运行?

自 2022 年 8 月首次公开发布以来,Stable Diffusion 已经被艺术家、开发人员和爱好者等充满活力的社区广泛采用,能够以最少的文本 prompt 创建前所未有的视觉内容。相应地,社区在几周内就围绕这个核心技术构建了一个包含扩展和工具的庞大生态系统。Stable Diffusion 已经变得个性化,而且可以拓展到英语以外的其他语言,这要归功于像 Hugging Face diffusers 这样的开源项目。

除了通过文本 prompt 生成图像,开发人员还发现了 Stable Diffusion 其他创造性的用途,如图像编辑、修复、补全、超分辨率、风格迁移。随着 Stable Diffusion 应用的增多,要想打造出任何地方的创意人员都能使用的应用程序,就需要确保开发者能够有效地利用这项技术,这一点至关重要。

在所有应用程序中,模型在何处运行是 Stable Diffusion 的一大关键问题。有很多原因可以解释为什么在设备上部署 Stable Diffusion 比基于服务器的方法更可取。首先,终端用户的隐私可以受到保护,因为用户提供的作为模型输入的任何数据都保留在用户自己的设备上。

其次,在初次下载之后,用户不需要连接互联网就可以使用该模型。最后,在本地部署此模型能让开发人员减少或消除服务器方面的成本。

用 Stable Diffusion 产出可观的结果需要经过长时间的迭代,因此在设备上部署模型的核心挑战之一在于生成结果的速率。这需要执行一个复杂的流程,包括 4 个不同的神经网络,总计约 12.75 亿个参数。要了解更多关于如何优化这种大小和复杂性的模型,以在 Apple Neural Engine 上运行,可以参阅以前的文章:Deploying Transformers on the Apple Neural Engine。

文章地址:https://machinelearning.apple.com/research/neural-engine-transformers

上文中概述的优化原则可以推广到 Stable Diffusion,尽管它比文中研究的模型大 18 倍。为 Stable Diffusion 优化 Core ML 和简化模型转换,可以让开发者更容易在他们的应用程序中以保护隐私和经济可行的方式利用该技术,并使其在 Apple Silicon 上展现出的性能达到最佳状态。

这次发布的版本包括一个 Python 包,用于使用 diffusers 和 coremltools 将 Stable Diffusion 模型从 PyTorch 转换到 Core ML,以及一个 Swift 包来部署模型。请访问 Core ML Stable Diffusion 代码存储库以启动,并获取关于基准测试和部署的详细说明。

项目地址:https://github.com/apple/ml-stable-diffusion

项目介绍

整个代码库包括:

  • python_coreml_stable_diffusion,一个 Python 包,用于将 PyTorch 模型转换为 Core ML 格式,并使用 Python 版的 Hugging Face diffusers 执行图像生成;
  • StableDiffusion,一个 Swift 包,开发者可以把它作为依赖包添加到他们的 Xcode 项目中,在他们的应用程序中部署图像生成功能。Swift 包依赖于 python_coreml_stable_diffusion 生成的 Core ML 模型文件。

将模型转换为 Core ML 版本

步骤 1:创建 Python 环境并安装依赖包:

步骤 2:登录或注册 Hugging Face 账户,生成用户访问令牌,并使用令牌通过在终端窗口运行 huggingface-cli login 来设置 Hugging Face API 访问。

步骤 3:找到想在 Hugging Face Hub 上使用的 Stable Diffusion 版本,接受使用条款。默认型号版本为 “CompVis/stable-diffusion-v1-4”。

步骤 4:从终端执行以下命令生成 Core ML 模型文件 (.mlpackage)

python -m python_coreml_stable_diffusion.torch2coreml --convert-unet --convert-text-encoder --convert-vae-decoder --convert-safety-checker -o

M1 MacBook Pro 一般需要 15-20 分钟。成功执行后,构成 Stable Diffusion 的 4 个神经网络模型将从 PyTorch 转换为 Core ML 版 (.mlpackage),并保存到指定的 < output-mlpackages-directory>.

用 Python 生成图像

使用基于 diffusers 的示例 Python 管道运行文本到图像生成。

python -m python_coreml_stable_diffusion.pipeline --prompt "a photo of an astronaut riding a horse on mars" -i

-o --compute-unit ALL --seed 93

使用 Swift 生成图像

构建 Swift 项目需要:

  • macOS 13 或更新版本
  • 安装了命令行工具的 Xcode 14.1 或更新版本。
  • Core ML 模型和 tokenization 资源。

如果将此模型部署到:

  • iPhone: iOS 16.2 及以上版本和 iPhone 12 及以上版本
  • iPad: iPadOS 16.2 或更新版本和 M1 或更新版本
  • Mac: macOS 13.1 或更新版本和 M1 或更新版本

Swift 包包含两个产品:StableDiffusion 库和 StableDiffusionSample 命令行工具。这两个产品都需要提供 Core ML 模型和 tokenization 资源。

性能基准测试

标准 CompVis/stable-diffusion-v1-4 基准。该基准测试由苹果公司在 2022 年 11 月使用 iOS 16.2、iPadOS 16.2 和 macOS 13.1 的公开测试版进行。

针对 macOS 设备,执行的程序是 python_coreml_stable_diffusion。对于 iOS 和 ipad 设备,有一个建立在 StableDiffusion Swift 包上的最小 Swift 测试应用程序。

图像生成过程遵循标准配置:

50 个推理步骤,512x512 输出图像分辨率,77 文本 token 序列长度,无分类器引导 (unet 批大小为 2)。

参考文章:https://machinelearning.apple.com/research/stable-diffusion-coreml-apple-silicon

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大胜上海,吴前血布冲突,上海男篮输球罪人揪出,低迷没斗志不该

大胜上海,吴前血布冲突,上海男篮输球罪人揪出,低迷没斗志不该

东球弟
2024-04-19 21:54:35
燃气换表导致收费“爆表”?知名编剧发文:人在海南2个月,成都家中产生500多方用气量

燃气换表导致收费“爆表”?知名编剧发文:人在海南2个月,成都家中产生500多方用气量

鲁中晨报
2024-04-18 11:32:05
网传某大厂P9高管被裁,光赔偿金就接近82万!网友:比我们一辈子赚的还多

网传某大厂P9高管被裁,光赔偿金就接近82万!网友:比我们一辈子赚的还多

可达鸭面面观
2024-04-19 20:45:55
渣打在香港挂出10%的存款利率,以吸引内地资金

渣打在香港挂出10%的存款利率,以吸引内地资金

南方都市报
2024-04-19 15:12:10
广交会只来了一帮挑剔的贫穷国家

广交会只来了一帮挑剔的贫穷国家

君子天道
2024-04-19 21:04:12
逆天!曝某高校有法律专业学生偷外卖,被学马列与化学的学生投毒,不幸身亡

逆天!曝某高校有法律专业学生偷外卖,被学马列与化学的学生投毒,不幸身亡

可达鸭面面观
2024-04-19 11:32:56
两大家族开撕?菲第一夫人公开指责副总统:不道歉,这事就没完

两大家族开撕?菲第一夫人公开指责副总统:不道歉,这事就没完

鲁中晨报
2024-04-19 22:29:07
香港消委会揭露:哈啤验出呕吐毒素!哈啤回应:只在内地才销售!

香港消委会揭露:哈啤验出呕吐毒素!哈啤回应:只在内地才销售!

臨堃视野
2024-04-19 09:10:45
隔空PK陈梦!王曼昱淘汰日本一姐,拒绝输球扣分,奥运希望大增

隔空PK陈梦!王曼昱淘汰日本一姐,拒绝输球扣分,奥运希望大增

天涯沦落人
2024-04-19 18:55:30
见识了中国汽车最严重的腐败

见识了中国汽车最严重的腐败

后视镜里de未来
2024-04-19 18:37:11
欧盟跟着泼脏水:中国不仅坐山观虎斗,还下场了

欧盟跟着泼脏水:中国不仅坐山观虎斗,还下场了

观察者网
2024-04-19 10:43:11
老人给城管下跪后续:通报已出,网友炸锅,衡阳警方评论区沦陷

老人给城管下跪后续:通报已出,网友炸锅,衡阳警方评论区沦陷

叶公子
2024-04-19 06:58:21
嘲笑欧洲人用不起天然气的回旋镖飞回来了

嘲笑欧洲人用不起天然气的回旋镖飞回来了

历史总在押韵
2024-04-18 23:30:29
官方披露:已任湖北省委统战部二级巡视员的李涛严重违纪违法

官方披露:已任湖北省委统战部二级巡视员的李涛严重违纪违法

澎湃新闻
2024-04-19 21:26:27
40岁希尔顿现身纽约街头,全身上下毫无瑕疵,像天使一样

40岁希尔顿现身纽约街头,全身上下毫无瑕疵,像天使一样

风趣环球笔记
2024-04-18 05:00:03
墨西哥考察有感:出国看看,才知道中国制造的现状

墨西哥考察有感:出国看看,才知道中国制造的现状

茶狐看世界本尊
2024-04-19 09:25:36
上海六旬阿姨再婚后,想把87岁老母亲赶出家门,“没地方住让国家解决”!

上海六旬阿姨再婚后,想把87岁老母亲赶出家门,“没地方住让国家解决”!

环球网资讯
2024-04-19 19:07:22
北京这一夜:董宇辉被疯狂热捧,把资本的逐利本性,表现淋漓尽致

北京这一夜:董宇辉被疯狂热捧,把资本的逐利本性,表现淋漓尽致

影像温度
2024-04-19 17:09:18
刘和平:以色列反报复伊朗行动是一场阳谋

刘和平:以色列反报复伊朗行动是一场阳谋

直新闻
2024-04-19 17:29:00
【最新】广州天河宝马撞人案!温庆运,被执行死刑!

【最新】广州天河宝马撞人案!温庆运,被执行死刑!

粤穗平台
2024-04-19 10:46:42
2024-04-19 23:16:49
机器之心Pro
机器之心Pro
专业的人工智能媒体
8909文章数 141890关注度
往期回顾 全部

数码要闻

新款HomePod外观设计曝光!或配备全触控显示屏

头条要闻

山东聊城化工厂爆炸致10死 常务副市长被责令深刻检查

头条要闻

山东聊城化工厂爆炸致10死 常务副市长被责令深刻检查

体育要闻

安息吧勇士王朝,2013-2023

娱乐要闻

北影节开幕之夜,内娱女星千娇百媚

财经要闻

新华资管香港的秘密:猛投地产或致巨亏

科技要闻

最沉默的李想,最便宜的理想

汽车要闻

风神L7预售 东风汽车北京车展阵容公布

态度原创

游戏
家居
手机
亲子
公开课

变向出圈!解放日报大篇幅报道米哈游:只因带火了砂金石销量?

家居要闻

光影浮动 色块碰撞与线条起伏的情感呼应

手机要闻

华为路由器 AX3 / Pro 推送鸿蒙 4.2 系统更新,开启 IPv6 功能

亲子要闻

春季过敏季节,带家长来识别这个容易忽略的过敏原

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版