网易首页 > 网易号 > 正文 申请入驻

Stable Diffusion作者团队成立AI公司“黑森林实验室”,已获a16z领投3100万美元融资

0
分享至

Stable Diffusion对开源图像生成领域带来了巨大的影响。他们的作者现在做什么呢?

昨天,a16z宣布投资了一家名为Black Forest Labs的AI公司。Black Forest Labs由 Robin Rombach、Patrick Esser 和 Andreas Blattmann 领导,他们是Stable Diffusion系列模型的原始共同创建者。

Black Forest Labs发布了一个12B的AI图像模型套件Flux.1,超越了Midjourney和DALL·E 3。同时,还预告了接下来要发布了文生视频模型,将会成为SOTA。

以下是关于Black Forest Labs的详细信息。

Black Forest Labs

Robin Rombach是Stable Diffusion的第一作者,也是SDXL、SD3的灵魂人物。此前,Robin Rombach带领研究团队(SD论文的大部分作者)离开了Stability AI出走创业。如今,创业公司正式官宣,Black Forest Labs。

Black Forest Labs是一支由杰出的 AI 研究人员和工程师组成的团队,在学术、工业和开源环境中开发基础生成式 AI 模型方面拥有出色的业绩。

他们在潜在扩散模型方面的工作为Stable Diffusion奠定了基础,并影响了 DALL-E 2 和 3 以及 Sora 等模型的核心架构元素。如今,Stable Diffusion已成为开源图像生成社区的支柱。在 Hugging Face 上,下载次数最多的 10 个文本转图像模型中有 9 个是基于稳定扩散的衍生模型。

团队的创新包括创建VQGAN和Latent Diffusion、用于图像和视频生成的Stable Diffusion模型( Stable Diffusion XL、Stable Video Diffusion、Rectified Flow Transformers)以及用于超快速实时图像合成的Adversarial Diffusion Distillation。

Black Forest Labs的使命深深扎根于生成式人工智能研究社区,旨在为图像和视频等媒体开发和推进最先进的生成式深度学习模型,并突破创造力、效率和多样性的界限。

Black Forest Labs表示,生成式人工智能将成为所有未来技术的基本组成部分,通过向广大受众提供模型,希望将其好处带给每个人,教育公众并增强对这些模型安全性的信任。

Black Forest Labs决心为生成式媒体打造行业标准。8月1日,作为实现这一目标的第一步,Black Forest Labs发布了FLUX.1 模型套件,推动了文本到图像合成的前沿发展。

Black Forest Labs的核心信念是,广泛使用的模型不仅能促进研究界和学术界的创新和协作,还能提高透明度,这对于信任和广泛采用至关重要。团队致力于开发最高质量的技术,并让尽可能广泛的受众能够使用它。

已获得3100万美元种子轮融资

Black Forest Labs宣布,已经完成了 3100 万美元的种子轮融资。

本轮融资由主要投资者Andreessen Horowitz(a16z)领投,天使投资人Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun以及其他知名的人工智能研究和公司建设专家也参与其中。

Black Forest Labs已收到来自General Catalyst和MätchVC的后续投资,以支持完成将欧洲最先进的人工智能带给全世界每个人的使命。

此外,Black Forest Labs的顾问委员会,包括在内容创作行业拥有丰富经验的Michael Ovitz ,以及神经风格转换的先驱和欧洲开放人工智能研究的领先专家Matthias Bethge 教授。

Flux.1 模型系列

Black Forest Labs发布了 FLUX.1 文本到图像模型套件,为文本到图像合成定义了图像细节、及时遵守、风格多样性和场景复杂性的全新最先进水平。

为了在可访问性和模型功能之间取得平衡,FLUX.1 有三种版本:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]:

  • FLUX.1 [pro]:FLUX.1 的最佳功能,提供最先进的性能图像生成,具有顶级的即时跟踪、视觉质量、图像细节和输出多样性。用户可以通过API注册以访问 FLUX.1 [pro] ,也可通过Replicate和fal.ai获得。此外,还提供专用和定制的企业解决方案。

  • FLUX.1 [dev]:FLUX.1 [dev] 是一种开放权重、指导提炼的模型,适用于非商业应用。FLUX.1 [dev] 直接从 FLUX.1 [pro] 提炼而来,具有相似的质量和及时遵守能力,同时比同等大小的标准模型更高效。FLUX.1 [dev] 权重可在HuggingFace上使用,并可直接在Replicate或Fal.ai上试用。对于商业环境中的应用,需要取得公司的许可证。

  • FLUX.1 [schnell]:最快的模型是为本地开发和个人使用量身定制的。FLUX.1 [schnell] 在 Apache2.0 许可下公开可用。类似地,FLUX.1 [dev],权重可在 Hugging Face 上使用,推理代码可在GitHub和HuggingFace 的 Diffusers中找到。此外,FLUX.1 [schnell] 在第一天就与ComfyUI集成。

所有公开的 FLUX.1 模型均基于多模态和 parallel diffusion transformer的混合架构,并缩放至 12B 个参数。通过基于流匹配(一种通用且概念简单的生成模型训练方法,其中包括扩散作为特例)改进了以前最先进的扩散模型。此外,通过结合旋转位置嵌入和并行注意层来提高模型性能并提高硬件效率。

在不久的将来会发布更详细的技术报告。

FLUX.1 定义了图像合成领域的最新技术。Black Forest Labs的模型在各自的模型类别中树立了新标准。FLUX.1 [pro] 和 [dev] 在以下每个方面都超越了 Midjourney v6.0、DALL·E 3 (HD) 和 SD3-Ultra 等热门模型:视觉质量、快速跟进、尺寸/长宽变化、排版和输出多样性。FLUX.1 [schnell] 是迄今为止最先进的几步模型,其表现不仅优于同类竞争对手,还优于 Midjourney v6.0 和 DALL·E 3 (HD) 等强大的非蒸馏模型。模型经过专门微调,以保留预训练的整个输出多样性。与目前最先进的技术相比,它们提供了显着改进的可能性,如下所示

所有 FLUX.1 型号变体均支持 0.1 和 2.0 百万像素的多种宽高比和分辨率,如下例所示。

接下来:SOTA 让所有人都能将文本转为视频

在发布 FLUX.1 文本转图像模型套件后,Black Forest Labs还预告了接下来的进展:凭借强大的创作能力,这些模型为即将推出的具有竞争力的生成式文本转视频系统套件奠定了坚实的基础。视频模型将以高清和前所未有的速度实现精确的创作和编辑。致力于继续开拓生成媒体的未来。

AI图像与视频生成,真是越来越热闹了!

| |

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太爽快了!中美会晤提出的第一个要求,中方开场白定调,高明!

太爽快了!中美会晤提出的第一个要求,中方开场白定调,高明!

观星赏月
2026-05-15 00:26:06
会谈现场气氛缓和,中方直言台湾问题,特朗普的反应值得细品

会谈现场气氛缓和,中方直言台湾问题,特朗普的反应值得细品

创造精彩剧情
2026-05-15 09:21:08
还在拱火,世体:居莱尔穿楚阿训练服领取奖杯,显然是在站队

还在拱火,世体:居莱尔穿楚阿训练服领取奖杯,显然是在站队

懂球帝
2026-05-14 15:05:24
曝勇士将保留11号签!有意裸足2.05米锋线:体测数据出炉天赋满满

曝勇士将保留11号签!有意裸足2.05米锋线:体测数据出炉天赋满满

颜小白的篮球梦
2026-05-15 10:22:00
红酒白酒全面崩盘,中国人为啥突然不愿意喝酒了呢?

红酒白酒全面崩盘,中国人为啥突然不愿意喝酒了呢?

流苏晚晴
2026-05-12 19:17:02
官方通报“离奇消失”?南通住建局这波操作引发质疑

官方通报“离奇消失”?南通住建局这波操作引发质疑

好通网
2026-05-15 10:15:10
岳父是体育总局主任,岳母是国家队教练,如今他胜任广东篮协会长

岳父是体育总局主任,岳母是国家队教练,如今他胜任广东篮协会长

凡知
2026-05-14 11:20:05
美籍华人回国最新规定

美籍华人回国最新规定

逍遥论经
2026-05-14 09:49:20
近十年国际足坛十大名帅:恩里克第3,齐达内第5,穆里尼奥垫底

近十年国际足坛十大名帅:恩里克第3,齐达内第5,穆里尼奥垫底

笑饮孤鸿非
2026-05-08 13:13:54
央行主管媒体《金融时报》:贷款增速明显低于存款增速不是流动性淤积或资金空转的体现

央行主管媒体《金融时报》:贷款增速明显低于存款增速不是流动性淤积或资金空转的体现

财联社
2026-05-14 18:02:13
几年前“拼多多”的一手昏招,已经回旋镖到了所有网民头上

几年前“拼多多”的一手昏招,已经回旋镖到了所有网民头上

食材界
2026-05-13 13:02:23
南方电网:立即停止一切非法行为

南方电网:立即停止一切非法行为

南方都市报
2026-05-15 08:22:16
A股:股民做好下车准备,主力已不演了,5月15日周五尾声将至?

A股:股民做好下车准备,主力已不演了,5月15日周五尾声将至?

云鹏叙事
2026-05-15 00:00:09
上海崇明河道偶遇通体黑灰“水中活化石”,警民联手救助野生娃娃鱼

上海崇明河道偶遇通体黑灰“水中活化石”,警民联手救助野生娃娃鱼

上观新闻
2026-05-14 17:43:20
日本睡不着了

日本睡不着了

阿振观点
2026-05-15 10:41:46
马斯克儿子的装扮火了:新中式马甲出自国产小众定制品牌,定价970元;虎头包系“广西制造”,由当地绣娘缝制而成

马斯克儿子的装扮火了:新中式马甲出自国产小众定制品牌,定价970元;虎头包系“广西制造”,由当地绣娘缝制而成

山西晚报
2026-05-15 09:25:20
陈毅曾对主席说:我党杰出的军事家并不多,只有五个人

陈毅曾对主席说:我党杰出的军事家并不多,只有五个人

顾秋韵
2026-05-15 00:26:25
森保一名单公布前仍在讨论,将斟酌至最后一刻

森保一名单公布前仍在讨论,将斟酌至最后一刻

懂球帝
2026-05-14 20:25:45
英国海上贸易行动办公室:一船只在阿联酋附近被控制

英国海上贸易行动办公室:一船只在阿联酋附近被控制

新华社
2026-05-14 16:01:04
扎心!朋友孩子的班34人处于“零就业”状态,引热议

扎心!朋友孩子的班34人处于“零就业”状态,引热议

火山詩话
2026-05-13 15:02:14
2026-05-15 12:15:00
猜想笔记 incentive-icons
猜想笔记
公众号同名。
142文章数 4关注度
往期回顾 全部

科技要闻

两年联姻一地鸡毛,传苹果OpenAI濒临决裂

头条要闻

103岁和86岁老人认识3个月"闪婚":孤独感消失了

头条要闻

103岁和86岁老人认识3个月"闪婚":孤独感消失了

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛回应住男生单人间:女孩的配得感

财经要闻

特朗普的北京时刻

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

家居
手机
艺术
本地
军事航空

家居要闻

精神奢享 对话塔尖需求

手机要闻

谷歌推送安卓Canary 2605,整合Frosted Glass类磨砂玻璃风格

艺术要闻

15幅 丹麦画家Carsten Henrichsen风景油画

本地新闻

用苏绣的方式,打开江西婺源

军事要闻

乌克兰首都基辅遭空袭 死亡人数增至12人

无障碍浏览 进入关怀版