DeepSeeK除夕夜再次王炸：多模态模型Janus-Pro开源|janus|视频生成模型

DeepSeeK除夕夜再次王炸：多模态模型Janus-Pro开源

2025-01-28 07:49:43　来源: 科技侠来了

北京举报

分享至

DeepSeek这家近年来迅速崛起的AI公司，又一次震惊业界！他们刚刚发布了全新的多模态模型Janus-Pro系列，并将其全部开源。凭借强悍的性能与MIT协议带来的商业自由，这款小而精的多模态模型直接锁定了行业焦点，可在图像生成和分析上全面超越OpenAI的DALL-E 3。

最新的DeepSeek 本地部署教程看这里⏬

科技侠来了，赞1986

一场参数效率的革命：Janus-Pro-7B

小模型，强能力

7B参数小体量却能同时实现多模态理解生成双能力，打破以往“模型大才能强”的固有印象。
**零样本泛化性能提升 37%**（基于 GenEval 测试）直接吊打主流生成模型，如 DALL-E 3。
单卡支持 4K 图片生成，速度比Stable Diffusion 32倍

Janus Pro与其他模型表现比较

DeepSeek一己之力，快干翻了美股，看看英伟达的股票。

DeepSeek一下子干掉了纳斯达克4.9%。

对比 OpenAI DALL-E 3：Janus-Pro 完胜的三大维度

1. 架构革命

Janus-Pro 的视觉编码解耦+自研 Rectified Flow 技术，让单模型便能驾驭20+跨模态任务，显著提升理解与生成效率。

2. 工业级生成效果

例如“故宫屋檐下的机械战甲”，Janus-Pro 的生成效果呈现出准确合理的构图，而 DALL-E 3 仍常陷入“四不像”困境。

3. 开源与商业自由

Janus-Pro 使用的MIT协议，允许用户免费商用，帮助中小企业节省百万级开发费用，这对闭源的 OpenAI 无疑形成强有力的冲击。

DeepSeek 发布 Janus-Pro 系列的背景

Janus-Pro是 Janus 模型的升级版本，名称来源于罗马神话中的双面神“雅努斯”（Janus），象征着“理解过去与创造未来”的能力。

目标：在多模态统一模型中，探索理解与生成的深度整合
意义：以开源方式打破 AI 技术封锁，为开发者与企业提供自由工具。

核心改进与技术亮点

更科学的训练策略
DeepSeek 对 Janus-Pro 的训练流程进行了全面优化，显著提升了训练的效率与稳定性。
超大规模训练数据
Janus-Pro 的数据量是前代模型的3倍，涵盖更多样化的场景，让模型知识更全面。
模型规模与算力需求平衡
推出了 1B 和 7B 两种参数版本，兼顾性能与计算成本，适合更多使用场景。

性能对比：为什么说它是“参数效率王者”？

模型多模态能力生成速度商用自由参数规模Janus-Pro-7B✅理解+生成⚡ 快 2倍✅ MIT开源7BDALL-E 3❌仅生成⏳ 较慢❌闭源不公开Stable Diffusion 3❌单模态生成⚡ 快✅ 开源数百M

亮点分析：

参数规模紧凑：仅 7B 参数即可完成多模态任务，对算力需求友好。
速度表现突出：支持 4K 图像生成，生成速度比主流模型高出至少1倍

突破性的多模态任务能力

理解任务

视觉问答：从图片中回答细节问题，准确率媲美专用视觉问答模型。
地标识别：识别文化地标的能力大幅提升，可准确定位。
文字识别：处理复杂场景中的文字信息，解析准确度高。

生成任务

文本到图像：显著提升生成质量稳定性，尤其擅长文化背景丰富的场景。
指令跟随能力强：能够根据用户的详细描述生成符合预期的高质量图像。

模型下载与体验

开源地址

模型（7B版本）：https://huggingface.co/deepseek-ai/Janus-Pro-7B
模型（1B版本）：https://huggingface.co/deepseek-ai/Janus-Pro-1B

东方破晓，邀世界共赴星辰

Janus-Pro 的发布，再次向世界证明中国在多模态 AI 领域的快速崛起：

技术层面：Janus-Pro 的开源与性能突破，代表了 AI 开放合作的力量；
商业层面：MIT协议降低了开发成本，为中小企业提供了更多可能性。

东方既白，未来已来。立即下载Janus-Pro，成为这场AI革命的头号玩家！

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

汽车要闻

手机 / 数码

房产 / 家居

DeepSeeK除夕夜再次王炸：多模态模型Janus-Pro开源

一场参数效率的革命：Janus-Pro-7B

小模型，强能力

对比 OpenAI DALL-E 3：Janus-Pro 完胜的三大维度

1. 架构革命

2. 工业级生成效果

3. 开源与商业自由

DeepSeek 发布 Janus-Pro 系列的背景

核心改进与技术亮点

性能对比：为什么说它是“参数效率王者”？

亮点分析：

突破性的多模态任务能力

理解任务

生成任务

模型下载与体验

开源地址

东方破晓，邀世界共赴星辰

黄仁勋演讲实录|40年来PC首次重设计！

10天内5省迎新任副省长：两人是70后 两人跨省调整

10天内5省迎新任副省长：两人是70后 两人跨省调整

杰威：如果我没受伤，我们能击败马刺

奚梦瑶婚礼现场图！一双儿女当花童

宇树过会，杭州赢麻了

奇瑞集团5月销量24.8万辆 同比增长20.5% 出口18.2万辆再创新高

态度原创

夏天裤子不用多买，阔腿裤一整个夏天都能穿，日常出行好打理

《月之魔印》在Steam上正式发售 国区售价76元

用剪纸的方式，打开江苏扬州

100亿！1371亩！海口城市更新，再爆超级项目！

韩国最大军工企业爆炸 已造成5人死亡

10天内5省迎新任副省长：两人是70后两人跨省调整

10天内5省迎新任副省长：两人是70后两人跨省调整

奇瑞集团5月销量24.8万辆同比增长20.5% 出口18.2万辆再创新高

《月之魔印》在Steam上正式发售国区售价76元

韩国最大军工企业爆炸已造成5人死亡