网易首页 > 网易号 > 正文 申请入驻

训练节奏按月迭代,算力需求“既要也要”,AI初创公司如何跑出模型加速度?

0
分享至

“连续4周千卡不间断训练、2个月完成模型迭代,先于Sora半年开放使用……”

或许你还记得,一年多以前,Sora的惊艳亮相,将文生视频技术推向AI领域竞争的新高地。

彼时,成立仅一年多的智象未来,凭借在生成式AI和多模态领域的技术积累迅速响应,仅用短短2个月时间便推出全球首个上线开放使用的图像和视频生成(DiT)架构模型,并迅速在vivago.ai上线向全球用户提供视频生成服务。

“作为AI创业公司,我们深知快速响应行业变化的重要性。智象未来的模型迭代节奏快、训练强度大,对算力基础设施的响应速度、稳定性和服务能力都有着极高需求。”智象未来技术总监潘滢炜博士表示,“商汤大装置‘灵活、稳定、专业’的支持能力,为我们实现模型的多元化场景应用、打通商业闭环提供了坚实基础。”

未雨绸缪先布局,多模态模型训练复杂

2023年3月,当行业还在惊叹于ChatGPT震撼的对话式体验时,刚刚成立的智象未来已经前瞻地瞄准了图像和视频赛道的多模态技术方向,并在创立之初就制定了“1+3+N”的商业化布局策略——以1个大模型为基础,通过3条产品线形成市场触点,满足N种使用场景。

在Sora发布前,智象未来自研的智象大模型便已具备15秒的文生视频能力。在Sora发布之后,其迅速推出智象大模型2.0及3.0版本,将模型架构从U-Net升级至Diffusion Transformer(DiT),不仅将视频生成时长提升至分钟级别,画面自然度、内容和角色一致性亦有显著提升。

更重要的是,智象大模型2.0率先实现开放使用,成为全球首个开放使用的图像和视频生成(DiT)架构模型。目前,智象大模型已迭代至3.0版本,在架构和应用层面进一步突破。通过引入全新扩散自回归架构(DiT+AR),在提升生成质量的同时降低推理能耗。

新民晚报记者了解到,不同于语言等单一模态模型,多模态模型的训练更加复杂——不仅需要融合文本、图像、音频等多种模态信息,实现跨模态的深度理解与交互,而且训练任务更加多样。不仅如此,智象多模态大模型还几乎保持每月进行小版本迭代,每半年开展大版本升级的节奏,更对算力提出了“既要也要”的严苛要求——

一是要高效:大模型训练,效率就是一切,每一次版本升级都是一场与时间的赛跑。智象大模型版本迭代时,需要迅速调度充足算力资源,支持模型迭代冲刺。

二是要灵活:不同模态信息的训练任务对算力需求各有不同,需要算力系统具备高度灵活性,能够随时根据训练任务的具体需要,匹配最优算力方案。

三是要稳定:大模型的训练需要连贯且稳定的系统运行,任何一次系统中断都可能导致训练失败和资源浪费,因此算力系统必须具备7×24小时不间断运行的绝对稳定性。

灵活、稳定、专业,为模型迭代稳定护航

作为“最懂大模型的AI基础设施”,商汤大装置通过灵活的算力资源调度,连续4周千卡不间断训练和专业高效的专家服务,助力智象未来实现了20%的资源利用率提升,让每一份算力都发挥到极致。

新民晚报记者了解到,在2024年初,商汤大装置运营算力规模已达到12000PetaFlops,目前更已提升至23000PetaFlops。

为满足智象未来的模型迭代冲刺需求,商汤大装置快速调度了千卡级别的算力资源,还提供了弹性的算力支持,可按需分配资源规模,通过灵活调度为智象未来提供最适配的算力方案。针对图片生成、视频生成、图像和视频编辑等不同训练任务,都能通过资源自主划分、灵活任务抢占机制,按照任务优先级灵活进行资源分配,保证最大资源利用率,实现更高投入产出比、更高经济性的基础。

在基于千卡集群的模型训练任务中,计算卡故障、通信异常等潜在问题如同暗礁,随时可能会导致训练中断等稳定性问题,影响训练进度。如果说算力是大模型训练的核心“生产力”,那么稳定性则代表着“安全感”。有安全感的生产力,才能真正提升生产效率。

从全程动态监控到多项保障机制,商汤大装置以99.99%的可靠稳定性,做到算力“零闲置”。在模型训练过程中,可实时监控设备状态,精准定位故障节点,并在第一时间发出警告;通过故障节点自动剔除机制,能够迅速将问题节点隔离,减少训练中断风险;通过空闲节点无缝接入机制,让训练任务能够从断点处迅速续训,避免时间浪费。

得益于动态监控、异常检测等多种手段,商汤大装置以分钟级的训练容错能力,助力智象未来成功实现了连续4周千卡不间断训练的超稳表现,为模型迭代稳定护航。

“随着文生视频模型研发和应用需求不断涌现,行业所需的将不仅仅是高效、稳定的算力支持,而是从数据处理、到模型训练,再到推理部署的全链路解决方案。”商汤大装置解决方案专家孟凡笑认为。

新民晚报记者获悉,成立短短两年来,智象大模型已广泛应用于影视、文旅、通信、营销、教育等场景。未来,商汤大装置与智象未来还将进行更深层次、更多维度的合作——除了算力层面,双方还将针对视频筛选、视频编码、视频超分等数据处理,以及模型推理优化等方面展开交流与合作探讨,打造更优质、更高效、更易用的文生视频服务,满足各行业客户日益增长的多样化需求。

原标题:《训练节奏按月迭代,算力需求“既要也要”,AI初创公司如何跑出模型加速度?》

栏目编辑:马丹 图片来源:采访对象供图

来源:作者:新民晚报 郜阳

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
太扎心!辽宁一中年男子小便怒斥妻子举布遮挡稍高,就撒手人寰了

太扎心!辽宁一中年男子小便怒斥妻子举布遮挡稍高,就撒手人寰了

火山詩话
2026-03-26 06:16:11
真不能怪祖院长,就曾医生这颜值、这才华和魅力,谁遭的住?

真不能怪祖院长,就曾医生这颜值、这才华和魅力,谁遭的住?

吃瓜局
2025-11-11 16:23:49
人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

人类史上最高级零元购,榨干印度200年,留下45万亿天价账单

掠影后有感
2026-03-26 10:39:36
参数全赢,销量没赢:尚界Z7销量输给小米SU7!差哪呢?

参数全赢,销量没赢:尚界Z7销量输给小米SU7!差哪呢?

生活魔术专家
2026-03-26 18:07:46
美伊冲突,已经出现了3个赢家,10个输家,都是谁?

美伊冲突,已经出现了3个赢家,10个输家,都是谁?

七号说三国
2026-03-25 21:11:29
阴跌两个月后放量跌停,今日最惨股,开板后又把博反包的套了进去

阴跌两个月后放量跌停,今日最惨股,开板后又把博反包的套了进去

有范又有料
2026-03-26 17:22:20
中央红军御林军,长征中戴钢盔配冲锋枪,一个团2名大将3名上将

中央红军御林军,长征中戴钢盔配冲锋枪,一个团2名大将3名上将

云霄纪史观
2026-03-26 17:16:00
新郎婚礼迟到2个小时,婆婆大方宣布:彩礼全退,新娘竟当场退婚

新郎婚礼迟到2个小时,婆婆大方宣布:彩礼全退,新娘竟当场退婚

白云故事
2025-03-21 17:50:07
NBA西部:前10确定了,马刺有望争第1,快船抢7,湖人首轮遇火箭

NBA西部:前10确定了,马刺有望争第1,快船抢7,湖人首轮遇火箭

铁甲西奇
2026-03-26 16:43:09
袁家军会见王兴兴

袁家军会见王兴兴

新京报政事儿
2026-03-26 16:45:34
为什么中国要发射东风-41,必须要提前告知俄罗斯,这是咋回事?

为什么中国要发射东风-41,必须要提前告知俄罗斯,这是咋回事?

阿器谈史
2026-03-19 18:11:39
烧了18.6万美元让AI连轴肝了17天,它产出了166篇论文

烧了18.6万美元让AI连轴肝了17天,它产出了166篇论文

酷玩实验室
2026-03-25 18:25:49
卡尔森:坏了!原来小丑不是特朗普,而是我自己

卡尔森:坏了!原来小丑不是特朗普,而是我自己

朝廷心腹
2026-03-26 09:07:14
谭松韵本人跟银幕上差距很大,个子好矮小小一只,真人并不年轻

谭松韵本人跟银幕上差距很大,个子好矮小小一只,真人并不年轻

庭小娱
2026-03-24 11:53:09
电饭锅哪个牌子质量好?2026电饭煲排名前十盘点!大众主流精选

电饭锅哪个牌子质量好?2026电饭煲排名前十盘点!大众主流精选

小柱解说游戏
2026-03-25 17:56:15
为何美国敢打伊朗,却不敢打朝鲜?因为朝鲜成功学到了中国精髓

为何美国敢打伊朗,却不敢打朝鲜?因为朝鲜成功学到了中国精髓

鉴史录
2026-03-25 18:19:06
退休不褪色:浸润在莎莎舞里的中年男人坚守与百态

退休不褪色:浸润在莎莎舞里的中年男人坚守与百态

成都人的故事
2026-03-26 23:40:03
66岁大妈喜欢睡前泡脚,不久脑梗去世,专家怒斥:太无知了

66岁大妈喜欢睡前泡脚,不久脑梗去世,专家怒斥:太无知了

比利
2026-03-21 13:00:22
哈佛研究:吃一个西红柿,就等于喝了一大口可乐,真的还是假的?

哈佛研究:吃一个西红柿,就等于喝了一大口可乐,真的还是假的?

泠泠说史
2025-11-10 14:17:05
搞笑,步行者主帅在被湖人队东契奇狂砍43分后,说也有积极的一面

搞笑,步行者主帅在被湖人队东契奇狂砍43分后,说也有积极的一面

好火子
2026-03-26 23:59:41
2026-03-27 00:36:49
上观新闻 incentive-icons
上观新闻
站上海,观天下
456550文章数 760382关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

手机
数码
游戏
健康
公开课

手机要闻

OPPO K15 Pro 系列定档,岚影呼吸灯搭配金属中框

数码要闻

英特尔发Q1.26版Arc Pro专业显卡驱动,支持B70 / B65显卡

"死亡搁浅"外骨骼来了!小岛工作室转发联名 原度拉满

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版