智通财经APP获悉,1月14日,智谱(02513)联合华为开源新一代图像生成模型GLM-Image,基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成从数据到训练的全流程,是首个在国产芯片上完成全程训练的SOTA多模态模型。
模型开源不到24小时即冲上全球知名AI开源社区Hugging Face(抱抱脸)榜单的全球第一,模型SOTA性能、创新结构和训练过程迅速引发海外科技圈热议。美国消费者新闻与商业频道(CNBC)指出,智谱和华为训练出这一最新先进模型,打破了美国芯片的神话。
![]()
该模型也是首次完全依托国产芯片训练的国产模型,在国际舞台上取得榜首身位,标志国产AI模型的自主研发能力在国际竞争中取得突破。
![]()
不同于开源常用的LDM方案,GLM-Image采用了创新的「自回归+扩散解码器」混合架构,兼顾全局指令理解与局部细节刻画,克服了海报、PPT、科普图等知识密集型场景生成难题,尤其擅长汉字生成任务,向探索以Nano Banana Pro为代表的新一代“知识+推理”的认知型生成模型迈出了重要一步。
从训练过程看,GLM-Image实现了基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架的全流程训练及推理适配,实际训练性能足以达到相应计算设备的汇报性能上限,验证了在国产全栈算力底座上训练前沿模型的可行性。
智谱GLM是领先的国产大模型架构,华为昇腾是国产高性能AI芯片,昇思是华为自研的AI计算框架。三者分别代表从核心模型到硬件和计算框架的全栈技术自主突破,构成完整国产AI模型技术栈。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.