
NVIDIA 凭借 CUDA 生态系统构建了一个强大却封闭的帝国,使得无数 AI 应用与国产异构芯片之间,隔着一条难以逾越的“生态鸿沟”。
在这样的格局下,开发者们被迫陷入“重复造轮子”的困境:为不同平台重写内核、调优算子、调整带宽,性能优化成了一场消耗战。这就是异构编程的现实,每一次移植,都像是在重写一门语言。
此刻你或许会想:
为什么 AI 应用 的迁移与优化,依然像走在泥沼中?
为什么算力资源明明越来越多,我们却越来越感到“性能焦虑”?
这不是一个人的困惑,而是整个行业的写照。
![]()
编译技术在 AI 软件栈中的实践
在大模型与国产芯片的双轮驱动格局下,编译技术正成为 AI 软件栈的核心突破,在「2025 全球 C++ 与系统软件技术大会」现场,来自中科院的崔慧敏博士就以此为出发点,带来「编译技术在 AI 软件栈中的实践分享」。
她开门见山地指出:
“免费午餐的时代已经结束。过去我们坐等硬件升级带来性能提升,但现在,必须向软件栈、向编译层要性能。”
在本次大会上,崔慧敏将结合学术和产业实践,分享包括如何最大限度地挖掘 AI 芯片潜力,以及如何实现 AI 应用在异构硬件平台上高性能适配,突破生 态鸿沟,构筑软硬件完全自主可控的算力基座。她将系统分享如下几方面的探索:
私有化部署的需求与基础设施挑战
SigInfer:以编译为核心的高性能 AI 推理引擎
AI for Compiler:让 AI 自动生成与优化编译
未来 AI 软件栈的演化方向与自主可控的算力基座
崔慧敏和她的团队正试图为百花齐放的国产芯片与嗷嗷待哺的上层应用之间,架起一座通用、高效、低成本的桥梁。
正如她所说:“只有当编译层真正理解硬件,我们才能让软件自由地呼吸。”
![]()
从顶尖科学家到硬核创业者
提到崔慧敏博士,很多人首先想到的是她在编译与高性能计算领域的深厚学术背景。
她长期致力于编译优化、异构计算、AI 推理框架等方向研究,主导开发了多个国产算力编译工具链,是中科院计算所编译与编程方向学术带头人。
从中科院计算所到国际顶级会议的论文发表,从国家级重点项目的技术负责人,到跨国合作的技术代表,崔慧敏博士几乎参与了国产算力体系成长的每一个关键节点。
但比科研履历更让人印象深刻的,是她在工程化落地上的执着。
“光有论文不够”她常说,“长期来看,基于 AI 编译技术,构建一套底层公共的编译支撑,能够长期有效解决 AI 生态碎片化及生态融合问题。”
正是出于这样的信念,她带领团队创立了专注于 AI 软件基础设施的公司——中科加禾。
公司依托编译技术,聚焦人工智能私有化部署方案,着力打造通用化、低成本、高性能的基础软件工具链,为用户提供 AI 应用跨多种 CPU、GPU、NPU 执行的统一软件平台,补齐国产芯片生态体系的缺失环节,使得每颗国产芯片都能融入人工智能主流生态。
旗下异构原生 AI 算力工具系列产品包括:模型推理引擎 SigInfer、模型服务平台 SigOne 等。公司技术及产品已和我国头部芯片、服务器、运营商、互联网及端侧应用等厂商开展全面商业合作,面向各行业大模型应用场景,提供端到端全栈解决方案,加速人工智能产业规模化落地 。
![]()
关于 2025 全球 C++ 及系统软件技术大会
12 月 12–13 日,由 CSDN 与奇点智能研究院联合举办的「2025 全球 C++ 及系统软件技术大会」将在北京隆重举行,届时,C++ 之父 Bjarne Stroustrup、 ISO AI 技术委员会专家、C++ 标准委员会机器学习组主 席 Michael Wong、大规模软件设计的世界级权威、《大规模 C++ 软件设计》作者John Lakos、CSDN 高级副总裁,奇点智能研究院院长李建忠等全球顶尖系统专家将齐聚一堂,共同探讨这系统软件与 AI 原生时代下的,软件研发与工程实践的最新进展与实践。
官网: https://cpp-summit.org/
无论你是工程师、架构师,还是对系统底层充满热爱的开发者,
这场盛会,值得你亲临现场,见证思想与技术的真正碰撞 。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.