“2025年人工智能将呈现两个明显特点:一是多模态,二是产业落地。”
5月17日,搜狐科技年度论坛的现场。清华大学计算机系教授、中国工程院院士郑纬民表示,大模型正从文本处理走向文字、图像、视频的全方位处理,且在医疗、金融等与GDP密切相关的行业加速落地,中国在这方面“最擅长”。
郑纬民指出,大模型的生命周期包括五个环节:数据获取、预处理、模型训练、模型微调与推理。
前三个阶段对算力和存储要求极高,通常由大型科技公司完成,如华为、阿里、DeepSeek等。而医院、银行等应用单位,主要聚焦模型微调和推理。
他强调,当前大模型训练主要依赖两类系统:一是基于英伟达GPU的系统,生态成熟但面临禁售、涨价、供需紧张问题;二是国产AI芯片系统,全国已有超3万家公司参与研发,硬件性能虽有进展,但生态兼容性仍是最大障碍。
“不是国产卡性能不行,是生态不好。”郑纬民直言,要推动国产化,关键在两点:一是构建“类CUDA”系统,降低开发者迁移成本;二是将国产卡性能提升至国际同类产品的60%以上,若能达70%~80%更佳。“只要生态跟上,大家就会愿意用。”
他还指出,目前训练过程中仍面临容错难、内存瓶颈、算力紧张等实际挑战,推动核心软件系统完善迫在眉睫。(袁宁)
