界面新闻记者 | 佘晓晨
大模型这一“加速器”正驶向科研领域。
近日,国内高校最大的云上科研智算平台CFFF(Computing for the Future at Fudan)在复旦大学正式上线。这一平台由复旦大学与阿里云、中国电信共同打造,以公共云模式提供超千卡并行智能计算,支持千亿参数的大模型训练。目前,首个基于CFFF平台训练的科学大模型成果已正式发布,45亿参数大模型一天训完。
CFFF平台由两部分组成:面向多学科融合创新的AI for Science智能计算集群“切问”一号,和面向高精尖研究的专用高性能计算集群“近思”一号。其中,“近思”一号部署在复旦校内,“切问”一号则托管在1500公里外的阿里云乌兰察布数据中心,该数据中心以公共云模式为复旦校内多学院的多个科研项目提供超千卡并行智能计算,支持千亿参数的大模型训练。
建设伊始,CFFF平台收到了来自复旦不同院系的多种研究需求,涵盖生命科学、大气科学、材料科学领域,也包括金融系统分析等社会科学研究。
目前,CFFF平台上的第一个科研成果已经诞生——复旦大学人工智能创新与产业研究院李昊团队近期发布了45亿参数量的中短期天气预报大模型,预测效果在公开数据集上首次达到业界公认的ECMWF(欧洲中期天气预报中心)集合平均水平,并将预测速度从原来的小时级缩短到了3秒内。
而这一平台的上线,更深远的意义在于对科研智算的影响。
中国工程院院士、阿里云创始人王坚在CFFF平台启动仪式后的采访中指出,当下,很多研究都依赖于计算,但即便在美国,高校也不具备今天很多企业所具有的研究计算平台。很多国际知名高校还停留在用大型机或者个人PC做研究的阶段。他认为,这是中国也是全球第一次让高校能拥有了和科技巨头一样的研究计算平台,让研究真正进入了计算驱动的时代。
相较通用计算,智能计算的投入成本、技术门槛更高,各环节投资规模合计可能高达数百亿元。智能算力成本或达到通用算力的10倍以上,因此非公共云的模式变得更不可持续。
有赖于公共云模式,跑在CFFF平台上的项目可享受到超千卡并行的智能算力,千卡并行的有效算力达到行业领先的92%,可拓展性达到万卡,万卡并行有效算力也可达90%。
王坚指出,CFFF平台在公共云上部署,对于高校建设科研计算平台是一个重要的转折点和里程碑。学校能拥有和企业一样的算力基础设施,公共云是非常重要的保证。“公共云在开放的同时保证安全,而这样一个新型的大科学装置,其运维必须借助公共资源,才能高效低成本地完成。”
实际上,在当下这个“大模型”爆发时代,和知名高校合作也成为技术厂商的竞争利器之一,通过和实际产业合作促成应用的落地。在这一过程中,高校科研或能受益,但也需要和企业不断磨合。
当天,复旦大学与阿里巴巴集团同时宣布达成全面战略合作,未来将在科研融合创新、科研合作、人才培养等领域展开深入合作。双方将围绕在AI for Science上合作的科研成果、创新应用和合作模式经验,举办峰会、研讨、交流活动,合作撰写白皮书,向学术界、企业界发布专项研究课题等。
此外,未来CFFF平台将持续扩大算力规模,并向复旦校外的科研机构、高校、医院、高科技企业等开放。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.