品玩9月19日讯,据中国网络空间安全协会消息,在2025年国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料3.0正式向社会发布。
该语料由中国网络空间安全协会会同国家互联网应急中心等单位,在中文互联网基础语料1.0和2.0基础上,汇聚企业、高校和科研单位的高质量可信数据,经信源筛选、内容过滤、数据去重等处理后形成,数据量达120GB。其扩大了优质中文网站信源范围,加强了违法不良信息过滤,可为大模型训练和人工智能发展提供可信数据支持。
用户登录中国网络空间安全协会网站,点击“中文互联网语料资源平台”链接,完成注册、认证等程序即可下载。网安协会负责人表示,将持续加强中文互联网基础语料建设,为人工智能技术创新和产业发展提供支撑保障。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.