来源:高校人工智能与大数据创新联盟
![]()
2025年8月14日,国务院新闻办公室举行“高质量完成‘十四五’规划”系列主题新闻发布会。国家发展改革委党组成员、国家数据局局长刘烈宏在回答媒体记者提出的关于国家层面在围绕人工智能高质量数据提质扩量方面开展了哪些工作的问题时表示,算力是骨骼、算法是神经、数据是血液。作为人工智能发展的三大核心要素之一,数据在推动“人工智能+”过程中发挥着关键作用,特别是高质量数据集的建设至关重要,比如在医疗健康领域,通过标注的医学影像高质量数据集,模型的疾病诊断准确率可以提升15%以上。在人工智能时代,Token,也就是大家通常所说的词元,作为处理文本的最小数据单元,如同互联网时代大家所说的“流量”。2024年初,我国日均Token的消耗量为1千亿,截至今年6月底,日均Token消耗量已经突破30万亿,1年半时间增长了300多倍,这反映了我国人工智能应用规模的快速增长。
我国人工智能的快速发展,与我国高度重视数据工作是密不可分的。我国是第一个把数据作为生产要素的国家,多措并举促进数据资源的开发利用。我们强调“人工智能+”行动到哪里,高质量数据集的建设和推广就要到哪里。我们大力推动高质量数据的供给,出台了高质量数据集建设相关文件,多部门联合推动相关工作。我们指导全国数据标准化技术委员会研究制定了相关标准和技术文件,组织了高质量数据集建设先行先试工作和典型案例征集活动,分行业、分领域树立了一批典型的解决方案。
我们持续推进高质量数据集建设工作。截至今年6月底,我国已经建设高质量数据集超过3.5万个,总体量超过了400PB(1PB可存储约5亿张2MB大小的高清照片,400PB的总量相当于中国国家图书馆数字资源总量的140倍左右)。人工智能模型的训练也推动了数据交易需求的攀升,截至今年6月底,各地高质量数据集累计交易额近40亿元,数据交易机构挂牌的高质量数据集总规模达到了246PB。以北京数交所为例,高质量数据集占交易总量的比例从去年的10%跃升到目前的近80%。上海、天津、安徽等地正在试点“数据语料作价入股”等新模式,引导企业将高质量数据集折算为股权投入到相关企业。高质量数据集的发展需要数据标注产业的支撑,我们已布局了成都、沈阳、合肥等7个数据标注基地,助力高质量数据集的建设。
中文数据在国内大模型的训练性能提升方面发挥着重要作用。大家都非常关心中文数据在训练数据中的占比情况,经过一段时间的努力,国内多数模型训练使用的中文数据占比已经超过了60%,有的模型已达到80%。中文高质量数据的开发和供给能力持续增强,推动我国人工智能模型性能的快速提升。
下一步,我们将通过体系化布局持续推进高质量数据集建设,加快打造具身智能、低空经济、生物制造等重点领域数据高地。我们也将推动全社会强化数据要素价值认同,加快推进数据要素价值共创,培育“为优质数据买单”的市场共识。(来源:国新网)
全国高校人工智能与大数据创新联盟
全国高校人工智能与大数据创新联盟(简称:高校联盟)是由清华大学、浙江大学、中南大学、东北大学、上海工程技术大学、重庆邮电大学、东北林业大学、佛山科学技术学院、曲阜师范大学、黑龙江大学、海豚大数据科技等全国54家高校、企业共同发起,于2018年5月26日在北京中国科技会堂正式成立。迄今为止,联盟发展会员300多家, 覆盖全国20多个省市。联盟由一批积极投身于“人工智能、大数据、区块链”教育事业的高校、科研机构、企事业单位和个人自愿组成的公益性、全国性学术交流服务平台。中国工程院原常务副院长、中国工程院院士潘云鹤、中国科学院院士陈国良、中国工程院院士李伯虎担任联盟名誉理事长,中国工程院院士谭建荣担任联盟理事长。联盟工作接受工信部、国家网信办等政府部门行政管理和业务指导。联盟主要工作是推进产教融合、校企合作、协同育人。(加盟微信13651193492)
华算人工智能研究院
华算人工智能研究院全称是“山西省华算人工智能研究院有限公司”,是经山西转型综合改革示范区管理委员会批准,于2023年10月在太原成立的第一批专业研究人工智能、赋能数字经济产业发展的独立法人组织。华算人工智能研究院依托全国高校人工智能与大数据创新联盟专家委员会及理事会资源,按照山西省委省政府、山西转型综合改革示范区管理委员会发展人工智能、数字经济的系列文件精神和工作计划,将研究院打造成为山西省发展人工智能、数字经济的示范应用推广平台,同时面向全国开展人工智能业务。华算人工智能研究院名誉院长由中国工程院院士李伯虎担任。研究院内设AI产业学院共建中心、实训实习就业中心、实验室建设中心、专家智库等6个职能部门。欢迎加入华算人工智能研究院专家智库,共同赋能高校AI人才培养及产教融合事业发展。
高校区块链专委会
全国高校人工智能与大数据创新联盟区块链专委会(简称:高校区块链专委会),是由北京大学、浙江大学、武汉大学、西南财经大学、北京交通大学、郑州大学、贵州大学、桂林电子科技大学、山西农业大学、佛山科学技术学院、陕西师范大学、中国网安、海豚大数据科技等全国40多家高校、企业和机构共同发起,于2019年12月7日在广东省佛山市正式成立。目前发展高校及企业会员70多家。中国工程院院士、浙江大学教授陈纯担任高校区块链专委会名誉顾问;福州大学教授蔡维德、中国计算机学会区块链专委会主任斯雪明教授、中国人民银行数字货币研究所副所长狄刚担任高校区块链专委会名誉主任;北京大学信息科学技术学院区块链中心主任陈钟教授担任高校区块链专委会主任。高校区块链专委会主要工作是促进高校区块链教育,为高校区块链专业建设及学科发展提供专家咨询服务。
高校元宇宙专委会
全国高校人工智能与大数据创新联盟元宇宙专业委员会(简称:高校元宇宙专委会),是由清华大学、湖南大学、浙江大学、四川大学、汕头大学、河北金融学院、保定市元宇宙协会、英伟达中国、海尔衣联网研究院、海豚大数据科技(天津)有限公司等全国20多所高校、企业和机构共同发起,于2022年11月5日在北京正式成立。中国工程院院士、计算机软件与虚拟现实领域专家赵沁平担任高校元宇宙专委会名誉顾问;中国工程院院士、北京航空航天大学电气与自动化学院名誉院长、中国航天科工集团有限公司科技委高级顾问李伯虎担任高校元宇宙专委会名誉主任;清华大学信息国研中心可信软件和大数据部常务副主任邢春晓担任高校元宇宙专委会主任委员。目前已发展高校及企业会员30多家。高校元宇宙专委会主要工作是促进高校元宇宙教育、加强校企合作、推动元宇宙专业建设及学科发展,为元宇宙教育教学提供专家咨询服务。
高校数字经济专委会
全国高校人工智能与大数据创新联盟数字经济专业委员会(简称:高校数字经济专委会),是由华算人工智能研究院、清华大学、北京大学、中国人民大学、中国社会科学院信息化研究中心、四川大学、北京外国语大学、北京科技大学、北京工业大学、北京语言大学、北京化工大学、北京联合大学、北京物资学院、北京印刷学院、西藏民族大学、河北金融学院、重庆财经学院、苏州城市学院、北京中关村软件园、百度、海豚大数据科技等全国60多家高校、企业和机构共同发起,于2024年1月12日在北京正式成立。清华大学经济管理学院教授姜旭平、北京大学信息管理系教授赖茂生、中国社会科学院信息化研究中心主任姜奇平、中国科学院大学经济与管理学院教授吕本富担任高校数字经济专委会主任委员。高校数字经济专委会主要工作是促进高校数字经济专业建设及学科发展,推动产学研合作,为高校数字经济专业教育教学提供专家咨询服务。
联盟“资料图书馆”
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
微信咨询

说明:转载文章和图片均来自公开网络,推送文章除非无法确认,都会注明作者和来源,如有侵权请联系删除。
往期精彩文章(单击就可查看):
. 办
. 》
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.