【专家观点集锦】关于建设高质量数据集的一些思考和研究|算法|预训练|大模型

分享至

在数字化与智能化深度融合的今天，高质量数据集已成为科技创新与产业升级的“基石”。它为人工智能模型训练筑牢根基，直接决定算法的精准度与泛化能力，是释放智能应用能量的核心要素。随着数字经济加速发展，数据总量呈指数级增长，但高质量数据依然稀缺。在此背景下，建设高质量数据集不仅是技术迭代的必然选择，更是驱动各行业智能化转型、提升国家数据要素竞争力的战略制高点。

推进高质量数据集建设筑牢数智时代新基座

《全国数据资源调查报告（2024年）》显示，2024年我国高质量数据集数量同比增长27.4%，标志高质量数据集建设进入加速期。随着人工智能技术更进一步发展，对高质量数据集的需求缺口必将继续增大。加强优质数据供给，以高质量数据驱动人工智能创新发展变得愈发关键。

明确高质量数据集建设的战略意义

习近平总书记围绕“发挥数据的基础资源作用和创新引擎作用”做过多项重要的战略部署，近日发布的《人工智能全球治理行动计划》《关于深入实施“人工智能+”行动的意见》也对“数据供给”议题予以特别关注。当前正值人工智能引领新一轮科技革命和产业变革的历史性窗口，数据作为新型生产要素的重要作用空前凸显，已经成为推动传统产业转型升级、培育新质生产力的中坚力量，数据领域的新技术、新模式、新业态不断涌现，数据要素对于经济社会发展的乘数效应进一步放大。在此背景下，高质量数据集建设的战略意义已经远超技术与应用层面。

一方面，高质量数据集是构筑国家核心竞争力的关键要素和维护国家安全的重要屏障。掌握高质量、主权可控的优质数据资源，不仅关乎我国是否能在全球数字经济版图占据有利地位，更是直接影响产业链、供应链的韧性与安全。尤其是对于金融、能源、交通、国防等关键领域，高质量数据集的建设与治理更是保障经济社会稳定运行、提升国家治理体系和治理能力现代化的内在要求，是国家安全体系不可或缺的组成部分。

另一方面，高质量数据集是驱动产业深度转型和催生重大科技突破的根本前提。产业应用方面，海量、优质、多样的数据集是人工智能性能跃升的基础。随着人工智能模型不断变“大”，数据供给不足已经成为亟待解决的问题。数据质量更是成为制约人工智能从“可用”向“好用”跨越，更深入赋能实体经济的瓶颈。只有通过建设面向具体场景的高质量数据集，才能真正打通技术落地的“最后一公里”。而在科技创新方面，未来的科学发现愈发依赖数据驱动的研究范式。蕴含深刻领域知识“更聪明”的数据集，是科学家探索、发现新规律的“创新燃料”。

阻碍高质量数据集建设的三重挑战

尽管我国高质量数据集建设已经取得初步进展，但其未来发展仍然面临许多挑战。供给侧层面，结构性矛盾尤为突出。一是当前支撑前沿科研与关键行业应用的中文，以及垂类领域高质量数据集总量不足；二是跨部门、行业和地区的数据标准不统一与互操作性缺失，导致海量异构数据资源整合困难、处理成本高；三是现有数据质量评估大多止于完整性、一致性等基础维度，普遍缺乏对于科学知识内涵与工程指标洞察的深度挖掘能力。所以，很多时候存在“量大质低”现象。

技术底座层面，高质量数据集建设的关键环节存在明显薄弱点。当前的数据加工、处理的自动化水平较低，多依赖传统的人工密集型方式。如此不仅成本高昂、效率低下，倘若标注者自身的学历、能力参差不齐，数据集的实际效用也会大打折扣——这样的情况会在医疗、建筑等专业性较强的领域尤为突出。面向复杂场景的数据合成、数据蒸馏等关键技术有待突破，尽管部分算法具备自主性的学习能力，但在很大程度上仍需要人来引导，难以规模化生产专业领域所需的“高质量”数据。更为关键的一点是，目前各个行业普遍缺乏广泛认可的高质量数据集评估标准、认证体系以及配套工具链。这不仅使数据价值难被客观、科学地度量，更使高质量数据集建设的目标定位变得模糊，进而，导致“为数据而数据”的本末倒置行为出现。

管理机制层面，高质量数据集建设的系统规划与协同能力仍有不足。一方面，从原始资源到高质量数据集的转化路径缺乏清晰的实施框架。因此，部分高质量数据集的建设呈现一定程度的碎片化、形式化。另一方面，跨部门、跨行业的协同机制缺位，致使难以汇聚资源合力，引起重复建设与资源分散问题。此外，由于数据要素本身兼具商业价值与社会价值，权属界定、利益分配等机制不明本身即对高质量数据集建设造成制度性阻碍。

推进高质量数据集建设的实施路径

首先，要尽快完善针对数据集质量的评价体系。针对通识类、行业通用类、行业专用类数据集制定分级分类标准与质量评估、认证体系，确保数据集质量能够符合应用场景的真实需求。特别是对于行业专用类数据集的质量评估、认证，需要紧密切合场景需求进行专门设计，避免简单追求所谓的完整性、一致性、正确性。此举将为各个参与方提供清晰的指引，并确保数据集建设的合规性、安全性与可用性。其次，要坚持场景驱动与示范先行的策略。聚焦工业、农业、医疗、金融等数据密集且有明确需求的重点行业，基此开展试点示范工程。通过将该行业的高质量数据集建设成果与具体业务产品紧密结合，以点带面形成可复制、可推广的成功模式。再者，要深化人工智能技术的应用。逐步推进数据清洗、标注直至质量评估实现全流程智能化，保障数据完整性、一致性、可用性的同时，大幅提高效率、降低成本。面对冷门学科等“低资源”场景，则更应当发挥人工智能用于数据合成、数据增强方面的独特优势，补齐数据多样性短板。最后，要大力建设开源与多方协同平台。借助开源机制汇聚集体智慧、打破“数据孤岛”，提升数据集的规模与质量。

为进一步确保我国高质量数据集建设的有效推进，还须同步构建三位一体的支撑体系。一是资源支持上，应设立国家人工智能数据集专项基金。加大对于数据合成、隐私计算等关键共性技术的研发支持，建设国家级的数据技术“测试场”与中试基地，加速新兴技术的验证、转化与应用推广。二是能力建设上，应高度重视跨学科人才的培养。尤其是注重吸纳应用场景的相关专家，为数据集价值评估和治理提供全面的视角。此外，还应积极推动国际交流。借鉴全球先进经验，参与国际数据治理规则制定。三是保障措施上，应建立明确的目标分解与责任机制。其一，需要统筹协调，避免重复建设与资源分散等问题。其二，需要通过常态化的效果评估与优化机制确保高质量数据集建设工作能够持续、稳定推进。其三，需要加快数据权属、数据合规等制度建设。明确相关主体的权利与义务，保障数据能在稳定、可预期的框架之内得到高效的流通利用。

作者：清华大学人工智能国际治理研究院副院长梁正

构建数据标注新生态推进高质量数据集建设

随着人工智能技术快速发展，高质量数据集已成为推动生成式人工智能创新发展的核心稀缺要素。2017年国务院印发的《新一代人工智能发展规划》首次在国家层面确立人工智能发展战略地位，明确提出“构筑我国人工智能发展的数据先发优势”。2024年《关于促进数据标注产业高质量发展的实施意见》则系统规划了数据标注领域的技术创新、标准建设和人才培养等发展路径。数据标注作为将原始数据转化为可识别、可训练、可计算的关键环节，其质量直接决定了数据集的应用价值。《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》构建了从数据确权到价值释放的制度框架，为高质量数据集建设提供制度保障。在人工智能创新发展进程中，高质量数据集的关键性日益凸显。国家数据局实施《“数据要素×”三年行动计划（2024—2026年）》，为数据要素价值释放拓宽了应用场景，进而通过数据标注基地建设、行业数据集开发应用、数据标准制定与安全保障等多项举措加快推进数据标注产业发展，构建高效、智能、包容的数据标注新生态，为高质量数据集建设提供坚实支撑。

数据标注释放数据要素价值

2021年12月，国务院印发《“十四五”数字经济发展规划》，强调数据要素的作用，提出“提升数据资源处理能力”和“培育壮大数据服务产业”。《“数据要素×”三年行动计划（2024—2026年）》围绕多领域融合应用，以技术赋能优化数据深度加工，以场景驱动数据要素流通，共同推动数据要素市场化配置改革，为数字经济高质量发展奠定基础。数据作为新型生产要素，具有无形性、非消耗性和价值不确定性等特质，其价值实现高度依赖场景化应用。原始数据往往呈现无序状态，譬如噪音数据比例高导致价值密度低、多来源数据存在异构难题、多模态数据未能得到有效挖掘等，由此难以直接用于数据挖掘和模型训练。这种特性决定了数据必须经过标准化、结构化和场景化处理，才能转化为高质量数据要素。数据标注正是实现这一转化的关键环节，通过特征提取（如实体识别）、分类（如图像分割）、注释（如语义标注）、标签化（如情感分类）等操作，将原始数据转化为机器可识别、可训练、可计算的结构化数据。

数据转换为生产要素需要加工成本与匹配成本的持续投入。在加工成本方面，数据要素的低价值密度和高异构化特征决定了必须投入大量资源进行收集、整理、清洗和标注等操作，以提升数据的有序化程度。在匹配成本方面，数据要素的高度场景化特征使其难以成为标准化产品。与土地、劳动等传统生产要素不同，数据要素价值具有显著的场景依赖性，同一数据在不同应用场景下可能产生完全不同的效用。数据需求方往往需要构建场景适配评估模型来寻找合适的供给方，产生额外的搜索与试错成本。

数据要素的这些特性使得数据标注成为数据价值释放的必要前提。数据标注过程将原始数据转化为机器可理解的标准化格式，通过分类、标记等操作建立统一的数据语义框架，使不同来源的数据能够在相同维度进行比较和匹配。标注规则的确立为数据质量评估提供了客观标准，标注结果的准确率、一致性等量化指标可直接作为价值评估依据，减少交易双方在质量验证上的资源消耗。更重要的是，专业化的数据标注能够针对特定应用场景进行定制化处理，通过行业专识标注或场景化标签体系，使数据与需求场景形成精准映射，有效解决数据要素的场景适配性问题。这种基于标注的标准化和场景化改造，使原本难以匹配的非标数据转化为可流通的数据产品，正是构建高质量数据集的关键路径。

人工智能驱动数据标注模式转型

高质量数据集的核心价值在于其能够精准匹配模型训练需求，而这一目标的实现高度依赖于数据标注的专业化。人工智能模型性能的提升与标注数据质量呈现强正相关性，这种依赖关系随着模型复杂度的增加而愈发显著。数据标注质量与模型性能之间存在非线性传导机制，细微的标注偏差通过模型训练过程中的误差累积效应，可能导致输出结果的显著偏移。

人工智能发展对标注工作的新要求，本质上是对高质量数据集建设标准的提升。数据集的质量不仅体现在基础标注的准确性，更需要适应技术演进的前瞻性设计。当前人工智能的快速迭代推动数据标注需求的结构性升级：首先是应用场景的多元化，从通用领域向医疗、金融等专业领域延伸，要求标注工作具备跨行业的专业知识整合能力；其次是数据类型的复杂化，多模态数据的融合应用需要建立标准化的协同标注机制；最后是性能要求的精细化，模型调优需要多维度的细粒度标注来支撑。这些发展趋势使得传统标注方式在效率、精度和一致性等方面都面临系统性挑战，亟需建立更加体系化、专业化的标注生态体系。

当前数据标注产业正处于转型升级的关键时期，呈现出高技术含量、高知识密度、高价值应用协同发展的新特征，这一转型发展主要受到国家战略布局和大模型技术突破的双重驱动。从政策层面来看，《关于促进数据标注产业高质量发展的实施意见》等政策文件将数据标注纳入国家数据要素市场建设体系，明确提出要构建覆盖技术创新、标准制定、人才培养的产业生态，为产业发展提供了顶层设计。与此同时，以DeepSeek、通义千问等为代表的大模型技术的快速发展对数据标注提出了高阶要求：监督微调阶段要求指令数据的精准标注，强化学习阶段依赖人类偏好反馈的复杂标注机制。这些技术需求都推动着数据标注产业必须向工程化、标准化、体系化发展。

数据标注产业转型升级路径

在国家战略布局和大模型技术突破的双重驱动下，数据标注产业正在经历从劳动密集型向知识密集型的深刻转型。这一转型过程呈现出高技术含量、高知识密度特征：首先，标注工具从简单的人工操作向智能化辅助标注平台转变，预训练模型的应用显著提升了基础标注效率；其次，质量控制从人工抽检向动态评估体系转变，通过数据质量看板实现全流程监测；最后，数据处理从单一模态向多模态协同标注转变，以满足复杂场景下的数据融合需求。这种产业生态的重构为标注产业迈向高质量发展奠定了基础，但转型过程中的系统性挑战也日益凸显。例如在市场竞争中，部分企业缺乏核心技术竞争力，陷入同质化价格战的恶性循环；在业务模式上，众包标注模式虽降低成本，却导致标注质量不稳定、人员流动性大等问题。

破解种种挑战的关键在于把握智能化与专业化协同发展的内在规律。数据标注产业智能化聚焦技术层面的革新，旨在通过关键技术攻关和工具研发，提升数据标注的效率与精准度。数据标注产业专业化侧重于产业整体的规范与深度发展，包括建立标准体系、培育专业主体、打造创新载体等，以提高产业的专业水准和竞争力。基于智能化与专业化协同发展的逻辑，未来数据标注产业需聚焦三个关键方向。在技术创新方面，大模型驱动的自动化标注技术大幅提升了基础标注效率，使人工资源可集中投入复杂场景的质量把控，产业主体要持续优化标注工具、系统和算法，重点突破智能标注、多模态数据处理、自动化质检等关键技术。在生态建设方面，数据标注企业要融入政产学研用协同创新体系，通过行业高质量数据集共建强化定制化服务能力，开发针对不同行业的专业标注解决方案，参与国家数据标注标准体系建设。在人才体系建设方面，要建立数据标注师职业资格认证制度，形成“院校培养－企业实训－专项认证”的三级培养体系，为从业人员提供清晰立体的职业发展通道。

通过数据要素市场化配置改革与产业数字化转型的双轮驱动，数据标注产业将构建起技术驱动、生态协同、人才支撑的新发展格局。这种新型产业生态不仅推动数据标注服务深度融入数字经济发展大局，更将通过国家级标注基地建设筑牢高质量数据集的发展根基，为人工智能技术突破和行业智能化应用提供持续动力。

作者：清华大学数字政府与治理研究院孟天广

发展数据标注产业是建设高质量数据集的关键支撑

党的十八大以来，以习近平同志为核心的党中央高度重视我国新一代人工智能发展。习近平总书记深刻指出：“人工智能是引领这一轮科技革命和产业变革的战略性技术，具有溢出带动性很强的‘头雁’效应。”“加快发展新一代人工智能是事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题”。数据作为人工智能发展的三大核心要素之一，已成为人工智能大模型训练的核心要素资源。因此，建设高质量数据集既是推进人工智能产业发展和抢占技术制高点的客观需要，也是落实党中央“加快发展新一代人工智能”战略部署的具体行动。

建设高质量数据集对我国发展人工智能的重大意义

（一）从国际竞争看，高质量数据集决定人工智能国家竞争力

在全球人工智能竞争的大格局下，大模型已成为各国争夺的战略制高点。随着大模型在经济、军事、政务、科学等诸多关键领域的广泛应用，其发展水平直接关系到国家的核心竞争力。高质量数据集作为人工智能发展的基础，能够为模型训练提供丰富、准确且具有代表性的数据资源，数据质量已成为决定大模型性能的核心变量，直接决定人工智能“智商”。当前，训练一个领先的大模型，需要数百万甚至数千万条标注数据。从GPT-4的13万亿tokens高质量数据（中文汉字通常每个对应1-2个Tokens），到Qwen2.5-Max的20万亿tokens训练规模，国际巨头正以数据优势构筑技术壁垒。谷歌、Meta、OpenAI等国际科技巨头，凭借在高质量数据集方面的长期积累和持续投入，在人工智能领域占据了领先地位。我国也将高质量数据集作为国家重大战略，加快高质量数据集建设，是落实“人工智能+”战略的关键举措。

（二）从技术演进看，高质量数据集对大模型水平至关重要

人工智能每次阶段性的进步，数据都扮演着重要角色，尤其在大模型时代，海量、高质量、多模态的数据集，成为拉开模型能力差距的关键要素。随着大模型技术应用的快速发展，人工智能正在从“以模型为中心”转向“以数据为中心”。人工智能模型训练和应用主要包括模型预训练、微调和推理三个阶段，无论是在预训练阶段构建人工智能大模型的通用语言理解能力，在微调阶段优化特定任务表现，还是在推理阶段提高模型的输出准确性和稳定性，高质量数据集都发挥着至关重要的作用。它不仅决定了模型的性能上限，更直接影响着人工智能技术在实际场景中的落地效果和可信度。大模型参数规模指数级增长与多模态能力的拓展，促使数据需求从量级积累转向质量提升。当前大模型逐渐向推理和多模态大模型演进，要求很强的推理能力和通用泛化能力，要求的数据集具有高技术含量、高知识密度、高价值应用的“三高”特征，成为当前高质量数据集建设的核心特征。

（三）从产业层面看，高质量数据集是行业智能应用的核心支撑

通用大模型具有很强的泛化能力，随着模型参数规模和数据集质量改善，其逻辑、推理、写作、数学等通用能力快速提升，但行业知识方面则显不足。当前，行业大模型是支撑行业智能化的关键，各行各业智能化要求建设行业高质量数据集。大模型行业应用正成为AI产业应用和价值创造的主战场，也是企业竞争的行业壁垒。Anthropic Claude大模型，靠其在编程领域的优势，年收入至50亿美元，凸显了其巨大的商业价值。目前，智能制造、金融投顾、医疗健康、政务服务、交通物流、教育科研等领域的行业大模型不断涌现，AI产业已从通用大模型竞争转向“行业大模型+垂直场景”的深水区。行业大模型的价值创造依托“数据飞轮”形成闭环：采集行业数据→标注生成高质量数据集→训练优化模型→反哺业务场景→产生新数据。

我国高质量数据集建设迈入快车道

（一）从政策设计看，我国高质量数据集建设的“四梁八柱”逐步确立

党中央、国务院高度重视数据资源的开发利用与高质量发展，陆续出台多项纲领性政策文件，为高质量数据资源体系建设提供了顶层设计和制度保障。2022年12月，中共中央、国务院印发《关于构建数据基础制度更好发挥数据要素作用的意见》，明确提出探索开展数据质量标准化体系建设。2023年12月，国家数据局等17部门联合印发《“数据要素×”三年行动计划（2024—2026年）》，强调数据要素高质量供给与合规高效流通，提出打造高质量人工智能大模型训练数据集。2024年12月，国家发展改革委、国家数据局等部门印发《关于促进数据产业高质量发展的指导意见》，首次明确提出“高质量数据集”概念，将其作为人工智能与实体经济融合的核心载体，并对行业数据集建设提出具体要求。随后一系列政策相继发布，《关于促进数据标注产业高质量发展的实施意见》《关于促进企业数据资源开发利用的意见》以及《国家数据基础设施建设指引》等政策均提出建设“行业高质量数据集”，由此数据集高质量发展成为行业发展的重要目标。2025年2月，国家数据局组织27个部委召开高质量数据集建设工作启动会，全力推动高质量数据集建设，高效赋能行业发展，标志着高质量数据集建设进入系统化、规模化推进阶段。

（二）从产业布局看，以数据标注为牵引驱动的产业链条不断形成

数据标注是对原始数据进行采集、清洗、分类、标记、质量检验等专业数据治理活动，能有效提升数据供给质量，是人工智能发展的关键环节。数据标注产业链上游是人工智能数据提供方和应用需求方，主要从事人工智能研究、技术开发与服务，根据自身业务提出数据需求，作为数据智能化应用需求的源头驱动产业发展；中游是数据标注平台公司，主要依据需求开展数据标注技术研发、制定加工实施方案和交付，众包、分包给第三方数据标注服务方，通过标准化流程连接供需两端；下游服务商依托人力资源优势完成具体标注任务，形成产业闭环。当前，我国人工智能产业快速发展，带动了数据标注产业迅速壮大。

（三）从建设图景看，区域和行业高质量数据集呈现良好发展态势

在地方层面，国家数据局统筹建设成都、沈阳、合肥、长沙、海口、保定和大同七大数据标注基地，已建设行业高质量数据集524个，数据总规模超过29PB，赋能163个国产人工智能大模型研发与应用，带动数据标注行业相关产值超过83亿元。在行业层面，中央企业和大模型技术企业成为行业高质量数据建设的主力军。例如今年4月，国务院国资委发布首批10余个行业30项央企人工智能行业高质量数据集优秀建设成果。在企业层面，大模型企业纷纷建设高质量数据集，并增大了中文数据的使用比例。例如阿里巴巴发布中文问答数据集，为智能问答系统的研发提供了高质量的训练数据。智源研究院发布中英双语数据集IndustryCorpus1.0包含3.4TB开源行业预训练数据，覆盖18类行业。鹏城国家实验室开源百万规模标准化具身智能数据集，超过300万样本，覆盖258个系列任务和321064个具体任务实例。上海人工智能实验室开源数据平台OpenDataLab提供5500多个数据集，涵盖1500多种任务类型，总数据量达到80TB。另外，国内多数模型使用的中文数据占比已经超过了60%，如中国移动的九天、中国联通元景、月之暗面的Kimi 1.5、DeepSeek等，文心一言占比高达75%~85%。

发展数据标注产业支撑高质量数据集建设的路径

（一）需求牵引：释放场景标注需求

通过挖掘人工智能场景释放标注需求，包括释放公共数据标注需求、挖掘企业数据标注需求，以开放场景牵引企业发展。我国大力实施“人工智能+”行动计划，推动工业制造、文化旅游、现代农业、商贸流通、交通运输等行业成为产业智能化主战场。这一战略将释放海量数据标注需求，例如成都发挥人工智能1079亿核心产业产值、1006家企业的规模优势，成立人工智能和数据标注产业联盟，组织产业对接活动，发掘数据标注年需求超3000TB。

（二）因地制宜：发展地方特色产业

各地结合自身产业特色，因地制宜发展数据标注产业。比如，山西大同重点结合能源、文化旅游、交通运输等特色产业，发展数据标注产业。辽宁沈阳重点赋能工业制造、交通运输等优势产业。安徽合肥重点在芯片制造、自动驾驶等领域释放数据标注需求。湖南长沙数据标注基地与文化娱乐、医疗健康、旅游服务等特色产业深度融合。四川成都重点在交通运输、医疗健康、普惠金融等产业发力。海南海口数据标注服务于金融服务、教育教学、互联网安全等特色产业。

（三）基础支撑：建设可信数据空间

各地通过建设可信数据空间，为数据标注提供可信的数据采集、传输、归集、处理、加工利用的基础设施，支撑数据标注产业发展。2025年1月，中国联通联合成都、沈阳、合肥、长沙、海口、保定、大同等发起共建数据标注产业可信数据空间倡议，将运营商网络优势与大数据存算、区块链可信凭证、隐私计算及大模型智能分析等技术融合，从网络支撑、数据存储计算、信任保障、隐私保护及智能标注等方面创新，打造集可信管控、资源互联、联合标注、高质量数据集流通、价值共创于一体的产业空间。

（四）产业聚集：推动园区集群发展

据中国信通院数据显示，全国有55个城市已经建设67个数字标注基地项目，主要重点一、二线城市占比达到60%以上，普通地级市占30%左右。四川、北京、浙江、山西等多个省份拥有多个数据标注基地，形成规模化的数据产业发展。成都市数据标注产业发展初见成效，引进和培育标注企业45家，带动数据标注相关产值14亿元，形成各行业领域的高质量数据集56个，赋能行业大模型等30个。沈阳基地标注数据超过2384TB，数据标注产业产值达到17.8亿元。

（五）营造环境：完善标准与服务平台

各地通过建立公共服务平台、制定国标地标、建立人才实训基地等营造发展环境。例如，沈阳成立推进国家级数据标注基地工作专班，由市委、市政府主要领导任组长，统筹高位推进建设；保定市每年投放2000万元“数智券”支持数据普惠供给，对参与国际、国家、行业标准制定的单位最高资助30万元；贵州按实训学生每人每月不超1000元、补助时间不超3个月、每家基地每年补助不超300万元的标准，支持人才实训基地建设；成都建设城市级智能数据标注生成管理平台，集成需求归集、任务发布、数据供给、环境搭建、服务管控等全链功能，推动公共数据合法合规投放，提供共性服务能力。

作者：清华大学公共管理学院教授、清华大学计算社会科学与国家治理实验室执行主任孟庆国

文章来源：国家数据局官微

更多精彩内容请登录http://www.ciomanage.com官方网站

或扫描下方二维码，点击关注微信公众号（ID：sagetimes）

公司介绍

北京赛智时代信息技术咨询有限公司(简称赛智时代)是国内知名的数字经济等新兴产业的咨询规划、大数据分析和产业生态体系建设的创新型公司。业务范围涵盖了智库咨询、数据服务、软件平台以及会议培训等方面。其中智库咨询服务依托于赛智产业研究院丰富的行业资源和高端专业化人才等竞争优势，面向政府、园区和企业，提供发展战略与规划、政策研究、招商引资策略研究、智慧城市规划、运营模式研究等现代咨询服务。研究领域涵盖大数据、人工智能、区块链、5G、战略性新兴产业等行业领域。

饮鹿网(Innov100)是是赛智时代旗下的产业创新创投数据服务平台，覆盖新兴产业近20万创新型企业，为客户提供创业孵化、投融资等服务。

联系方式

电话：18701559508/16601025121

公司网址：www.innov100.com

www.ciomanage.com

公司地址：北京市朝阳区大屯里317号金泉时代广场三单元2216

智库服务

十五五时期国家数据产业分类布局及任务举措研究数据产业发展战略规划研究
北京市数字经济战略研究
北京市数据要素市场促进服务（北京市新型数据交易规则体系设计）
北京数据先行区关键机制创建服务
北京市数据领域共性核心技术创新发展促进提升服务

京津冀人工智能产业集群推进工作支撑服务
贵州省加速构建数据要素市场培育新兴产业课题研究
国家大数据（贵州）综合试验区实施方案
中国数据服务产业图谱研究
内蒙古自治区大数据中心数据要素市场化规划咨询
保定市数据服务产业发展规划编制
朝阳数据要素市场发展研究
丰台区数字经济倍增发展路径研究
北京市大数据立法数据支撑服务
北京市智慧城市建设协调推进项目
中国算力网络发展研究白皮书
重庆两江新区数字经济发展规划
贵阳市大数据五大新领域（人工智能、量子信息、区块链、物联网、5G移动网络）产业规划
南宁市元宇宙产业创新发展研究
贵阳市数字经济产业招商引资项目评估
智能贵州发展规划
贵州省大数据新领域产业发展指南
北京市大数据应用发展报告
天津市大数据应用场景建设计划
贵州省大数据战略行动计划编制
贵州省“十三五”以大数据为引领的电子信息产业发展规划
丽水市城市大脑开发建设研究
贵阳市新基建“十四五”发展规划
中国数谷顶层设计方案
贵阳市数博大道产业规划
贵阳区块链发展白皮书
贵阳市大数据发展“十三五”规划
贵阳市数字经济发展规划
观山湖区呼叫中心产业园规划
济南新型智慧城市规划
南宁大数据建设工程规划
航天科技车联网产业商业模式研究
阿里云数智化敏捷组织：云钉一体驱动组织转型研究
百度区块链研究项目
实创集团智慧城市业务战略规划
云上贵州集团业务战略规划
贵阳大数据集团业务战略规划……

数据服务平台

饮鹿网精准招商大数据产业平台

饮鹿网精准招商大数据产业平台是赛智产业研究院联合饮鹿网开发的针对产业招商的最新产品。涵盖大数据、人工智能、区块链、5G、智慧城市、工业互联网等 30 多个领域，为招商部门、产业主管部门、园区管委会和产业地产提供大品牌招商、产业筛选招商、产业生态链招商、重点产品招商、资本注入式招商、区域一体化协同招商、原籍创业人才招商等招商数据分析服务。

饮鹿网产业大脑大数据产业平台

政府提供新兴产业的产业链、企业、技术、投资等数据分析服务的平台，主要为各地发改部门、工信部门、产业分管领导提供产业仪表盘、产业链分析、产业地图、产业发展要素分析、产业政策、产业洞察等产业数据分析服务。

饮鹿网创业投资大数据产业平台

服务于创业投资领域，为母基金、头部投资机构、地方政府产业基金或引导基金提供绩效考核的专业化平台，主要提供投资数据（投融资仪表盘:与投资趋势洞察融合）、投资绩效分析（投资绩效分析、融资日报、投资机构百强、投资人百强）、项目分析（重点项目、产业链投资、细分图谱投资）、投资布局（投资地图）、投资要素分析、投资管理等服务。

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.