数据产业集团助力“高质量数据集飞轮计划”正式启动

发布时间: 2025-09-05

近日,在2025中国国际大数据产业博览会期间,“数据标注高端对话暨第五次供需对接会”活动在贵阳市成功举办。本次活动由国家数据局数字科技和基础设施建设司指导,贵州省大数据发展管理局主办,国家工业信息安全发展研究中心、中国信息协会联合承办。国家数据局数字科技和基础设施建设司副司长李建国,贵州省大数据发展管理局党组成员出席活动并致辞。会上,国家工业信息安全发展研究中心人工智能所发起的“高质量数据集飞轮计划”正式启动。

李建国副司长指出,数据标注作为人工智能高质量数据集建设的关键环节,具有基础性地位。当前,数据标注产业发展势头猛、带动作用强、市场潜力大,已成为支撑人工智能发展的新兴产业。下一步,国家数据局将会同各方加快推动数据标注产业高质量发展,建立健全数据标注产业监测体系等举措,来培育良好产业发展生态。

数据产业集团联合国家工业信息安全发展研究中心、大同市数据局、中国电信、国网数科、中国船舶、中节能大数据公司、云南省贵金属新材料控股集团股份有限公司等单位共同参与了“高质量数据集飞轮计划”的联合启动仪式。该计划从理论技术、标准体系、服务建设、生态培育多向发力,做优高质量数据集建设工作,赋能行业高质量发展。

数据产业集团坚决贯彻落实国家《关于深入实施“人工智能+”行动的意见》《“数据要素×”三年行动计划》战略部署,立足产业痛点,以构建行业高质量数据集为牵引,成功构建“1+1+1”高质量数据集建设体系,突破高质量数据集构建瓶颈,能有效提升自动化加工能力。通过行业经验、领域知识和算法智慧的深度融合,将数据集建设工作从“劳动密集型”转变为“知识密集型”,大幅缩短周期、降低成本,同时能够体系化防范加工过程中的安全风险。公司已联合多个中央企业共建高质量数据集,全面释放数据要素价值,赋能产业智能化升级。

未来,数据产业集团将持续推动行业高质量数据集建设与人工智能产业融合发展,为释放人工智能产业价值、助力数字经济高质量发展贡献力量。

关于“高质量数据集飞轮计划”

当前,人工智能发展已进入“数据驱动”与“模型引领”双轮驱动的新阶段。随着人工智能向金融、医疗、工业等垂直行业快速渗透,行业对专业化、场景化的高质量数据集需求爆发式增长。与此同时,行业数据集建设仍面临数据生产效能薄弱、场景适配性不足、规模化供给能力短缺、标准化建设滞后等挑战,严重制约人工智能在产业端深度应用。

“高质量数据集飞轮计划”以释放数据要素价值、助力企业智能化升级为目标,围绕垂直行业高质量数据集开展聚力筑基、提质跃升、生态赋能三个递进阶段工作,加速推动其在各垂直领域的深度渗透与价值释放。

(一)聚力筑基,开展垂直行业高质量数据集建设。

一是需求对接,面向能源电力、智能制造等重点领域,组建“行业专家+建设专家”双审核专家库,通过标准问卷、专场对接会征集需求并开展系统性评估;

二是方案设计,组织研究团队围绕技术路线、实施方案等开展具体路径设计,随后组织专家评审,最终形成《行业数据集建设方案》。

(二)提质跃升,依托国检中心开展专业化测评及质量迭代优化。

一是标准研制,组建标准研制工作组,面向垂直场景制定多维度评估指标体系,并开发自动化测评工具;

二是质量优化,开展数据集质量测评,同步开发数据清洗等质量优化工具,推动数据集质量提升。

(三)生态赋能,通过大模型工委会推动高质量数据集规模化应用及产业生态构建。

一是应用评估,组织建立多维价值评估架构,对数据集应用价值开展系统性评测;

二是生态建设,遴选发布“年度标杆应用案例”、搭建常态化供需对接平台、编制《高质量数据集行业应用研究报告》等,多举措发力构建产业协同生态。

分享
  • toolbar