数据产业集团高质量数据集成功入选国资委首批央企高质量数据集优秀建设成果

发布时间: 2025-05-12

第八届数字中国建设峰会期间,国务院国资委于“数据要素安全与流通基础设施”论坛发布首批中央企业人工智能行业高质量数据集建设成果,央视《新闻联播》等权威媒体同期报道了该成果。此次成果发布进一步挖掘中央企业在数据集建设中的创新实践,有力推动跨行业、跨领域数据资源互通,更好发挥中央企业在数据产业中的“排头兵”作用,标志着央企数据要素开发及人工智能高质量数据集建设迈入规模化、规范化新阶段。

中国电子高质量跨领域合成图文数据集成功入选,这不仅是对中国电子在人工智能高质量数据集建设领域实践成果的高度肯定,也为行业高质量数据集建设提供可复制、可推广的标杆经验,为行业大模型训练与高价值场景落地提供核心数据支撑。

本次入选的高质量跨领域合成图文数据集由中国电子数据产业集团建设,覆盖交通物流、绿色低碳、医疗卫生等多个行业,已通过国家工业信息安全发展研究中心的高质量数据集评测,获A级高质量数据集检测报告及评级证书。该高质量数据集基于真实图像数据,运用知识引导、语义对齐及多模态融合技术,通过数据预处理、图生文、文本增强、文生图、质量评测等流程,构建图文数据元件并合成高质量图文数据集,突破长尾数据缺少、隐私风险限制数据获取等模型开发训练瓶颈,支撑客户训练行业模型,构建智能问答、供需匹配、数字化决策等垂直领域AI应用,降低数据合规风险,降低大模型训练成本,为大模型训练提供丰富的数据,并保证数据的多样性和均衡性,能够提高大模型的准确性和泛化能力

国务院国资委规划发展局副局长胡武婕表示,央企人工智能产业发展正处于重要的战略机遇期,应持续推动央企发挥自身海量数据积淀优势,牵引带动产业各方深化数据要素协同共享、优化数据资源高效安全开发利用,积极探索数据资产有序合规交易流转商业模式,为实体经济智能化升级提供核心支撑。

分享
  • toolbar