(一)八大行业数据采集体系围绕智能驾驶、医疗健康、金融服务、低空经济、智能制造、智慧农业、交通运输、具身智能八大领域,建立合规、高效的数据采集体系,构建标准化采集、脱敏、确权、入库全流程机制,保障数据安全合规。 (二)八大行业高质量数据集建设覆盖八大领域的多模态、大规模、高质量行业数据集,核心指标:- 预训练数据集:≥200亿Token- 指令微调数据集:≥30万条- 强化学习偏好数据:≥2万组- 基准测试数据集:≥3000条- 模态覆盖:文本、图像、视频、3D点云 (三)1000人规模以上数据标注基地分期建设规模化标注基地:- 2026年4月:150个标注工位- 2026年8月:300个标注工位- 2027年底:建成1000个标注工位、1000人规模以上专业数据标注基地- 业务范围:八大行业全品类标注(含自动驾驶3D点云、医疗影像、金融文本、低空航迹、工业缺陷、农业病虫害、交通路况、具身动作标注)- 质量管控:自研AI辅助标注平台,执行标准化流程+人工抽检,标注准确率≥99.7% (四)数据资产化平台搭建数据资产化服务平台,提供数据确权、质量评估、价值估值、资产入表、授权运营、交易撮合全链路服务,助力本地企业数据资产化转型,激活数据要素价值。 (五)行业可信数据空间按国家数据基础设施统一标准建设行业业务节点,与国家数据基础设施(江西)区域功能节点、省数据汇聚流通基础设施平台互联互通,实现身份、目录、数据统一管理,发布行业数据产品,打造示范应用场景。 (六)国产化适配项目建设所使用数据库、云平台、服务器、存储、网络、芯片等软硬件设备,整体国产化率≥80%,符合文件强制要求。
工程备注: 截止目前2026年5月20日,该项目处于立项阶段