建设规模及内容:本项目拟建设一个覆盖网约车、快递、外卖三大场景的文本与语音多模态高质量语料库,重点服务于智能客服对话分析与平台内容安全审核.主要建设数据汇聚治理体系、智能化标注与生产力平台和全链路质量与安全保障.具体包括构建可扩展的采集系统,对接公开api及仿真环境,自动化汇聚客服对话、用户评价等多源数据,并通过专业清洗、脱敏与结构化处理,确保原始数据合规可用.研发融合主动学习与模型预标注的协同平台,支持对文本(意图、实体、情感)与语音(情绪、事件)的精细化标注.同时建立贯穿采集、标注、存储全流程的"三审一检"质量管理体系,部署符合国家信息安全等级保护要求的存储与防护设施,保障3pb规模数据资产的全生命周期安全
工程备注: 截止目前(2026年02月03日),施工图设计单位及施工单位尚未确定.