标准编号:T/CAPT 012-2024
中文名称:新闻行业 大规模预训练模型 研发数据要求
英文名称:News Industry—Large-scale pre-trained models—Requirements for research and development data
发布日期:2024-12-18
实施日期:2024-12-18
团体名称:中国新闻技术工作者联合会
起草人
路海燕、王宇琦、张丹、王建利、刘万福、王楠、王建平、贾珣、赵伟东、朱迅、王京、王付生、佘泽鹏、区可明、罗毅、林波、成鹏、王仲豪、郑创伟、瞿曦、邓海滢、刘琼、张鹏洲、曹娟、王志民、殷圣忠、王峰、熊立波、王熠、王慕维、付蓉、孙心桐、黄菁
起草单位
新华通讯社通信技术局、北京北大方正电子有限公司、杭州前方信息技术有限公司、江苏联著实业股份有限公司、北京星震同源数字系统股份有限公司、中国互联网新闻中心、华为云科技有限公司、中科闻歌科技股份有限公司、中联超清(北京)科技有限公司、拓尔思信息技术股份有限公司、新华社媒体融合生产技术与系统国家重点实验室(新华融合媒体科技发展(北京)有限公司)、中国传媒大学、深圳市创意智慧港科技有限责任公司(深圳报业集团技术公司)、中国新闻社、福建理工大学
标准范围
本文件规定了用于新闻领域的大规模预训练模型训练数据的使用场景、训练数据评价等要求,包括在训练、微调、评估等环节中涉及到的数据的技术要求。
本文件适用于通讯社、报社、广播电台、电视台、杂志社、网络媒体等多种媒体机构在新闻领域进行大规模预训练模型构建过程中的研发活动。