- T/SISD 003-2024 工业品供应链数字化服务分类
- T/SDEPI 045-2024 污染场地修复碳排放核算 重金属污染场地
- T/NAASS 110-2024 宁夏引黄灌区玉米水肥一体化化滴灌系统布设与管理规程
- T/SIA 040.2-2024 软件新质生产力企业 第2部分 指标体系与评估方法
- T/NKFA 017-2024 沙发产品质量分级
- T/BSRS 119-2024 铀矿区放射性核素污染场地源项调查技术导则
- T/CAPT 010-2024 新闻行业 大规模预训练模型 语言模型实用性要求
- T/ACCEM 547-2025 工程咨询智能AI系统服务规范
- T/QLY 234-2024 时尚黔菜 贵州豆豉火锅
- T/NKFA 016-2024 木质儿童家具
T/CAPT 012-2024 新闻行业 大规模预训练模型 研发数据要求
标准编号:T/CAPT 012-2024
标准名称:新闻行业 大规模预训练模型 研发数据要求
英文名称:News Industry—Large-scale pre-trained models—Requirements for research and development data
发布日期:2024-12-18
实施日期:2024-12-18
团体名称:中国新闻技术工作者联合会
起草人
路海燕、王宇琦、张丹、王建利、刘万福、王楠、王建平、贾珣、赵伟东、朱迅、王京、王付生、佘泽鹏、区可明、罗毅、林波、成鹏、王仲豪、郑创伟、瞿曦、邓海滢、刘琼、张鹏洲、曹娟、王志民、殷圣忠、王峰、熊立波、王熠、王慕维、付蓉、孙心桐、黄菁
起草单位
新华通讯社通信技术局、北京北大方正电子有限公司、杭州前方信息技术有限公司、江苏联著实业股份有限公司、北京星震同源数字系统股份有限公司、中国互联网新闻中心、华为云科技有限公司、中科闻歌科技股份有限公司、中联超清(北京)科技有限公司、拓尔思信息技术股份有限公司、新华社媒体融合生产技术与系统国家重点实验室(新华融合媒体科技发展(北京)有限公司)、中国传媒大学、深圳市创意智慧港科技有限责任公司(深圳报业集团技术公司)、中国新闻社、福建理工大学
标准范围
本文件规定了用于新闻领域的大规模预训练模型训练数据的使用场景、训练数据评价等要求,包括在训练、微调、评估等环节中涉及到的数据的技术要求。
本文件适用于通讯社、报社、广播电台、电视台、杂志社、网络媒体等多种媒体机构在新闻领域进行大规模预训练模型构建过程中的研发活动。