中华人民共和国国家标准
GB/T45949-2025
中文新闻语义结构化标注
Specification for semantic structuring annotation of Chinese news
国家市场监督管理总局 国家标准化管理委员会 发布
目次
前言引言2规范性引用文件 1范围3术语和定义4新闻语义结构化标注概述4.1标注流程4.2标注范式5预处理5.1标注对象标识符设置 5.2新闻稿件元数据采集6关键词标注6.1标注内容6.2标注模板6.3标注方法7语义模板标注 7.1标注内容7.2标注模板 147.3标注方法 158语义单元标注 168.1标注内容. 168.3标注方法 8.2标注模板 17附录A(资料性)应用场景举例 18 23A.1新闻内容结构化管理 23A.2生成稿件内容知识库 23A.3建立高质量知识图谱附录B(资料性)新闻语义结构化标注完整示例 A.4低耗高效训练人工神经网络模型 23B.1原文. 24B.2预处理 24B.3关键词标注.B.4语义模板标注. 27参考文献 B.5语义单元标注 29
snc
前言
本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草.
请注意本文件的某些内容可能涉及专利.本文件的发布机构不承担识别专利的责任.
本文件由全国中文新闻信息标准化技术委员会(SAC/TC352)提出并归口.
本文件起草单位:文灵科技(北京)有限公司、北京语言大学、东南大学、新华通讯社、中国互联网新闻中心、中国信息通信研究院、浙江日报报业集团、保定市数据局(国家数据标注基地).
本文件主要起草人:王楠、饶高崎、杨鹏、丁德胜、王熠、付蓉、王贵荣、王建平、黄菁、李苏、贾成喜、张闯、李冰、杨冬梅、周天外、宋永生.