中华人民共和国国家标准
GB/T 20532-2025代替GB/T20532-2006
信息处理用现代汉语词类标记规范
Specification of part of speech(POS)tag of contemporary Chinese forChinese information processing(CIP)
国家市场监督管理总局 国家标准化管理委员会 发布
目次
前言1范围2规范性引用文件3术语和定义4总则5词类及其他切分单位分类7标记代码表 6标记代码的组合应用8证实方法.参考文献
schc
前言
本文件按照GB/T1.1-2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定起草.
本文件代替GB/T20532-2006《信息处理用现代汉语词类标记规范》,与GB/T20532-2006相比,除结构和编辑性改动外,主要技术变化如下.
b)在术语与定义方面更改术语“汉语信息处理”为”中文信息处理”,并更改了定义(见3.1,2006 a)更改了范围(见第1章,2006年版的第1章).年版的2.1);增加了“现代汉语"的术语和定义(见3.2):更改“PartsofSpeech”为“PartofSpeech”(见3.3 2006年版的 2.3).c)在词类划分依据方面,删除"参考了《中学教学语法系统提要》"(见2006年版的3.2);增加“也参考了其他语言文字规范标准和常用语文工具书、汉语语料库等的词类划分体系.”(见4.2).d)在名词类方面,增加了名词小类的人名标记为姓和名的单独标记,分别标记为nhf和nhs(见 5.3.3);更改了名词小类中人名示例(见5.3.3,2006年版的4.1.1.5):更改了名词小类中机构名示例(见5.3.5,2006年版的4.1.1.8);更改名词小类中其他名词示例(见5.3.6,2006年版的4.1.1.9);更改了名词小类时间名词为时间词作为基本词类,标记为1(见5.4,2006年版的4.1.1.2);更改了名词小类方位名词为方位词,作为基本词类,标记为1(见5.5,2006年版的4.1.1.3):删除了处所名词示例中的“边疆”一词(见2006年版的4.1.1.4);删除了名词小类中的e)在动词类方面,更改了趋向动词示例(见5.6.5,2006年版的4.1.2.5):增加了形式动词作为动 族名(见2006年版的4.1.1.7).词小类,标记为vf(见5.6.6);增加了心理动词作为动词小类,标记为vs(见5.6.7).f)在数词类修订内容方面,增加了基数词作为数词小类,标记为mc(见5.9.1);增加了序数词作为数词小类,标记为mo(见5.9.2).g)在代词类方面,增加了人称代词作为代词小类标记为rp(见5.11.1):增加了指示代词作为代h)在新增基本词类方面,增加了语气词作为基本词类,标记为y(见5.16);在其他切分单位修订 词小类,标记为rd(见5.11.2);增加了疑问代词作为代词小类,标记为ri(见5.11.3).内容方面,删除了名词性习用语、动词性习用语、形容词性习用语、连词性习用语4个习用语小类,采用组合方式进行标记(见2006年版的4.2.1);删除了名词性缩略语、动词性缩略语、形容词性缩略语3个缩略语小类,采用组合方式标记(见2006年版的4.2.2):删除了名词性语素字、动词性语素字、形容词性语素字3个语素字小类,采用组合方式标记(见2006年版的i)在新增“标记代码的组合原则与应用”方面,增加了“标记代码的组合原则”(见4.4);增加了“标 4.2.5).记代码的组合应用”(见第6章):增加了非汉字字符串的语法功能标注,采用组合方式进行标记(见6.5)词)的代码说明"quantity”为“依据通常做法”(见第7章,2006年版的第5章);增加了“词类标表"(见7.3);增加了“证实方法”(见第8章). I