GB/T 26235-2010 信息技术 信息处理用蒙古文词语标记.pdf

信息技术,内蒙古自治区,标准化,标记,词语,推荐性国家标准
文档页数:20
文档大小:2.89MB
文档格式:pdf
文档分类:推荐性国家标准
上传会员:
上传日期:
最后更新:

GB/T 26235-2010

前言 1范围 2术语和定义 3标记的范围 4标记的级别及命名方法 5词语标记代码

GB/T26235-2010
前言
本标准由全国信息技术标准化技术委员会提出并归口。

本标准起草单位:中国电子技术标准化研究所、内蒙古大学、内蒙古师范大学、内蒙古教育出版社、 内蒙古自治区蒙古语文工作委员会、北京北大方正电子有限公司、潍坊北大青乌华光照排有限公司。

本标准起草人:那顺乌日图、何正安、青格乐图、确精扎布、六十三、淑琴、贺喜格都仁、唐英敏、吕建春、 阿荣塔娜。

GB/T 26235-2010
信息技术信息处理用蒙古文词语标记
1范围 本标准规定了信息处理用蒙古文词语标记,只包括某种语文现象或单位的标记符号。

本标准适用于蒙古文的各种语料库、词汇集-词典、语文知识库等。

2术语和定义 下列术语和定义适用于本标准。

2. 1 蒙古文信息处理Mongolian information processing 用计算机对蒙古文形、音、义等信息进行输人、排序、存储、输出、统计、提取等。

2.2 标记单位taggingunit 蒙古文信息处理中使用的词汇、词法、正字法及其他单位,如单词、复合词、固定词、习用语、成语、缩 略语、构形附加成分、连接元音、字母、数字、标点符号等。

2. 3 词类wordclass 词的语法分类,根据词法形态、句法功能、语文特征划分出来的类。

2. 4 不确定词ambiguous word 无法确定词性的词或词素,包括: a)无法确定词性的同形兼类词(如没有上下文环境的形式); b)不能单独使用的复合词成分如 uy(uy olan).tomsi((tog_a tomsi ugey)say(gajar say igey), xu{ xu luubang); c)形容词最高级形式:ub(ubulagan),xab(xab xar_a)等。

2. 5 复合词pound word 由两个实词(有时也包括辅助意义的词)组成,语法和词汇上都构成一个单位的固定短语。

2. 6 固定词fixed word 由一个实词和一个虚词组成,连用成型且未转义的固定短语。

2.7 习用语habitual usage 由一个转义形容词和一个实词组成,主谓结构且表达一个词汇意义的固定短语。

2.8 成语idiom 由3个或3个以上词组成,充当一个句子成分的固定短语。

2.9 缩略谱abbreviation 名词或常用语的简略形式。

...

资源链接请先登录(扫码可直接登录、免注册)
①本文档内容版权归属内容提供方。如果您对本资料有版权申诉,请及时联系我方进行处理(联系方式详见页脚)。
②由于网络或浏览器兼容性等问题导致下载失败,请加客服微信处理(详见下载弹窗提示),感谢理解。
③本资料由其他用户上传,本站不保证质量、数量等令人满意,若存在资料虚假不完整,请及时联系客服投诉处理。
④本站仅收取资料上传人设置的下载费中的一部分分成,用以平摊存储及运营成本。本站仅为用户提供资料分享平台,且会员之间资料免费共享(平台无费用分成),不提供其他经营性业务。
投稿会员:zidan
我的头像

您必须才能评论!

手机扫码、免注册、直接登录

 注意:QQ登录支持手机端浏览器一键登录及扫码登录
微信仅支持手机扫码一键登录

账号密码登录(仅适用于原老用户)