中华人民共和国
国家标准
信息交换用汉字编码字符集
基本集
GB 231280
中 华 人 民 和
基本集
1.适用范围
字通信等系统之间的信息交换. 本标准规定了汉字信息交换用的基本图形字符及其二进制编码表示.它适用于一般汉字处理、汉
2.主要有关标准
2.1GB1988-80《信息处理交换用的七位编码字符集》
2.2GB2311-80《信息处理交换用七位编码字符集的扩充方法》
3.术语含意
3.1位组:表示一个字符的二进制位的有序集合.3.2代码:编码字符集:用一组明确的规则确立字符集;并确立该字符集中的字符与其位组之间一对应关系. 3.3字节:作为一个单位来处理的二进制位串.3.4图形字符:它是一种不同于控制字符的字符,通常这种字符具有可视图形,它可以用手写,印刷或显示等方法直观地表示出来.义字符(ESC). 3.5转义序列:用于扩充代码的位组串.它由两个或两个以上的位组构成,其中第一个位组是转3.6指明:在预先制订的一些字符集中,用规定的方法指出其某一特定的字符集.3.7调用:使指明的编码字符集成为能使用的状态.3.8表示:(a)按在指明和调用的字符集中字符的意义,使用规定的位组. (b)按增补的控制功能意义使用转义序列.
4.图形字符
4.1图形字符代码表
图形字符代码表见表1.
4.2空白位置
代码表中,凡未填入图形字符的空白位置,均作为进一步标准化区域.
4.3图形字符的种类及数量
本标准收一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母、汉字等,共7445个图形字符.
4.3.1一般符号一般符号202个.其中包括间隔、标点符号、运算符号、单位符号以及制表符
号等.其名称见附录1.
4.3.2序号序号60个.其中1.~20.共20个,(1)~(20)共20个,①~共10个,(一)~(十)共10个.
4.3.3数字数字22个.其中0~9共10个,I~共12个.
4.3.4拉丁字母拉丁字母52个.其中大写字母A.Z26个,小写字母a.z26个.
83个,片假名(包括浊音、半浊音及捌音、促音等小写假名)86个. 4.3.5日文假名日文假名169个.其中平假名(包括浊音、半浊音及音、促音等小写假名)
4.3.6希腊字母希腊字母48个.其中大写字母A*.Q24个,小写字母a**24个.
4.3.7俄文字母俄文字母66个.其中大写字母A.月33个,小写字母833个.
4.3.8汉语拼音符号汉语拼音符号26个(包括带声调符号和其它符号的字母).
4.3.10汉字汉字6763个,分成两级.第一级汉字3755个,第二级汉字3008个.汉字的分级与排列见附录2.
5.编码
5.1编码表示本标准对任意一个图形字符都采用两个字节表示,每个字节均采用GB1988一80及GB2311一80中的七位编码表示.两个字节中前面的字节为第一字节,后面的字节为第二字节.
5.2在七位编码字符集中的指明与调用,用三字符转义序列ESC2/44/1指明,通过移入字符(SI)调用.
1~94,由第一字节标识:位的编号也从1~94,由第二字节标识.代码表中的任何一个图形字符的位 5.3图形字符在代码表中位置的表示方法代码表分成94个区,每个区有94位.区的编号从置用它所在的区号与位号标识.区号与位号之间用连字符相连.
例:汉字“啊”用16一01表示.
注:区号和位号与GB1988一80中的列号与行号有如下对应关系:
列号/行号 2/1 ~7/14位号 区号 1~94 1~94