数据通信代码(data communication code),是指组成报文的电报信号和组成信息块的数据信号在形成格式、发送、接收和处理过程中要遵守的一组规则和惯例。
数据通信代码(data communication code),是指组成报文的电报信号和组成信息块的数据信号在形成格式、发送、接收和处理过程中要遵守的一组规则和惯例。
简介
由数据终端设备(DTE)发出的数据信息,一般由字母、数字或符号组成,为了适合传输,按规定的规则变换成的二进制代码,这就是数据通信代码。常用的数据通信代码有国际五号码(IA5)、国际电报二号码(ITA2)(见电报码型)、EBCDIC 码和汉字信息交换码。
常用的数据通信代码
2.1 国际五号码
国际五号码是一种 7 单位代码,它用 7 位二进制码来表示一个字母、数字或符号。这种代码是美国标准化协会提出的,称为美国信息交换用标准代码,简称 ASCⅡ码。经 CCITT 采纳发展成为 V.3 建议;后来,CCITT 将此建议修改后列为 T.50 建议,同时删除 V.3 建议。T.50 建议也相当于国际标准化组织的 ISO646 国际标准。我国参照 V.3 建议,制订了国家标准 GB1988 80(信息处理交换用的七位编码字符集)。
T.50 建议国际参考版本(IRV)代码表是由 128 个字符构成的字符集。这些字符可分为控制字符和图形字符。
控制字符只产生控制功能,不被显示或打印,总共有 33 个。它可分为六类。①传输控制字符:SOH(标题开始)、STX(正文开始)、ETX(正文结束)、EOT(传输结束)、ENQ(询问)、ACK(确认)、DLE(数据链转义)、NAK(否认)、SYN(同步)和 ETB(组传输结束);②格式控制字符:BS(退格)、HT(横向制表)、LF(换行)、VT(纵向制表)、FF(换页)和 CR(回车);③代码扩充控制字符:SO(移出)、SI(移入)和 ESC(转义);④设备控制字符:DC1、DC2、DC3 和 DC4;⑤信息分隔符:FS(文卷分隔)、GS(组分隔)、RS(记录分隔)和 US(单元分隔);⑥其他控制字符:NUL(空白)、BEL(告警)、CAN(作废)、EM(媒体结束)、SUB(取代)和 DEL(删去)。
图形字符为显示或打印用的字符,共 94 个。其中包括 52 个大、小写英文字母,10 个数字及其他 32 个图形符号。
IRV 代码还有一个间隔字符 SP,它既可作图形字符,也可作控制字符。
在串行传输时,先发送代码低位比特 b1,最后发送 b7。为了提高传输的可靠性,CCITTV.4 建议规定可以在 b7 之后加上第 8 位 b8 作奇偶校验位。通常同步工作时用奇校验,起止式工作时用偶校验。
2.2 国际电报二号码
ITA2(International Telegraph Alphabet No.2)编码是由法国人 Emile Baudot 发明的一种适用于机器编码、解码的博多码,采用 5 位 2 进制编码,一共能够产生 32 种组合,用来表示 26 个英文字母、10 个十进制数字、标点符号与空格。如果 32 种组合与上述字母、数字及各类符号一一对应,那么,ITA2 编码的 32 种组合就不够用,为了解决这个问题,博多码增加了两个转意字符:数字字符(FIGS)和字母字符(LTRS),数字字符表示其后的 ITA2 编码为 10 个十进制数字或标点符号之一,字母字符表示其后的字符为 26 个英文字母之一。ITA2 编码表一共有 64 个字符,分为字母字符表和数字字符表两类。区分 ITA2 编码属于哪个字符表的方法是依据数据串的第一个字符,如果第一个字符是“&HIB”(FIGS),说明其后的字符从数字字符表中查找,如果第一个字符是“&H1F”(LTRS),说明其后的字符从字母表中查找。
2.3 国标GB1988 80码
国标 GB1988 80 的代码表与 T.50 建议的 IRV 代码表只有一个图形字符不同。IRV 代码表中的通用货币符号“¤”,在国标中改为我国的货币符号“¥”,在国内通用。若用该符号表示世界上某个特定国家之货币,则必须用“¥”与表中其他图形字符的组合来表示,也可以用符号“$”与其他图形字符的组合来表示。
2.4 EBCDIC码
EBCDIC 码是扩充的二十进制交换码,它是一种 8 单位码,有 256 种组合。这种码一般不作为远距离传输用,而作为计算机的内部码使用。它在美国 IBM 公司的产品中较多采用。
2.5 汉字信息交换码
使用双 7 位编码的字符集。它由多个 94×94 双字节图形字符集组成。任何一个图形字符由两个字节表示。两个字节中前面的字节为第一字节,后面的字节为第二字节。图形字符在代码表中的位置用区号和位号表示。代码表分成 94 个区,每个区有 94 位,因此最大容量为 8 836 个码位。GB2312 80 为“信息交换用汉字编码字符集 基本集”,收集汉字 6763 个。GB7589 87 为“信息交换用汉字编码字符集 第二辅助集”,它收集 GB2312 以外的汉字 7237 个,它们是汉语通用的规范汉字,其用途与使用率一般低于基本集中的汉字,但是高于第四辅助集中的汉字。GB759087 为“信息交换用汉字编码字符集 第四辅助集”,它收集了 GB2312(基本集)及 GB7589(第二辅助集)以外的汉字 7039 个。