小编所收集到的相关二级ms office辅导:信息的表示与存储——字符的编码的资料 大家要认真阅读哦!
字符的编码
字符包括西文字符(字母、数字、各种符号)和中文字符,即所有不可做算术运算的数据。
计算机以二进制数的形式存储和处理数据,因此,字符必须按特定的规则进行二进制编码才可进入计算机。
1.西文字符的编码
用以表示字符的二进制编码称为字符编码。计算机中常用的字符(西文字符)编码有两种:EBCDIC码和ASCⅡ码。
ASCⅡ码是美国信息交换标准代码(American Standard Code forInformafion Interchange)的缩写,被国际标准化组织指定为国际标准,它有7位码和8位码两种版本。
微型计算机采用的是ASCⅡ码,而国际通用的则是7位ASCⅡ码,即用7位二进制数来表示一个字符的编码,共有27=128个不同的编码值,相应可以表示l28个不同字符的编码。
2.汉字的编码
我国于1980年发布了国家汉字编码标准GB2312—1980,全称是《信息交换用汉字编码字符集一基本集》,简称GB码或国标码。国标码的字符集:共收录了7445个图形符号和两级常用汉字等。
区位码:也称为国际区位码,是国标码的一种变形,是由区号(行号)和位号(列号)构成,区位码由4位十进制数字组成,前2位为区号,后2位为位号。
区:阵中的每一行,用区号表示,区号范围是1~94。
位:阵中的每一列,用位号表示,位号范围也是1~94。
区位码:汉字的区号与位号的组合(高两位是区号,低两位是位号)。
实际上,区位码也是一种汉字输入码,其最大优点是一字一码即无重码,最大缺点是难以记忆。
3.汉字的处理过程
从汉字编码的角度看,计算机对汉字信息的处理过程实际上是各种汉字编码间的转换过程,这些编码主要包括:汉字输入码、汉字内码、汉字地址码、汉字字形码等。
(1)汉字输入码
汉字输入码是为使用户能够使用西文键盘输入汉字而编制的编码,也叫外码。好的输入编码应具有编码短,可以减少击键的次数;重码少,可以实现盲打,便于学习和掌握,但目前还没有一种符合上述全部要求的汉字输人编码方法。
汉字输入码有许多种不同的编码方案,大致分为4类:音码、音形码、形码、数字码。
(2)汉字内码
汉字内码是为在计算机内部对汉字进行处理、存储和传输而编制的汉字编码。它应能满足存储、处理和传输的要求,不论用何种输入码,输入的汉字在机器内部都要转换成统一的汉字机内码,然后才能在机器内传输、处理。
在计算机内部为了能够区分是汉字还是ASCⅡ码,将国标码每个字节的最高位由0变为1(即汉字内码的每个字节都大于128)。汉字的国标码与其内码存在下列关系是:内码=汉字的国标码+8080H。
(3)汉字字形码
汉字字形码是存放汉字字形信息的编码,它与汉字内码一一对应。每个汉字的字形码是预先存放在计算机内的,常称为汉字库。
描述汉字字形的方法主要有点阵字形和矢量表示方式。点阵字形法:用一个排列成方阵的点的黑自来描述汉字。矢量表示方式:描述汉字字形的轮廓特征,采用数学方法描述汉字的轮廓曲线。
(4)汉字地址码
汉字地址码是指汉字库(这里主要指汉字字形的点阵式字模库)中存储汉字字形信息的逻辑地址码。
在汉字库中,字形信息都是按一定顺序(大多数按照标准汉字国标码中汉字的排列顺序)连续存放在存储介质中的,所以汉字地址码也大多是连续有序的,而且与汉字机内码间有着简单的对应关系,从而简化了汉字内码到汉字地址码的转换。
4.各种汉字编码之间的关系
汉字的输入、输出和处理的过程,实际上是汉字的各种代码之间的转换过程。汉字通过汉字输人码输人到计算机内。然后通过输入字典转换为内码,以内码的形式进行存储和处理。在汉字通信过程中。处理机将汉字内码转换为适合于通信用的交换码,以实现通信处理。
点击下方链接,进入考无忧官方网站,更多精彩等你来!
文章推荐:
温馨提示:
想要了解更多试题请点击查看>>>计算机考试题库
考试想拿高分吗?更多ms office相关资讯请点击查看>>>二级ms office
想知道更多关于计算机等级考试的最新资讯吗?点击进入>>>计算机等级考试