77范文网 - 专业文章范例文档资料分享平台

计算机的数据与编码

来源:网络收集 时间:2019-05-18 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

计算机的数据与编码

一、数据存储单位

1.数据:对事实、概念或指令的一种表示形式,可以由人工或自动装置进行处理。 (1)数据的形式:数字、文字、图形或声音等。 (2)数据的分类:数值数据、非数值数据。 2.信息:经过解释赋予一定意义的数据。 (1)控制信息:指挥计算机的各种操作的指令。 (2)数据信息:计算机加工处理的对象。 注意:(1)计算机能识别和处理的只能是二进制数。 (2)计算机中有人读数据和机读数据两种状态。

3.位:一个二进制位称为比特(bit),,以b表示。一位可以表示0和1两种状态。 位是数据的最小单位,

4.字节:八个二进制位称为字节(Byte),以B表示。 字节是数据处理和数据存储的基本单位。

一个字节的8位二进制自左至右排列,最左边为最高位,最右边为最低位。 换算公式: 1KB=1024B

1MB=1024KB=1024×1024B

1GB=1024MB=1024×1024KB=1024×1024×1024B=1073741824B 5.字与字长

(1)字:在计算机中做为一个单元进行存储、传送等操作的一组字符或一组二进制位称为字(Word)。

(2)字长:一个字中的字符数量或二进制的位数称为字长。

1

字长决定计算机处理信息的速率,是计算机的一个重要性能指标。 (3)字的组成:一个字由若干个字节组成。 二、字符及其编码 1.字符集

字 符:用来组织、控制或表示数据的字母、数字及计算机能识别的其它符号。 字符集:为了某一目的而设计的一组互不相同的字符。 在微机系统中普遍采用的是有128个符号的键盘字符集,包括: (1)10个十进制数码0~9 (2)52个大小写英文字母

(3)32个标点符号、专用符号、运算符号 (4)34个控制符 2.字符编码

字符编码:规定用怎样的二进制编码表示数字、字母和各种专用符号。

由于这是一个涉及世界范围内的有关信息表示、交换、处理、传输和存储的基本问题,因此都以国家标准或国际标准的形式颁布施行。 目前在微型机中普遍采用的字符编码是ASCⅡ码。

ASCⅡ是英文American Standard Code for Information Interchange的缩写,意为“美国标准信息交换代码”。该编码后被国际标准化组织ISO(国际标准化委员会)采纳,作为国际通用的信息交换标准代码。 ASCⅡ有7位版本和8位版本。 (1)7位ASCⅡ码

用七位二进制数表示一个字符,由于27 =128,所以可表示128个不同的字符,其中包括:数码0~9,26个大写英文字母,26个小写英文字母以及各种运算符号、标点符号及控制命令等。

注意:7位ASCⅡ表示数的范围是0~127

在微机中采用7位ASCⅡ字符编码时,最高位b7恒为零,因此,一个字符的ASC

2

Ⅱ码占一个字节位置。 (2)8位ASCⅡ码

使用8位二进制数进行编码,这样可以表示256种字符。

当最高位恒为0时,编码与7位ASCII码相同,称为基本ASCII码。当最高位为1时,形成扩充ASCII码。

通常,各国都把扩充ASCII码部分作为自己本国语言字符代码。 常用ASCII码:

二 十 十六 CR ESC SP 0 A a DEL 0001101 0011011 0100000 13 0D 27 1B 32 20 0110000 1000001 48 30 65 41 1100001 1111111 97 61 127 7F 字符大小比较:按ASCII码值的大小进行比较。 CR〈ESC〈SP(空格)〈0〈......A〈......a〈DEL

字符串大小比较:先比较第一个字符,若相同,再比较第二个字符,以此类推。 3.汉字编码

我国于1981年颁布了〈信息交换用汉字编码字符集——基本集〉,即国家标准GB2312-80。

基本集中共收集汉字和图形符号7445个,汉字6763个,分为两级。 一级汉字有3755个,属常用汉字,按汉字拼音字母顺序排列; 二级汉字为3008个,属次常用汉字,按部首排列。 图形符号682个。

规定:一个汉字用两个字节表示。

为了使中文信息与西文信息兼容,每个字节的最高位用于区分汉字编码或是ASCII字符编码,因此汉字编码每个字节只用低七位。

此外,由于每个字节的低7位中还有34个控制字符编码,因此每个字节只能有128-34=94种状态可用于汉字编码。这样两个字节可以有94×94=8836种状态。

3

(1)区位码

GB2312-80基本字符集将汉字按规则排成94行,94列,第一个字节用于表示区号,第二个字节用于表示位号,因此,每个汉字就有唯一的一个区号和一个位号,称为汉字的区位码。

给定汉字编码表中的一个区号(十进制01~94)和位号(十进制01~94),则唯一对应一个汉字或图形符号。

例如:区号54,位号48(均为十进制),对应汉字为“中”。 区位码的安排:

01~15区:各种字母、数字及图形符号 16~55区:一级汉字 56~87区:二级汉字

区位码是用十进制数表示的国标码,即国标BG2312-80中的区位编码,也可称为国标区位码。

(1) 国标码

将汉字区位码的区码和位码分别用十六进制数表示,然后再加上十六进制数2020形成。

例:“中” 的区位码为5448,表示成十六进制3630,再加上2020,则它的国标码为5650。

国标码的主要作用是用于统一不同的系统之间所用的不同编码。通过将不同的系统使用的不同编码统一转换成国标码,不同系统之间的汉字信息就可以相互交换。 4.汉字内码

计算机系统内部进行存储、加工处理、传输统一使用的代码,简称汉字内码或机内码。

不同系统使用的机内码可能不同,目前国内广泛使用的汉字内码是将国标码的两个字节的最高位分别置为“1”形成。

即一个汉字在机器内部占两个字节,每个字节的最高位恒为1。 汉字机内码=汉字国标码+8080H =区位码+2020H+8080H

4

=区位码+A0A0H

加十六进制8080H的目的是将表示汉字国标码的两个字节的最高位分别置为“1”。 在计算机中,由于机内码的存在,输入汉字时就允许用户根据自己的习惯使用不同的输入码,进入系统后再统一转换成机内码存储。 5.汉字外码

为方便人工通过键盘键入汉字而设计的代码称为汉字输入码,又称为汉字外码。 (1)以国标GB2312-80为基准的区位码、国标码 (2)以汉字拼音为基础的拼音类输入法 (3)以汉字拼形为基础的拼形类输入法

(4)以汉字拼音和拼形结合为基础的音形类输入法 (5)在电信业中通用的电报码 6.汉字字形码

是指汉字字库中存储的汉字字形的数字化信息。

汉字是一种象形文字,每一个汉字都可以看成是一个特定的图形,这种图形可以用点阵来描述。

用点阵来表示汉字,以16×16点阵为例,表明一个汉字图形有16行,每一行上有16个点。一位二进制可以表示点阵中一个点的信息,因此用两个字节来存放每一行上的16个点,并且规定某二进制位值“0”表示对应点为白,而“1”表示对应点为黑。由此可知,一个16×16点阵的汉字字形需要用2×16=32个字节来存放。其它点阵的汉字可以此类推。

汉字字形点阵有:16×16、24×24、32×32点阵等。随点阵数的不同,汉字字形码的长度不同。例16×16点阵占32个字节,24×24点阵需72个字节。

汉字字形码又称为汉字输出码或汉字发生器编码。 7.汉字字模

字模:即汉字字库中存放的汉字字形。字模与字形的概念没有严格区别。 字模可分为宋体字模、仿宋体字模、楷体字模、黑体字模。

5

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库计算机的数据与编码在线全文阅读。

计算机的数据与编码.doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/630671.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: