计算机中的信息表示.docx
- 文档编号:6875721
- 上传时间:2023-01-12
- 格式:DOCX
- 页数:9
- 大小:121.44KB
计算机中的信息表示.docx
《计算机中的信息表示.docx》由会员分享,可在线阅读,更多相关《计算机中的信息表示.docx(9页珍藏版)》请在冰豆网上搜索。
计算机中的信息表示
1.进位计数制
1.常见的进位计数制
Binary二进制Octonary八进制Decimalism十进制Hexadecimal十六进制
进位计数制:
利用固定的数字符号和统一的规则来计数的方法。
有3个基本要素:
基数->指数制中可以使用的基本符号个数。
进位规则->R进制数逢R进1。
位权->不同位置上数字表示的单位数值
2.常见的进位计数制的数的转换
1.二、八、十六进制转成十进制
多项式展开直接求和
2.十进制转换成二进制
整数部分:
除基到零,反向写余
小数部分:
乘基到精,正向写整
3.二进制转成八、十六进制
小数点为界,向两边分组。
八进制3个一组,十六进制4个一组,不足添0。
各组二进制转成十进制再转成八(十六)进制即可。
2.计算机中的数据
1.二进制与计算机
位(bit):
计算机中最基本的单位,一个二进制数字0/1。
字节(Byte):
8个位。
字:
字节的集合。
字长:
一个字中二进制的位数。
字长是计算机一次能同时进行运算的二进制位数。
现在一般为32bit、64bit。
一般来说,n位的二进制数字能够表示种状态。
2.模拟数据和数字数据
模拟数据:
一种连续表示法,模拟它表示的真实信息。
数字数据:
一种离散表示法,把信息分割成了独立的元素。
阈值:
大于阈值的电压看成高电压,小于阈值的电压看成低电压。
计算机不能处理模拟数据,要对模拟数据进行数字化。
3.数据及其分类
数值、文本、音频、视频、图像、图形。
4.数值型数据的表示
机器数:
一个数在计算机中的表示形式。
机器数有位数限制,多余的位数将被截断,少的位数将被填充。
(机器数的)真值:
带有正负号的数。
1.数值型数据的分类
根据是否带小数点分为实数和整数。
按照是否带有符号,整数分为带符号和无符号。
对于带符号的整数要对符号进行编码。
数值数据可以用原码和补码表示。
为了表示实数中的小数点的位置,可以表示为定点数或浮点数。
2.整数的表示
无符号整数表示:
转成二进制数,对不足机器字长的在前面补0。
最小值全是0,最大值全是1。
带符号整数表示:
0表示正,1表示负。
符号位占用一位二进制数位。
原码:
最高位符号位,其余位数是数值的绝对值。
补码:
正数同原码,负数补码除符号位外其他位取反,末尾位加1。
+、-0的补码一致。
3.实数的表示
定点数的表示:
定点数就是在运算过程中小数点的位置固定不变。
小数点位置不一定是明确指定的。
由于小数点位置固定,计算时可以直接进行加减运算。
浮点数的表示:
任何一个数都可以用科学计数法来表示,这种表示方法称为浮点表示法。
浮点数的一般表示形式:
单精度(32b)
IEEE754规定单精度浮点数(32b)双精度浮点数(64b)。
对于二进制实数,现将其写成尾数是定点小数的科学计数法的形式。
再将其尾数扩充为23位,阶码扩充为8位,再把尾数转换成补码形式。
4.
溢出
计算机中n位有符号数的表示范围(
)。
超出范围会产生溢出。
5.文本表示
一个文本是由一系列字符构成的。
要处理一个文本,必须表示和存储每个可能出现的字符。
内码:
字符在计算机中存储和处理时的编码。
1.文本类型
1.简单文本:
仅由一串字符代码组成,没有字体字号的变化和其他媒体。
文件扩展名为txt。
2.丰富格式文本:
允许在文档中设置格式(字体、颜色、页边距、自选图形、公式等)的文本。
3.超文本(HTML文本):
有声音、视频等多媒体信息,还有链接。
不管是哪种类型,核心问题是要表示字符本身,格式符号需要单独表示。
最早也是最常用的方法是列出所有字符,给每个字符编一个二进制位串。
要表示的符号数决定了需要多少二进制位数来表示。
西文字符——>ASCII码
汉字字符——>GB2312-1980
全世界所有字符——>Unicode码
2.文本内码
1.ASCII码
美国标准信息互换标准代码。
最初,ASCII字符集中每个字符由7个二进制位表示,总共有128个不同字符。
用一个字节存储,第8位用作校验位。
ASCII码表中特殊的33个字符(0~31和127)是不可显示和打印的控制码。
比如CR(回车)。
2.Unicode编码
表示世界上使用的所有语言的所有字符。
Unicode使用16位表示每个字符,能够表示
个字符。
Unicode字符集是ASCII字符集的超集。
Unicode常用的两种编码方案如下:
1)UTF-8单字节可变长编码:
每个字符占1~4个字节。
有单、双、三、四字节。
2)UTF-16双字节可变长编码:
每个字符占2或4个字节。
3.汉字编码
汉字内码是计算机内部使用的用二进制表示的汉字编码。
i)区位码
1
94x94个ASCII字符为基础构成二维平面,行为区,列为位。
每一个汉字/字符都对应唯一一个区(左)位(右)号。
每个汉字用2个字节表示。
ii)
汉字内码GB2312标准
ASCII码用1个字节表示,最高位为0。
汉字内码用2个字节来表示,每个字节最高位是1。
为了与ASCII码的可打印字符位置一致,在区号和位号上分别加上20H(32),称为国标码。
区位码转换成机内码的方法是:
将十进制的区码和位码转成十六进制的,将他们分别加上20H得到国际码。
再在高低字节上加上80H。
Ex:
中国OK!
占2+2+1+1+1=7个字节
iii)
汉字内码GBK标准编码
1995年汉字内码扩充标准。
要求双字节最高位为1。
iv)汉字内码GB18030汉字编码标准
国家发布过GB18030-2000和GB18030-2005,现已强制贯彻执行。
4.文本输入
1.键盘输入
2.联机手写输入
3.语音输入
4.印刷体识别
5.文本输出
1.字符点阵描述
每个字符按照图形符号设计成点阵图,用一位二进制对应屏幕上的一个点,亮为1暗为0,就得到相应的点阵代码(字形码)。
2.字符轮廓描述
以字符轮廓的转折点为特征来描述字符,又称矢量字体。
用一组直线和曲线命令以及一些参数来描述字体的轮廓。
3.字库
把所有可显示和打印的ASCII字符和汉字的字形信息放在一个文件中,称为字形库。
C:
\windows\fonts
4.文本压缩
数据压缩:
又称数据编码。
是为了在存储和传输数据时减小数据所占空间大小的方法。
分为有损/无损。
压缩率:
原始数据大小/压缩后大小。
1.关键字编码:
用单个字符代替常用单词。
2.行程长度编码:
又称迭代编码。
将重复的字符序列替换为标志字符。
后面加重复字符和说明重复次数的数字。
Ex:
*A7就是AAAAAAA。
3.赫夫曼编码
用不同长度的二进制位串表示不同字符。
把较少的位串表示经常出现的字符,而较长的位串表示不常出现的字符。
郝夫曼编码的重要特征:
用于表示一个字符的位串是表示另一个字符的位串的前缀。
从左到右扫描一个位串事,每当发现一个位串对应一个字符时,他就一定表示这个字符,他不可能是更长的位串的前缀。
5.图像和图形的表示
1.颜色表示
三基色原理:
人眼可以觉察到得颜色都能由红、绿、蓝三种颜色按照不同的比例混合而成。
计算机中颜色表示:
用RGB指表示。
RGB是3个数(0~255),表示每种颜色占的比例。
对颜色编码:
把一种颜色分解为RGB值的过程。
颜色深度:
用于表示颜色的数据量。
通常用表示颜色的位数来表示。
现在用24位的真彩色表示(3x8),即RGB值中的每个数字由8位表示,范围是0~255。
能表示1670万种颜色。
2.图像数字化
数字化图像:
将图像按照行和列的方式均匀地划分为若干个小格子(像素)。
分辨率:
水平像素点x垂直像素点。
图像:
像素点的集合。
存储一幅图像就是要存储图像上每个像素点的信息。
图像的编码:
每个像素呈现一种颜色(灰度层次),对每个像素进行RGB编码,再把所有行列的像素编码连接起来。
图像的获取:
是模拟信号数字化的过程。
扫描、分色、取样、量化、编码。
3.数字图像的表示
根据图像中每个像素点的信息位数,可将图像分为彩色图像、灰度图像和黑白图像。
1.彩色图像:
由RGB3个彩色分量组成,需要用3个矩阵分别表示每个彩色分量的亮度值。
2.灰度图像:
每个像素只有1个灰度分量。
通常8位表示,代表256个灰度。
人眼能识别的灰度大概是100个。
3.黑白图像:
每个像素只有1个黑色分量。
只用一个二进制位表示。
取值只有0(黑)1(白)。
二值化:
把图像转换成黑白图像的操作。
二值化选定一个阈值,高于它为黑,反之为白。
4.图像的存储和压缩
图像数字化后的大小=水平分辨率x垂直分辨率x颜色深度/8
1024x1024x24/8=3.75MB
图像压缩:
提高在网络上传输的速度。
流行的图像压缩都遵循静态图像压缩国际标准JPEG。
流行的逐个像素存储图像方法有位图(BMP)、GIF、PNG、JPEG、TIFF、PSD,他们都采用了不同方式的压缩方式。
5.图形的表示
图形:
由点、线、面体等集合元素和灰度、色彩、线型、线宽等非几何属性组成。
分为平面图形和三维图形。
矢量图形:
计算机图形一般用矢量图形格式来描述。
它不适用于描述真实世界的图像,是用于艺术线条和卡通绘画。
图像效果差,但是放大不失真。
常见格式:
3DS\DXF\WMF\FLASH\SVG。
6.音频信息表示
1.声音数字化
采样:
周期性测量模拟信号的电压,记录合适的数值。
将模拟信号数字化。
量化:
把采样的结果用有限个数字表示出来。
量化精度:
量化的二进制数值的位数。
每秒声音的数据量可以用声音的码率来表示(每秒二进制位b/s)
声音码率=采样频率x量化精度x声道数
声音数据量=声音的码率x时间/8
编码:
声音经过量化后数据量比较大,需要进行数据压缩,以减小数据量。
失真:
采样频率低于每秒40000次,不足以复原原始声音,人耳听到就会失真。
2.音频格式
WAV、AU、AIFF、VQF、MP3、MID。
视频表示
视频是一系列压缩的静态图像组成的,每一幅镜头图像成为帧。
常用的两种压缩方式:
时间压缩和空间压缩。
常见格式:
rm、rmvb、wmv、asf、mpeg、dat、avi。
WelcomeTo
Download!
!
!
欢迎您的下载,资料仅供参考!
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计算机 中的 信息 表示
![提示](https://static.bdocx.com/images/bang_tan.gif)