77范文网 - 专业文章范例文档资料分享平台

多媒体技术基础作业作业答案(2)

来源:网络收集 时间:2018-12-09 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

不同的地方。而JPEG和MPEG相同的地方均采用了DCT帧内图象数据压缩编码。

在JPEG压缩算法中,针对静态图象对DCT系数采用等宽量化,而是MPEG中视频信号包含有静止画面(帧内图)和运动信息(帧间预测图)等不同的内容,量化器的设计不能采用等宽量化需要作特殊考虑。从两方面设计,一是量化器综合行程编码能使大部分数据得到压缩;另一方面是通过量化器、编码器使之输出一个与信道传输速率匹配的比特流。 9信源符号及其概率如下: a a1 a2 a3 a4 a5 p(a) 0.5 0.25 0.125 0.0625 0.0625 求其Huffman编码,信息熵及平均码长。 解:

a1 0.5----------------------------------------------------------------0---------- 0 a2 0.25----------------------------------------------0------0.5------1 10 a3 0.125--------------------------0------0.25-------1 110 a4 0.625-------0-----0.125------1 1110 a5 0.625-------1 1111 则:a1=0 a2=10 a3=110 a4=1110 a5=1111 信息熵:

n?5H???PiLog2(Pi)i?1??(?1212?Log12?122??1414?Log14124?7818Log128?116Log1216?116Log1216)

38?1??1.875bit/字符a1-a5码长分别为1,2,3,4,4

n?5则平均码长N??i?1PiLj?12?1?14?2?18?3?116?4?116?4?1.875bit/字符

10、详述JPEG静态图象压缩编码原理及实现技术。

答:JPEG是由国际电报咨询委员会(CCITT)和国际标准化协会(OSI)联合组成的一个图象专家小组开发研制的连续色调、多级灰度、静止图象的数字图象压缩编码方法。JPEG适于静止图象的压缩,此外,电视图象序列的帧内图象的压缩编码也常采用JPEG压缩标准。JPEG数字图象压缩文件作为一种数据类型,如同文本和图形文件一样地存储和传输。基于离散余弦变换(DCT)的编码方法是JPEG算法的核心内容。算法的编解码过程如教材136页图4.25-4.26所示。编码处理过程包括原图象数据输入、正向DCT变换器、量化器、熵编码器和压缩图象数据的输出,除此之外还附有量化表和熵编码表(即哈夫曼表);接收端由信道收到压缩图象数据流后,经过熵解码器、逆量化器、逆变换(IDCT),恢复并重构出数字图象,量化表和熵编码表同发送端完全一致。编码原图象输入,可以是单色图象的灰度值,也可以是彩色图象的亮度分量或色差分量信号。DCT的变换压缩是对一系列8*8采样数据作块变换压缩处理,可以对一幅像,从左到右、从上到下、一块一块(8*8/块)地变换压缩,或者对多幅图轮流取8*8采样数据块压缩。解码输出数据,需按照编码时的分块顺序作重构处理,得到恢复数字图象。

具体的实现技术如下:

(1)首先把一幅图象分8*8的子块按图中的框图进行离散余弦正变换(FDCT)和离散余弦逆变换(IDCT)。

在编码器的输入端,原始图象被分成一系列8*8的块,作为离散余弦正变换(FDCT)的输入。在解码器的输出端,离散余弦逆变换(IDCT)输出许多8*8的数据块,用以重构图象。8*8 FDCT和8*8 IDCT数

6

学定义表达式如下:

FDCT:

F(u,v)?1477C(u)C(v)[??x?0y?0f(x,y)?cos(2x?1)16u??cos(2y?1)16v?]

IDCT:

F(x,y)?1477[??C(u)C(v)f(u,v)?cosu?0v?0(2x?1)16u??cos(2y?1)16v?]

两式中,C(u),C(v)=

12, 当u=v=0

C(u),C(v)=1 , 其它情况

离散余弦正变换(FDCT)可看作为一个谐波分析仪,把离散余弦逆变换(IDCT)看作一个谐波合成器。每个8*8二维原图象采样数据块,实际上是64点离散信号,该信号是空间二维参数x和y的函数。FDCT把这些信号作为输入,然后把它分解成64个正交基信号,每个正交信号对应于64个二维(2D)空间频率中的一个,这些空间频率是由输入信号的频谱组成。FDCT的输出是64个基信号的幅值(即DCT系数),每个系数值由64点输入信号唯一地确定,即离散余弦变换的变换系数。在频域平面上变换系数二维频域变量u和v的函数。对应于u=0,v=0的系数,称做直流分量(DC系数),其余63个系数称做交流分量(AC系数)。因为在一幅图象中像素之间的灰度或色差信号变化缓慢,在8*8子块中像素之间相关性很强,所以通过离散余弦正变换处理后,在空间频率低频范围内集中了数值大的系数,这样为数据压缩提供了可能。远离直流系数的高频交流系数大多为零或趋于零。如果FDCT和IDCT变换计算中计算精度足够高,并且DCT系数没有被量化,那么原始的64点信号就能精确地恢复。

(2)量化

为了达到压缩数据的目的,对DCT系数F(u,v)需作量化处理。量化处理是一个多到一的映射它是造成DCT编解码信息损失的根源。在JPEG标准中采用线性均匀量化器。量化定义为,对64个DCT变换系数F(u,v)除以量化步长Q(u,v)后四舍五入取整。即量化器步长是量化表的元素,量化表元素随DCT变换系数的位置而改变,同一像素的亮度量化表和色差量化表不同值,量化表的尺寸也是64,与64个变换系数一一对应。量化表中的每一个元素值为1至255之间的任意整数,其值规定了对应位置变换系数的量化器步长。在接收端要进行逆量化,逆量化的计算公式为:

FQ'(u,v)?F(u,v)?Q(u,v)

Q不同频率的余弦函数对视觉的影响不同,量化处理是在一定的主观保真度图像质量的前提下,可据不同频率的视觉阈值来选择量化表中的元素值的大小。根据心理视觉加权函数得到亮度化表和色度量化表。DCT变换系数F(u,v)除以量化表中对应位置的量化步长,其幅值下降,动态范围变窄,高频系数的零值数目增加。

(3)熵编码

为进一步达到压缩数据的目的,需对量化后的DC系数和行程编码后的AC系数进行基于统计特性的熵编码。64个变换系数经量化后,坐标u=v=0的值是直流分量(即DC系数)。DC系数是64个图像采样平均值。因为相邻的8×8块之间有强的相关性,所以相邻块的DC系数值很接近,对量化后前后两块之间的DC系数差值进行编码,可以用较少的比特数。DC系数包含了整个图像能量的主要部分。经量化后的63个AC系数编码时从左上方AC(u=7,v=7)开始,沿箭头方向,以“Z”字形行程扫描,直到AC(u=7,v=7)扫描结束。量化后特编码的AC系数通常有许多零值,沿“Z”字形路径行进,可使零AC系数集中,便于使用行程编码方法。63个AC系数行程编码和码字,可用两个字节表示。JPEG建议使用两种熵编码方法:Huffman编码和自适应二进制算术编码。熵编码可分成两步进行,首先把DC和AC系数转换成一个中间格式的符号序列,第二步是给这些符号赋以变长码字。

7

第五章 多媒体计算机硬件及软件系统结构 单项选择题1-8:

1、组成多媒体系统的途径有哪些:

(1)直接设计和实现 (2)增加多媒体升级套件进行扩展 (3)CPU升级 (4)增加CD-DA (A)仅(1) (B)(1)(2) (C)(1)(2)(3) (D)全部 答:(B)

2、下面硬件设备中哪些是多媒体硬件系统应包括的:

(1)计算机最基本的硬件设备 (2)CD-ROM

(3)音频输入、输出和处理设备 (4)多媒体通信传输设备 (A)仅(1) (B)(1)(2) (C)(1)(2)(3) (D)全部 答:(C)

3、MPC-2、MPC-3标准制定的时间分别是:

(1)1992 (2)1993 (3)1994 (4)1995 (A)(1)(3) (B)(2)(4) (C)(1)(4) (D)都不是 答:(B)

4、下面哪些是MPC对音频处理能力的基本要求:

(1)录入声波信号 (2)处理声波信号

(3)重放声波信号 (4)用MIDI技术合成音乐 (A)(1)(3)(4) (B)(2)(3)(4) (C)(1)(2)(3) (D)全部答:(D)

5、下面哪些是MPC对视频处理能力的基本要求: (1)播放已压缩好的较低质量的视频图象 (2)实时采集视频图象 (3)实时压缩视频图象

(4)播放已压缩好的高质量分辨率的视频图象 (A)仅(1) (B)(1)(2) (C)(1)(2)(3) (D)全部 答:(A)

6、下面哪些是MMX技术的特点:

(1)打包的数据类型 (2)与IA结构安全兼容 (3)64位的MMX寄存储器组 (4)增强的指令系统 (A)(1)(3)(4) (B)(2)(3)(4) (C)(1)(2)(3) (D)全部答:(D)

7、下面哪些是称得上的多媒体操作系统:

(1)Windows 98 (2)Quick Time (3)AVSS (4)Authorware (A)(1)(3) (B)(2)(4) (C)(1)(2)(3) (D)全部 答:(C)

8、下面哪些是MPC的图形、图象处理能力的基本要求: (1)可产生丰富形象逼真的图形 (2)实现三维动画

(3)可以逼真、生动地显示彩色静止图象 (4)实现一定程度的二维动画 (A)(1)(3)(4) (B)(2)(3)(4) (C)(1)(2)(3) (D)全部答:(A)

8

9、详述Intel/IBM公司研制的DVI多媒体计算机系统成功和失败的经验教训,理想的系统如何设计实现。 答:DVI系统能够用计算机综合处理声、文、图信息。 从硬件方面看:

(1)选用了PLV(Product Leave Vedio)视频压缩编码算法,产生AVI文件。 (2)为了实现PLV算法,DVI系统设计制造了两个专用芯片82750PA(PB)(象素处理器)和82750DA

(DB)(显示处理器)。

(3)同时设计了三个专用的门阵电路,即82750LH(主机接口门阵)、82750LV(VRAM/SCSI/Capture接

口门阵)和82750LA(视频子系统接口门阵)。 (4)设计实现了AVE(视频音频引擎)。 从软件方面看:

DVI系统设计实现了DOS环境下的AVSS(Audio Vedio SubSystem)和Windows环境下的AVK(Audio Vedio Kernel),DVI系统中最成功的部分是AVE(视频音频引擎)。AVE包括三个部分,即视频子系统、音频子系统和AVBUS(视频音频总线)。

1.视频子系统

视频子系统的作用是视频信号处理和显示引擎,它们由82750PB(象素处理器)、VRAM以及82750DB(显示处理器)组成。其中存储器阵列VRAM存放所有DVI系统数据,即:位映射的数据、压缩编解码数据、算法微码、控制执行算法的数据结构以及控制显示功能的寄存器集数据。象素处理器82750PB用微码执行及视频图象快速处理算法、视频特技以及数字式运动图象和静止图象的压缩编码算法以及解码算法。显示处理器82750DB有非常灵活的可编程功能,它能够将不同的位映射数据转换成在监视器上显示需要的模拟信号。

82750PB象素处理器具有较宽的指令字长(48位),直接连到VRAM的随机或并行通道,由于不同指令字的不同字段分别控制硬件机构,所以这些指令可以同时执行多种操作,它包括两个分开并对称的内插16位数据总线、为8位象素计算专门分开的ALU操作;在解压缩时为运动补偿设计了象素插值器,解压缩编码数据流设计了统计解码器;以及为了同DVI的VRAM传输数据所设计的四个先进先出(FIFO)数据缓冲区。82750PB象素处理器运行较小的微码译码器,它定时询问在VRAM中的命令表。由计算机建立主命令表,微码命令由主机直接引导加载到82750PB微码存储器中,当命令表指出某些操作需要运行时,如解码操作,微码译码器从VRAM中将一个微码块加载到82750PB内部的微码存储器中,并且执行它。这些解码是由主计算机设计并加载到VRAM中的。

82750DB显示处理器连到VRAM的串行或顺序通道,显示处理器有几种不同的VRAM的位映射格式,可直接解释成在监视器显示屏幕上所需要的模拟信号数据流,YUV数据在VRAM中分别在三个门映射区存储,82750DB显示处理器把这三个位映射区取来并混合在一起,完成解压缩的最后一步。同时,通过计算水平面和垂直方向每个U和V的四个采集样点的平均值,完成色差信号的插值,然后82750DB要进行从YUV到RGB彩色空间的转换,把三个8位数字信号送到D/A变换器,最后输出模拟信号到彩色监视器。

2.音频子系统

音频子系统由音频信号处理器、数字到模拟的转换硬件以及模拟滤波器组成。它与视频子系统并行操作、解决音频信号的压缩、编码和解码,还解决音频信号的A/D、D/A转换以及音响声效的特技处理。

音频子系统的核心器件是AD(Analog Device)公司的AD-2105数字信号处理器(DSP),通过它完成所有音频信号的压缩和解压缩任务。DVI系统采用自适应预测编码(ADPCM)算法将16位的采样数据压缩编码成4位码,最后将压缩的音频数据输出到D/A转换器,DSP的垂直消隐中断出现在每个显示帧的场逆程,以此来解决视频数据流和音频数据流的同步问题。数字到模拟量的转换器是由Burr-Brown公司生产的PCM66P单片立体声16位串行接口组成。跟着D/A变换器是双通道的模拟滤波器,其截止频率近似固定在17KHz,并且有5个极点。

3.AVBUS视频音频总线 为了支持视频音频子系统,大量的基本数据必须在DVI的VRAM和DVI 的其余设备(包括外部设备、主机、获取子系统)之间传送。DVI中数据的通信通道采用了VRAM的具有多路开关功能的32位数据和

9

地址总线,即AVBUS。AVBUS解决了视频音频流的问题。AVBUS由VRAM并行通道的数据信号组成,所有三个门阵、82750PB象素处理器以及VRAM都直接连到总线上,很多时间AVBUS作为VRAM和82750PB之间单一的数据总线,因而它们是默认的AVBUS的主设备。为了在AVBUS上传输数据,首先必须把总线控制权从82750PB手中转让给申请控制权的DVI设备,主机接口门阵是各种请求的仲裁器,通常采用主从型。一旦一个请求信号被仲裁器承认了,总线控制权从82750PB转让给该设备,允许在AVBUS执行该设备的通信协议。

AVSS是在DOS环境下运行的DVI系统的支撑软件,AVK是在Windows环境下运行的DVI系统的支撑软件。

(1)最下层的DVI系统的硬件包括:视频版、音频板、多功能板以及PC/AT的硬件。初始化时直接和硬件打交道的软件在引导程序作用下安装到系统RAM中常驻内存。一种多媒体硬件设备需要一个驱动程序模块,有为视频板设计的视频驱动程序、为音频板设计的音频驱动程序以及多功能板设计的多功能驱动程序。

(2)再上一层是驱动接口模块,驱动接口模块建立了为高层应用软件使用的虚拟设备。在DVI系统中共有四个驱动接口模块,即a)微码接口模块[Mc]:它是82750PA的接口模块,负责微码的加载和执行,同时也负责主机系统对VRAM的存取。b)视频接口模块[Vid]:它是82750DA的接口模块,负责82750DA的初始化。同时,它还包含了视频信号数字化器的接口软件。c)多功能接口模块[Utl]:它提供CD-ROM和操纵杆的接口软件。d)音响接口模块:它是音响板和音响数字化器的接口软件。

在同一层次上还有两个IBMPC/DOS的扩展模块:a)实时执行模块[Rtx]:它为DVI应用软件提供实时多任务操作系统环境。b)Microsoft CD-ROM模块[MSCDEX]:它是DOS扩展模块,能够使满足ISO 9660的CD-ROM用一般的方法在硬盘和软盘上自由存取。

(3)在第三层有两个高层次的软件包,即图形软件包[Gr]和音频视频支撑软件AVSS[Av]。a)图形软件包[Gr]:它提供图象处理,图形绘图基元以及视频管理功能。b)音频视频支撑软件AVSS[Av]:AVSS软件可管理AVSS格式写的视频、音频文件。

(4)最上面是应用层,它可以提供大量的应用程序。在应用层下面还有两个高层的DVI系统的接口,即DVI系统生产工具软件和多媒体编程工具语言。

DVI系统实现了AVE和AVSS或AVK,因而比较成功地解决了声、文、图信息的综合处理问题。它是一个比较成熟的多媒体计算机系统,它获得了“Comdex 91”最佳媒体产品奖和最佳展示奖。

DVI系统失败的地方是:由于现行的视频压缩国际标准是H.261、H.263、MPEG-1 、MPEG-2,而DVI的视频压缩算法采用非国际标准(AVI文件),这便是它的失败之处。

理想系统设计和实现:

(1)采用国际标准的设计原则

标准化是产业活动成功的前提,为了使新型的计算机增加多媒体数据的获取、压缩和解压缩、实时处理和特技、输出和通信等功能,设计时必须采用国际标准。如视频的H.261、H.262、H.263、MPEG-1 、MPEG-2,音频的国际标准有G.711、G.721、G.722、G.723、G.728、G.729。

(2)多媒体和通信功能的单独解决变成集中解决

计算机综合处理声、文、图信息和通信功能,过去的解决办法是设计专用接口卡分散单独解决,例如使用类似声霸卡解决声音的输入输出和实时编码、解码及处理问题,使用视频压缩编码和解码卡解决视频信号压缩和解压缩问题等。现在希望采用微码引擎,设计制造适合的DSP或阵列处理器通过微码变成综合解决这些问题。

(3)体系结构设计和算法相结合

要想使计算机具有综合处理声、文、图信息和通信功能的最佳解决办法是把计算机体系结构设计和算法相结合。综合处理声、文、图信息和通信功能算法的核心是数字信号处理,数组向量运算,即以乘加运算为核心的矩阵运算。

(4)把多媒体和通信技术做到CPU芯片中

多媒体计算要必须使其与网络相结合,为了使计算机具有多媒体和通信功能,最早的解决办法是采用

10

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库多媒体技术基础作业作业答案(2)在线全文阅读。

多媒体技术基础作业作业答案(2).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/354975.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: