的“波”做基底行不行?小波(Wavelet)由此产生,而且解决了傅里叶变换的不足;
小波的基本概念——什么是小波
信号的时域表示和频域表示只适用于平稳信号,对于非平稳信号,在时间域各种时间统计
量会随着时间的变化而变化,失去统计意义;而在频率域,由于非平稳信号频谱结构随时间的变化而变化导致谱值失去意义,时频表示主要目的在于实现对非平稳信号的分析,同样的可以应用于平稳信号的分析
为什么选择小波
小波提供了一种非平稳信号的时间-尺度分析手段,不同于傅里叶变换方法以及改进了的傅里叶变小波的发展历史
小波的发展历史:
????
1807: Joseph Fourier——FT,只有频率分辨率而没有时间分辨率 1909: Alfred Haar——发现了Haar小波 1945: Gabor——STFT
1980:Morlet——Morlet小波,并分别与20世纪70年代提出了小波变换的概念,20世纪80年代开发出了连续小波变换CWT( continuous wavelet transform ) 1986:Y.Meyer——提出了第一个正交小波Meyer小波
1988: Stephane Mallat——Mallat快速算法(塔式分解和重构算法)
1988: Inrid Daubechies作为小波的创始人,揭示了小波变换和滤波器组(filter banks)之间的内在关系,使离散小波分析变成为现实
Ronald Coifman和Victor Wickerhauser等著名科学家在把小波理论引入到工程应用方面做出了极其重要贡献
在信号处理领域中,自从Inrid Daubechies完善了小波变换的数学理论和Stephane Mallat构造了小波分解和重构的快速算法后,小波变换在各个工程领域中得到了广泛的应用,典型的如语音信号处理、医学信号处理、图像信息处理等
? ? ? ? ?
非标准分解
? 非标准分解是指使用一维小波交替地对每一行和每一列像素值进行变换。首先对图
像的每一行计算像素对的均值和差值,然后对每一列计算像素对的均值和差值。这样得到的变换结果只有1/4的像素包含均值,再对这1/4的均值重复计算行和列的均值和差值,依此类推。非标准分解的过程如下:行、列变换
分形变换编码
? 分形(Fractal)是几何学里的一个分支,对象是“自相似”的几何图形;
? 分形几何的历史:萌芽期:十九世纪末,二十世纪初; 当时推出了Cantor
集,Weierstrass函数等。形成期:二十世纪六、七十年代; Mandelbrot的大量工作. 1. 1967年,“Science”杂志提出, 英国的海岸线究竟有多长? 2. 1975年,《分形对象:形,机遇和维数》一书出版; 分形(fractal)这个词源于这本书. 它是从拉丁语“fractus”派生出来的,意思是“不规则的或者断裂的”。 ? 发展期:二十世纪八十年代至现今: 1. Hutchinson, 1981, 分形与自相似. ? 给出了自相似集合的数学理论基础. 2. Mandelbrot, 1982, 《自然界的分
形几何》 3. Barnsley, 1988, 《Fractal everywhere》 4. Falconer, 1990, 《分形几何——数学基础及其应用》. ? 分形几何的应用:图像,数据压缩方面的研究。 如:对某一个静态场景的分形
压缩。 (压缩比可达近万倍)自然景物的模拟 如:雪花,海岸线,分形山,分形树叶, 分形生长模型。
信源编码
? 信源编码的目的:压缩带宽(码率);信源编码的手段(方法)很多,不一定全部都用
上,需要考虑效率和计算量;不同的信源编码标准差别在于方法的数量不同,因而效率不同、码流的结构也不同;但它们的基本方法大同小异。
关于视音频压缩编码标准
? :MPEG-1、JPEG、MPEG-2、MPEG-4、MPEG-7、H.261、 H.263、 H.264、AVS、
HEVC/AVC;
MPEG-2编码的基本原理
? 编码实际上分硬件和软件两部分;初期是以通用硬件加软件;随着技术的发展,专
用硬件的比例逐步增加;既要了解方框图,也要了解码流的结构;编码的程序十分专业,需要专门学习。
MPEG-2中的码流:
? MPEG-2的结构可分为压缩层和系统层。一路节目的视频、 音频及其它辅助数据
经过数字化后,通过压缩层完成信源压缩编码, 分别形成视频的基本流ES (Elementary Stream)、音频的基本流和其它辅助数据的基本流。 紧接着, 系统层将不同的基本流分别加包头打包(分组)为PES(Packetized ES, 打包基本流)包。 PES又称为分组基本码流。 然后,多个PES被复接成一个节目码流(PS)和一个传输码流(TS)
数字电视码流的多个层次:
? ES:基本码流,PES: 打包的基本码流,PS : 节目流,TS:传输流
? 基本码流(ES):
? 视频信号压缩到1Mbit/s(MPEG-1)或2~6Mbit/s(MPEG-2); 音频信号压缩到100~
400kbit/s; 压缩后的视音频信号称作ES(elementary stream)流,包括视频流和音频流; 一路节目的视频、 音频及其它辅助数据经过数字化后,通过压缩层完成信源压缩编码,形成基本流ES (Elementary Stream)、包括视频的、音频的和其它辅助数据的基本流。 ES的结构和内容根据各种数据的编码格式而不同。
PES流
?????
压缩后所有ES流被打成不同长度的包,叫做PES(packetized elementary streams)。 根据不同时刻视音频内容的不同,压缩比也时刻变化,就需要有不同长度的数据包。 每个视频包有一个或几个压缩视频帧,每个音频包有一个或多个压缩音频信号段 所有ES流首先被打包成不同长度的PES包,通常为64kbytes(字节)。
开头为6字节的PES头:前3个字节是起始码前缀00 00 01,用于表明一个PES包的开始。第4个字节是起始码标志,说明起始码种类,表明净负荷数据(payload)中的是视频、音频还是数据流。后两个字节是包长度,说明后面还有多少字节。如果长度为0,表示PES包大于64kbytes;然后是可选PES头;最后是实际传送ES流的净负荷数据。
可选PES头:
? PES头的可选扩展,根据当前传送ES流的要求设置。由12个比特的11个标志来
控制可选PES头中包含哪些字段,其中有PTS(presentation time stamps)和DTS(decoding time stamps),这对视/音频同步非常重要。最后可能有填充字节。
由于MPEG 只定义了传输流,而没有对编码器作出规定,设计者可以选择构建一个将基本码流转换为传输流的多路复用器。在这种情况下,PES包就不再以可识别的形式存在,而是以逻辑形式存在于传输流的有效载荷中。
节目码流(PS)
? 将具有共同时间基准的一个或多个PES组合(复合)而成的单一的数据流称为节目
流(Program Stream)。
PS的形成:
? 其一是将视频ES、音频ES、其他ES分别打包成视频PES包、 音频PES包、其他PES包:使每个PES包内只能存在1种性质的ES;每个PES包的第一个AU的包头可包含PTS和DTS;每个PES包的包头都有用于区别不同性质ES的数据流识别码。这一切,使解复用和不同ES之间同步重放成为可能。其二是通过PS复用器将PES包复用成PS包,即将每个PES包再细分为更小的PS包。PS包头含有从数字存储媒介(DSM-Digital storage Medium)进入系统解码器各个字节的解码专用时标,即预定到达时间表,它是时钟调整和缓存器管理的参数。PS包长度比较长且可变,适用于无误码环境,适合于节目信息的软件处理及交互多媒体应用。但是,PS包越长,同步越困难;在丢包时数据的重新组成,也越困难。因此PS用于存储(磁盘、磁带等)、演播室CD-I、MPEG-1数据流。
TS传输层基本原理
? 传输流 TS:将具有共同时间基准或具有独立时间基准的一个或多个PES组合而成的单一的数据流称为传输流(Transport Stream)。 传输流是许多种PES包的多路复用。
header包含了对包传输过程非常重要的信息:
? 同步字节:固定值47hex,在TS流中的间隔也固定。码流中其他位置也 可能出现
47hex,因此同步字节利用固定数值和固定间隔两方面联合实现同步。解码器在接收到5个TS包后开始同步。 同步字节是作为解码器识别用的,从而可对包头和有效载荷进行串并转换。传输差错标志:由解调器在传输信道末端设置, 在传输层之上的错误校正层中,如果原始误码率(BER)太高而无法校正时,通过它的设置可以指示传输流包中可能含有错误,13bit的PID(packet identifier):描述该包中payload的内容以及该包属于哪个ES流。有时TS包的头长度必须大于4个byte:包头扩展到payload中,payload长度相应缩短,但总包长度仍是188bytes。扩展的包头称作“adaptation field”。在4bytes的包头中由Adaptation control bits标志是否有adaptation field。除了同步字节、传输误码标识和PID以外,TS头还包括: ? Payload Unit Start Indicator一个比特来标记一个payload的开始,如果该比特为1,
表示该TS包是一个新payload的开始,该TS包包含了视频或音频PES包和PES头的开始,或者是表的开始,此时TS包的payload第一个字节为table ID。Transport Priority一个比特,表示该TS包比其他相同PID的TS包的优先级更高。
除了同步字节、传输误码标识和PID以外,TS头还包括:
? Transport Scrambing Control Bits两个比特,标记TS包的payload部分是否被混
杂。如果两个比特都为0,表示payload没有混杂。如果其中有一个比特不为0,表示payload进行了混杂,需要CAT来解扰。Adaptation Field Control Bits两个比特,标记是否有扩展头adaptation field,如果两个比特都为0,表示没有adaptation field ? 如果有adaptation field,payload变短,头变长,但总包长度保持188字节。Continuity
Counter,每个具有相同PID的TS包带有自身的4bit计数器。从0到15连续计数TS包数目,到15以后重新从0开始。可以发现丢失TS包的情况,并识别码流错误(计数不连续)。允许在改变节目时出现不连续计数,由adaptation field中的Discontinuity Indicator来标记。
? 在节目流中,由于音频和视频均锁定于一个公共时钟,因此可利用其时间标记以重
建时间轴。 传输流携带有许多不同的节目,每个节目都可以使用不同的压缩因子
并具有不同的比特率。 在传输流中就必须含有重建稳定时钟的附加数据。 传输流必须为每个节目提供各自独立的同步。 ?
对TS包再进行复用:
? 先复用同一个节目的TS包,一个节目可包含一个或多个视频和音频信号(如不同
角度摄像机、不同语言等)。所有节目的所有复用数据流再进行复用形成最终的TS流。MPEG-1,视频PES包与音频PES包复用,最大码率为1.5Mbit/s,用于VCD。 ? MPEG-2的TS包长188字节,包含所有节目的所有数据。
? 由于码率不同,MPEG-2 TS流中不同ES流的包出现频率不一样。
? 每个节目有一个编码器对所有ES流编码,产生PES,并将PES包打包成TS包。 ? 每个节目的码率通常约2~8Mbit/s,但由于节目内容随时间变化,视/音频和数据总
码率可以是固定或变化的,称为统计复用。所有节目的TS流再复用成一个总的TS流,最大约40Mbit/s。 ?
? 一个TS流中通常有6,8,10甚至20个节目组成。码率在传输过程中可变,但总码率
必须保持不变。一个节目可以包括视频和音频,或单纯音频或单纯数据,结构灵活可变。TS流中包含一些“表”来描述组成结构,解码器可以利用这些表来确定TS流的当前结构。
两种比特流的区别
? 节目码流(PS)用于误码比较小的传输或存贮媒介,节目码流可以是固定码率也可
以是可变码率,其数值在系统时钟参考(SCR)中定义,为本地应用相对于无误码的环境设计;
? 传输码流(TS)用于误码比较大的传输或存贮媒介,其码率可以是固定的或
不固定的,其数值在节目时钟参考(PCR)中定义。它是为广播应用而设计,即TS是为易误码的环境和有较高比特差错概率的噪声媒质设计的,那里往往需要把几个信道集合成一束数据。TS用在广播系统和长距离网络中。在TS中可以包括多个节目。因此接收TS时首先要解复用。
? PS和TS是各针对一类应用而设计的。都以数据包为基础。PS的包长可
变,通常较长;TS的包长固定为188字节,包头4个字节,184个净荷字节。并可与ATM适配。
TS流、包结构以及同步:
1、TS流:可以将TS流理解为一种单一码流、混合码流:
单一性:TS流的基本组成单位是长度为188字节的TS包。混合性: TS流由多种数据组合而成,一个TS包中的数据可以是视频数据,音频数据,填充数据,PSI/SI表格数据…….(唯一的PID对应)。TS流、包结构以及同步
2、这是TS包结构:TS包结构分析:TS包由包头、有效载荷区组成(有些包中还包括自适应区)。
3、怎样实现解码端的系统时钟恢复和视音频播放同步?
MPEG-2同步及时间恢复在编码、传输和解码中占有重要的地位,它不仅直接影响视音频的解码质量,还是衡量整个传输网络优劣的重要指标。MPEG-2规定的系统时钟频率为27MHz,传输流(TS)中的PCR,PTS/DTS等均为对该共同系统时钟的采样值。解码端捕获PCR,恢复出本地的STC,作为音视频同步控制的基准,并依据DTS、PTS时间标签来安排解码和显示时间表,使音视频分别同步于STC,以实现音视频之间的同步。标准规定在原始音频和视频流中,PTS的间隔不能超过0.7s,而出现在TS包头的PCR间隔不能
超过0.1s(数字电视中是0.04秒)。
PSI/SI 表格信息:
1、什么是PSI/SI表格,为什么使用这些表格?
简单来看,TS是一个传输层的协议栈,它可以承载各种内容的传输,比如MPEG,WMV,H264,甚至是IP,那么其中的传输规范是如何定义的呢?
这个即是PSI(节目特定信息)要做的事情。 PSI表格信息用来描述传送流的组成结构。 由上面的章节,我们知道解码端只要知道了某个TS包的PID,就知道这个包中到底携带的是什么数据。而解码端之所以有这种能力,是因为他先获得了PSI表格信息。另外为了适应实际应用和业务发展的需求,又专门制定一个数字视频广播的业务信息标准—SI信息,来规范和服务于各业务提供商和设备生产厂家,以促进和保证数字视频广播业务在我国健康有序的发展。
2、PSI信息由什么组成,各包含哪些内容?
PSI信息由四种类型的表(table)组成。
1)节目关联表(PAT):针对复用的每一路业务,PAT提供了各个节目号及其相应的节目映射表(PMT)的PID,同时还提供网络信息表(NIT)的PID。 2)节目映射表(PMT):PMT表存放的是节目中包含的音频、视频、其他数据的PID信息。每一个节目的所有信息必须包含在一个PMT中,但在一个PMT中可以包含多个节目的信息。PMT本身的PID由PAT表格提供。 PSI/SI 表格信息
3)条件接收表(CAT):条件接收表提供了在复用流中条件接收系统的有关信息。当有EMM时,它还包括了EMM(授权管理信息)所在的PID(CA_PID)。
4)网络信息表(NIT):提供有关物理网络的信息,比如网络ID,网络中所包含的传输流ID,所在频点等信息。NIT表本身的PID由PAT表提供。 3、PSI表格信息详解(以解码端工作过程举例):
1)从TS流中解析出ID为0x00的PAT表格信息。2)由PAT表提供的信息从TS流中解析出各个节目的PMT表格信息。3)确定各节目中包含的视频数据、音频数据以及其他数据的PID。4)根据PID从TS流中解析出各节目的视频、音频以及其它数据,分别存储。 5)之后再分别完成各节目的音视频同步解码与显示。 4、SI表格由几部分组成,都包含哪些内容?
业务信息(SI)由以下九个表构成。其中SDT表、EIT表和TDT表是必须包括的,其它表是可选的。
1)业务描述表(SDT):描述了包含在特定TS流中的全部业务的相关信息。业务描述表包含了描述系统中业务的数据,例如业务名称、业务提供者等。
2)事件信息表(EIT):描述了包含在特定业务中的所有事件的相关信息。事件信息表包含了与事件或节目相关的数据,例如事件名称、始时间、持续时间等。不同的描述符用于不同类型的事件信息的传输,例如不同的业务类型。
3)时间和日期表(TDT):时间和日期表给出了与当前的时间和日期相关的信息。由于这些信息频繁更新,所以需要使用一个单独的表。4)业务群关联表(BAT)5)运行状态表(RST) 6)时间偏移表(TOT) 7)填充表(ST)8)选择信息表(SIT)9)间断信息表(DIT) 5、PSI/SI 表格信息在TS流中如何传输?
PSI/SI 表格信息在TS流中以段的形式进行传输(也可以理解为对这些表格信息进行了打包)。基本思想是:先将一个表格信息以段的方式进行封装,最后将段插入到TS包中。因为TS包188字节,所以一般情况下,一个section要分成好几部分存放在连续的TS包中(如果表格信息过多,需要先进行分组,再分别封装成好几个段)。
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库广播电视资料(2)在线全文阅读。
相关推荐: