77范文网 - 专业文章范例文档资料分享平台

语音识别论文(5)

来源:网络收集 时间:2019-01-26 下载这篇文档 手机版
说明:文章内容仅供预览,部分内容可能不全,需要完整文档或者需要复制内容,请下载word后使用。下载word有问题请添加微信号:或QQ: 处理(尽可能给您提供完整文档),感谢您的支持与谅解。点击这里给我发消息

青岛大学本科生毕业论文(设计)

导命令由nowait从句,则所有线程在single指导命令结束处隐式同步点同步;master指导命令和single指导命令类似,区别在于master指导命令包含的代码段由主线程执行, single指导命令包含的代码段可以由任一线程执行,并且master指导命令在结束处没有隐式同步,也不能指定nowait从句;critical指导命令包含的代码段称为临界段,同时只能有一个线程访问;ordered指导命令表示循环的迭代次序和串行程序一样;sections指导命令包含一些section,根据section的数量和线程的数量不同,可能有时一个线程执行多个section;也可能有的线程没有执行任何section,右边的方向线即标识出后面这种情况。

通过流图的形式来对OpenMP指导命令进行描绘,可以很清晰的观察出OpenMP指导命令的特点。

OpenMP是面向共享主存结构的标准,程序员在开发的过程中不用考虑数据分布,因此使用OpenMP开发并行程序比较容易,一般OpenMP程序是从串行程序出发,通过在适当位置加入编译指导命令和运行库函数来并行化串行程序,通常OpenMP并行程序有几种不同的开发形式,本文列出最常见的两种开发形式:一是通过简单的fork-join形式对串行程序并行化;二是采用单程序多数据SPMD形式对串行程序并行化。

1、fork-join形式的程序。这种形式的OpenMP程序是最常见的,很多OpenMP程序设计教程里都是采用这种形式来并行化串行程序,好处是可以采用增量化的方式方便的开发OpenMP程序,主要是对相应的循环进行并行化,线程组的产生和结束和循环的边界重合,也就是在循环的开始前启动线程组,在循环结束后销毁线程组,开发的关键是进行相关性分析,判断循环是否可以并行,对不能并行的循环进行分块或变量重命名等技术手段来消除依赖性。这种开发形式的缺点是性能不高,主要有以下几个方面的原因:一是对程序局部进行变化,并不能有效地开发并行性;二是频繁的启动和销毁线程组,会带来比较高的开销;三是对程序的局部性(CACHE不能有效利用)开发不够,因为很多跨循环的优化无法实施。下面代码片段给出这种形式程序的样式:

?

#pragma omp parallel for

for(…) { ? } ?

2、SPMD形式的程序。OpenMP程序下的SPMD形式的程序是指在一个完整的程序有一个多或多个具有SPMD特征的并行块组成。在每个并行快中,任务在线程组中进行分配。利用OpenMP的库函数omp _get_num_threads()和omp _get_ thread _ num ()可以进行任务划分。SPMD形式的优点主要包括:一是可以减少线程管理带来的开销;二是可以消除冗余同步;

16

青岛大学本科生毕业论文(设计)

三是可以使程序拥有较好的局部性。SPMD形式的缺点是编写困难,因为要考虑诸如并行块结构是否合适,是否存在冗余的同步等问题。下面代码片段给出这种形式程序的样式:

?

#pragma omp parallel shared(x,npoints)private(iam,np,ipoints) {

iam=omp_get_thtead_num(); no= omp _get_num_threads(); ipoints=npoint/np; subdomain(x,iam,ipoints); } ?

一般来说,如果对程序的性能要求不高,可以采用fork-join形式,如果对程序性能有很高要求,建议采用SPMD形式,事实上,一些标准的benchmark,比如NPB 2.3 COMP benchmark和NPB 3.0 FROTRAN OMP benchmark等都是采用SPMD形式。

17

青岛大学本科生毕业论文(设计)

第三章 基于VC2005孤立词语音识别的编程实现

3.1 语音识别系统原理及设计方法

3.1.1 语音识别系统的基本原理

使用C语言编程,实现基于马尔科夫模型的数据特征提取,在此基础上编程实现特定语音实例的语音识别;将语音识别功能编写成可供其他模块调用的函数,为进一步实现语音识别系统提供基础;并且从中培养、提高查阅文献和综合运用知识的编程开发能力。

语音识别本质上是一种模式识别的过程,未知语音的模式与已知语音的参考模式逐一进行比较,最佳匹配的参考模式被作为识别结果。图3-1是基于模式匹配原理的自动语音识别系统原理框图。 语音信号 输入 预处理 特征提取 训练 参考模式库 识别结果 模式匹配 判别规则 图3-1 语音识别系统原理框图

(1)预处理模块:对输入的原始语音信号进行处理,滤除掉其中的不重要的信息以及背景噪声,并进行语音信号的端点检测、语音分帧以及预加重等处理。

(2)特征提取模块:负责计算语音的声学参数,并进行特征的计算,以便提取出反映信号特征的关键特征参数用于后续处理。现在较常用的特征参数有线性预测(LPC)参数、线谱对(LSP)参数、LPCC、MFCC、ASCC、感觉加权的线性预测(PLP)参数、动态差分参数和高阶信号谱类特征等。其中,Mel频率倒谱系数(MFCC)参数因其良好的抗噪性和鲁棒性而应用广泛。

(3)训练阶段:用户输入若干次训练语音,经过预处理和特征提取后得到特征矢量参数,建立或修改训练语音的参考模式库。

(4)识别阶段:将输入的语音提取特征矢量参数后与参考模式库中的模式进行相似性度量比较,并结合一定的判别规则和专家知识(如构词规则,语法规则等)得出最终的识别结果。

18

青岛大学本科生毕业论文(设计)

3.1.2 语音识别的几种基本设计方法

语音识别的方法主要有三种:基于声道模型和语音知识的方法、模板匹配的方法以及利用人工神经网络的方法。

(1)基于语音学和声学的方法

该方法起步较早,在语音识别技术提出的开始,就有了这方面的研究,但由于其模型及语音知识过于复杂,现阶段没有达到实用的阶段。

通常认为常用语言中有有限个不同的语音基元,而且可以通过其语音信号的频域或时域特性来区分。这样该方法分为两步实现:

第一步,分段和标号

把语音信号按时间分成离散的段,每段对应一个或几个语音基元的声学特性。然后根据相应声学特性对每个分段给出相近的语音标号。

第二步,得到词序列

根据第一步所得语音标号序列得到一个语音基元网格,从词典得到有效的词序列,也可结合句子的文法和语义同时进行。

(2)模板匹配的方法

模板匹配的方法发展比较成熟,目前已达到了实用阶段。在模板匹配方法中,要经过四个步骤:特征提取、模板训练、模板分类、判决。常用的技术有三种:动态时间规整(DTW)、隐马尔可夫(HMM)理论、矢量量化(VQ)技术。 a.动态时间规整(DTW)

语音信号的端点检测是进行语音识别中的一个基本步骤,它是特征训练和识别的基础。所谓端点检测就是在语音信号中的各种段落(如音素、音节、词素)的始点和终点的位置,从语音信号中排除无声段。在早期,进行端点检测的主要依据是能量、振幅和过零率。但效果往往不明显。60年代日本学者Itakura提出了动态时间规整算法(DTW:DynamicTimeWarping)。算法的思想就是把未知量均匀的升长或缩短,直到与参考模式的长度一致。在这一过程中,未知单词的时间轴要不均匀地扭曲或弯折,以使其特征与模型特征对正。 b.隐马尔可夫法(HMM)

隐马尔可夫法(HMM)是70年代引入语音识别理论的,它的出现使得自然语音识别系统取得了实质性的突破。HMM方法现已成为语音识别的主流技术,目前大多数大词汇量、连续语音的非特定人语音识别系统都是基于HMM模型的。HMM是对语音信号的时间序列结构建立统计模型,将之看作一个数学上的双重随机过程:一个是用具有有限状态数的Markov链来模拟语音信号统计特性变化的隐含的随机过程,另一个是与Markov链的每一个状态相关联的观测序列的随机过程。前者通过后者表现出来,但前者的具体参数是不可测的。人的言语过程实际上就是一个双重随机过程,语音信号本身是一个可观测的时变序列,是由大脑根据语法

19

青岛大学本科生毕业论文(设计)

知识和言语需要(不可观测的状态)发出的音素的参数流。可见HMM合理地模仿了这一过程,很好地描述了语音信号的整体非平稳性和局部平稳性,是较为理想的一种语音模型。 c.矢量量化(VQ)

矢量量化(VectorQuantization)是一种重要的信号压缩方法。与HMM相比,矢量量化主要适用于小词汇量、孤立词的语音识别中。其过程是:将语音信号波形的k个样点的每一帧,或有k个参数的每一参数帧,构成k维空间中的一个矢量,然后对矢量进行量化。量化时,将k维无限空间划分为M个区域边界,然后将输入矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。矢量量化器的设计就是从大量信号样本中训练出好的码书,从实际效果出发寻找到好的失真测度定义公式,设计出最佳的矢量量化系统,用最少的搜索和计算失真的运算量,实现最大可能的平均信噪比。

核心思想可以这样理解:如果一个码书是为某一特定的信源而优化设计的,那么由这一信息源产生的信号与该码书的平均量化失真就应小于其他信息的信号与该码书的平均量化失真,也就是说编码器本身存在区分能力。

在实际的应用过程中,人们还研究了多种降低复杂度的方法,这些方法大致可以分为两类:无记忆的矢量量化和有记忆的矢量量化。无记忆的矢量量化包括树形搜索的矢量量化和多级矢量量化。

(3)神经网络的方法

利用人工神经网络的方法是80年代末期提出的一种新的语音识别方法。人工神经网络(ANN)本质上是一个自适应非线性动力学系统,模拟了人类神经活动的原理,具有自适应性、并行性、鲁棒性、容错性和学习特性,其较强的分类能力和输入-输出映射能力在语音识别中都很有吸引力。但由于存在训练、识别时间太长的缺点,目前仍处于实验探索阶段。

由于ANN不能很好的描述语音信号的时间动态特性,所以常把ANN与传统识别方法结合,分别利用各自优点来进行语音识别。

3.2 孤立词语音识别系统

3.2.1 孤立词语音识别系统的构成

参考以模板为单词单位

声学参数分析 单词识别 单词参考模板 图3-2 参考以模板为单词单位

20

识别输出

百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库语音识别论文(5)在线全文阅读。

语音识别论文(5).doc 将本文的Word文档下载到电脑,方便复制、编辑、收藏和打印 下载失败或者文档不完整,请联系客服人员解决!
本文链接:https://www.77cn.com.cn/wenku/zonghe/446463.html(转载请注明文章来源)
Copyright © 2008-2022 免费范文网 版权所有
声明 :本网站尊重并保护知识产权,根据《信息网络传播权保护条例》,如果我们转载的作品侵犯了您的权利,请在一个月内通知我们,我们会及时删除。
客服QQ: 邮箱:tiandhx2@hotmail.com
苏ICP备16052595号-18
× 注册会员免费下载(下载后可以自由复制和排版)
注册会员下载
全站内容免费自由复制
注册会员下载
全站内容免费自由复制
注:下载文档有可能“只有目录或者内容不全”等情况,请下载之前注意辨别,如果您已付费且无法下载或内容有问题,请联系我们协助你处理。
微信: QQ: