音频信号混响器设计 推荐Word文件下载.docx
- 文档编号:19333493
- 上传时间:2023-01-05
- 格式:DOCX
- 页数:22
- 大小:557.11KB
音频信号混响器设计 推荐Word文件下载.docx
《音频信号混响器设计 推荐Word文件下载.docx》由会员分享,可在线阅读,更多相关《音频信号混响器设计 推荐Word文件下载.docx(22页珍藏版)》请在冰豆网上搜索。
2.1全通滤波混响模型6
2.2延时6
2.3混响7
2.4声激励8
2.5相位的调节9
2.6整体缩混输出9
2.7多重混响处理10
2.8频率均衡10
3音频信号与MATALB13
3.1音频信号的格式13
3.2MATLAB能读取的音频格式14
4设计步骤和编程16
4.1用MATLAB读取一段音频信号16
4.2对音频信号进行混响16
4.3播放混响后的音频信号16
4.4全通结构的混响器16
5实验步骤18
6结论21
参考文献22
附录23
致谢25
1绪论
1.1课题背景
1.1.1混响器简介
混响器是音频系统中普遍使用的周边设备,它可以改变室内的混响时间,对较“干”的信号进行再加工,以增加空间感,提高音响系统的丰满度。
也可以人为地制造一些特殊效果,如山谷、山洞的回声效果等。
板式混响器可以说是人工混响器的鼻祖,体积很大而且笨重,只能固定在一个地方使用,安装时要采取隔声措施和防振措施后才能使用。
随着计算机科学的高速发展,以及数字音频技术的发展,出现了数字混响器,数字混响器逐渐取代了古老的板式混响器,并且应用更广泛。
数字混响器采用数字信号处理技术重现混响效果,提供了比模拟混响器更灵活多变、适应各种需要的效果模式。
常用的混响器有机械式(如弹簧混响器、钢板混响器、箔式混响器等)混响器、磁混响器和模拟电子混响器、数字混响器等四种。
后两者具有频率范围宽,混响特性好,信噪比高,调节范围大,调整方便等优点,因此被广泛应用于电子扩声系统中。
1.1.2数字混响器的工作原理
数字式混响器的工作原理是:
先将信号经过A/D转换,把音频信号变为数字信号存储在移位寄存器(MOS)和随机延迟存储器(RAM)的存储单元中,经编码后的数字信号由计算机对其进行运算、处理,最后经过D/A转换,以获得所需的各种混响声和自然效果声。
采用数字式混响器对信号的电平、位置、延迟时间以及混响信息均可自由控制、无频率畸变和染色失真现象,所以能够获得更为自然的混响效果,以及自然界根本无法得到的特殊音响效果,故又称之为效果器。
1.1.3混响器的发展现状
长久以来,混响器作为音频制作、声学应用等各种应用层面的有力因素,为其提供了源源不竭的活力。
混响器可以增加声音的空间感,其利用声音反射相对较小的特点来添加空间感,从而使声音更加悦耳。
它是一个神奇的声音加工工具,是所有音频制作相关行业的从业者再熟悉不过的工具了,也是现代流行音乐录音制作、影视歌曲制作中不可或缺的有力工具。
对于数字混响器的研究应用,美国莱斯康的PCM480L、960L。
丹麦TC电子混响的Reverb6000、Reverb4000等硬件混响装置凭借其优良的算法和出色的声音效果,多年以来仍然是世界上主要的工作室、各大录音棚、电影混音棚里使用最为广泛的混响制作工具。
随着科技的不断发展,包括混响操作等问题,数字DSP技术已经可以很好地把计算任务交给专用的DSP芯片来解决,而且已经被TC电子和SSL等音频设备知名厂商大力推广,大大减少了不能做多任务运算的电脑的CPU芯片的负担,从而保证了更加稳定的数字音频工作站(DAW)的运行,因为厂家生产的DSP效果卡等也都有自己的特殊功能,这些DSP效果混响卡继承了很多真正的硬件混响的特点。
此外,这些产品可以对VST、AU、RTAS等插件格式的主流音频工作站进行无缝链接,所以这些产品被许多录音师和工程师追捧。
近年来,随着不断提高的CPU的速度,出现了64位运算和多核中央处理器的计算机,以前过大混响计算量不能一次达到,而卓越的CPU的出现很好地解决了这一问题,并且有一个很好的发展前景。
如此强大的音频信号混响器无论是在公共商业演出还是家庭娱乐中,均发挥着重要作用,它能让我们拥有丰厚,饱满的声音体验,极大地提高了我们的生活质量和精神追求。
随着数字技术的发展,当今的数字混响器具有灵活多变等特点,可为我们提供各种需求,根据中国商务部的调查分析,未来五年,混响器产业所带来的效益将以每年百分之二十左右增长。
并且用户对产品的期望也越来越高,所以有越来越多的企业开始着力开发更好更完美的混响器产品。
不只是在混响器,现在已有混响室等设计理念,并且会有更多的设计理念出来。
然而当今的混响器市场主要被国外企业占据,但国内市场巨大,这就为我们的产品设计提供了广阔的市场空间。
1.2语音信号处理
1.2.1信号的定义
信号是传递信息的函数。
离散时间信号可以用图形来表示。
根据不同的信号的特性,信号可以表示成一个或几个函数的自变量。
例如,图像信号就是空间位置(二元变量)的亮度函数。
一维变量可以是时间,也可以是其他的参量,习惯上将一维变量看成是时间。
信号可以分为以下几种:
(1)离散时间信号:
时间为离散变量的信号,即独立变量时间被量化了。
而幅度仍是连续变化的。
(2)连续时间信号:
定义的时间范围为连续的信号,但信号的振幅可以是一个连续的值,可以是离散的值。
当振幅为连续的情况下,通常被称为作为模拟信号。
事实上,常见的连续时间信号和模拟信号可通用,并且以相同的信号来说明。
(3)数字信号:
时间离散而幅度量化的信号。
语音信号是一维数字信号,它是基于时间轴上的,这里主要针对语音信号进行频域分析。
在信号分析中,频域比时域包含更多的信息。
而对于频域分析,大概有8种波形可以让我们分析:
矩形方波,锯齿波,梯形波,三角波,余旋波,余旋平方波,临界阻尼指数脉冲波形,高斯波。
对于这些波形,我们都可以用傅立叶变换来分析,就是:
将时域波形转化为频域来分析。
1.2.2语音信号处理的发展
早在一两千年以前,人们便对语言进行了研究。
由于没有适当的仪器设备,长期以来,一直是由耳倾听和用口模仿来进行研究。
因此,这种语言研究常被称为“口耳之学”,所以对语音只是停留在定性的描写上。
语音信号处理真正意义上的研究可以追溯到1876年贝尔电话的发明,该技术首次用声电、电声转换技术实现了远距离的语音传输。
1939年HomerDudley提出并研制成功的第一个声码器,从此奠定了语音产生模型的基础。
这一发明在语音信号处理领域具有划时代的意义。
19世纪60年代,亥姆霍兹应用声学方法对元音和歌唱进行了研究,从而奠定了语言的声学基础。
20世纪40年代,一种语言声学的专用仪器---语谱图仪问世了。
它可以把语音的时变频谱用语图表示出来,从而得出了“可见语言”。
1948年美国Haskins实验室研制成功“语音回放机”,该仪器可以把手工绘制在薄膜片上的语谱图自动转换成语音,并进行语音合成。
20世纪50年代对语言产生的声学理论开始有了系统的论述。
随着计算机的出现,语音信号处理的研究得到了计算机技术的帮助,使得过去受人力、时间限制的大量的语音统计分析工作,得以在电子计算机上进行。
在此基础上,语音信号处理不论在基础研究方面,还是在技术应用方面,都取得了突破性的进展。
1.2.3MATLAB在数字语音信号处理中的应用
数字语音信号处理是将数字信号处理与语音学相结合,解决现代通信领域中人与人、人与机器之间的信息交流的学科。
近几年来语音信号处理科学在世界范围内已取得了飞速的发展,由于MATLAB是一种运算效率高、功能强大、交互性良好的数值计算和可视化计算的高级语言,它将信号处理、图形显示和数值分析有机地融合为一体,是一个极其方便、操作简单、用户界面友好的操作和开发环境。
随着MATLAB的不断更新换代,其功能越来越强大,因而被广泛应用于数字语音信号处理、数值图像处理、仿真自动控制、小波分析和神经网络等领域。
同时又由于MATLAB具有大量的信号处理工具箱并能利用非线性动态系统分析工具Simulink等优点,所以近年来MATLAB已经成为数字信号处理的有利工具,因此也成为学习语音信号处理和进行研究工作的仿真软件工具。
下面简要介绍MATLAB在数字语音信号中的几方面应用。
(1)MATLAB可以对数字语音信号进行时域和频域分析。
通过MATLAB可以很方便地画出语音信号的时域波形及频域图,并且可以根据语音信号的特性对其进行分析。
例如,清浊音的幅度差别、LPC分析、频谱分析等。
(2)MATLAB能对数字语音信号进行判别和评估。
可根据语音信号的短时参数,和不同语音信号短时参数的性质对一段给定的信号进行清浊音的判断、对语音信号的基音周期进行估计和有无声判定等。
(3)通过利用MATLAB对语音信号进行编程处理。
由于MATLAB是一种面向数学和工程计算的高级语言,其允许用数学形式的编程语言,而且拥有大量的库函数,所以它具有编程简单、效率高、易学易懂等特点。
可以对信号进行加噪和去噪、滤波、截取语音等,也可以进行语音编码、语音识别、语音合成的编程等。
1.3设计理念
如果人为地对声音信号进行处理让其具有更完美的音质效果,这样的方法称之为人工混响,人工混响在广播电影电视和音乐制作中被广泛应用。
以前的混响处理是采用模拟技术,效果不够理想。
随着数字信号处理技术的发展,一些原来只能通过建筑声学才能解决的声学效果问题如今可以利用电声学技术以及数字信号处理技术来实现。
在同一个声学环境下,一个声源除了一部分能直接到达人耳外,还有一部分需要通过人体周围的障碍物反射到人耳,而直达声和反射声叠加在一起就形成了混响。
本设计正是利用这一特性对音频信号进行了延时,然后进行叠加以达到混响效果,设计效果明显。
数字信号处理主要是研究用数字或符号序列表示和处理信号。
处理的目的可以是削弱信号中的多余内容,滤除混杂的噪声和干扰,或者是将信号变换为容易分析和识别的形式,便于估计和选择它的特征参数。
声音信号是一维连续信号,而计算机只能处理离散信号。
为了从离散信号还原连续信号,根据采样定理,可以确定采样频率的最小值。
wav文件是一种数字声音文件格式,本设计基于MATLAB分析了wav声音文件频谱与声音的关系。
通过MATLAB载入一首歌曲进行延时、混响等处理,然后设计一个混响器来处理这个原始声音的wav文件,并比较输出声音信号与原声音信号的异同。
利用MATLAB中的wavread命令来读入(采集)语音信号,将它赋值给某一向量。
再将该向量看作一个普通的信号,依据实际情况对它进行延时、混响等操作。
对于波形图与频谱图(包括前后的对比图)都可以用MATLAB画出。
我们还可以通过sound命令来对语音信号进行回放,以便在听觉上来感受声音的变化。
2混响的原理
2.1全通滤波混响模型
全通滤波的混响模型如图2.1所示:
图2.1全通混响模型
图中m表示延时,而g(g<
1)是反馈增益。
此混响模型输入输出方程为:
y(n)=-gx(n)+x(n-m)+gy(n-m)(2.1)
传递函数为:
H(z)=
(2.2)
2.2延时
延时就是将音源延迟一段时间后,再播放出来的效果处理。
根据其延迟时间的长短,可产生镶边、回音、合唱等效果。
当延迟的时间在3~35ms之间时,人耳会感觉不到滞后的声音的存在,并且滞后的声音与原音源相叠加后,会因为其相位的干涉而产生"
梳状滤波"
效应,这就是我们所说的镶边效果。
如果延迟时间达到50ms以上,延迟的声音就清晰可辨,这时的处理效果称之为回音。
处理回音一般都是用来产生比较简单的混响声效果。
镶边、延时、回音、合唱等效果所具有的可调参数大致都相同,包括以下几项:
(1)延时时间(Dly),即调整主延时电路的延时时间。
(2)反馈增益(FBGain),即控制延时反馈的增益。
(3)反馈高频比(HiRatio),即控制反馈回路上面的高频衰减。
(4)调制频率(Freq),指主延时电路的调频周期。
(5)调制深度(Depth),指调频电路的调制深度。
(6)高频增益(HF),指控制高频的均衡。
(7)预延时(IniDly),指调整主延时电路的预延时时间。
(8)均衡频率(EQF),这里的均衡频率用于音色的调整,即为频率选择一个均衡的中点。
由于进行延时操作所产生的效果均复杂多变,如果非效果处理的专家,可以使用设备提供的预先设置的参数,因为这些预置参数给出的处理效果会比自己设置的要好。
2.3混响
混响效果主要是用于增加音源的融合感。
自然音源的延时声阵列非常密集、复杂,所以模拟混响效果的程序也复杂多变。
常见参数有以下几种:
(1)混响时间:
能逼真的模拟自然混响的数码混响器上均有一套非常复杂的程序,虽然其拥有很多参数可调,然而相比原有的效果,调整这些技术参数都不会更为自然,特别是对于混响时间。
(2)高频混降:
为了产生比较自然的混响效果,此项参数用于模拟空气对高频部分的吸收效应。
一般情况下高频混降的可调范围为0.1~1.0。
高频混降越高,混响效果就越接近自然混响;
相反较低时,混响效果就较清澈。
(3)扩散度:
扩散度可改变混响声阵密度的增长速率,其可调范围为0~10,位于较高值时,混响效果体现出丰厚、温暖的特点;
位于较低值时,混响效果就比较空旷、冷僻。
(4)预延时:
建立自然混响声阵会延迟一段时间,预延时即为模拟次效应而设置。
(5)声阵密度:
调整声阵密度参数可改变声阵的密度,当数值较高时,混响的效果为温暖,但有明显的声染色;
相反,数值较低时,混响效果变为深邃,并且声染色也相对较弱。
(6)频率调制:
这一参数技术性较高,由于电子混响的声阵密度比自然混响的稀疏,为了让混响声听起来比较平滑、连贯,需要对混响声阵列的延时时间进行调制。
此项技术可以有效的消除延时声阵列的段裂声,可以增加混响声的柔和感。
(7)调制深度:
指上述调频电路的调制深度。
(8)混响类型:
不同房间的自然混响声阵列差别也较大,而这种差别也不是一两项参数就能表现的。
在数字混响器当中,不同的自然混响需要不同的程序。
其可选项一般有房间(Room)、小厅(S-Hall)、大厅(L-Hall)、随机(Random)、反混响(Reverse)、钢板(Plate)、弹簧(Sprirg)等。
其中自然混响效果包括房间、小厅、大厅混响;
早期机械式混响效果可以用钢板、弹簧混响来模拟。
2.4声激励
如果对音响音源信号进行浅度的限幅处理,就会产生一种类似"
饱和"
的音感效果,从而使其发音在不增大其实际响度的基础上表现出有响度增大的效果。
一些常用的效果器上也有非线性饱和的效果,实际上就是有信号的振幅处理,用来模拟三极管上的大电平信号达到饱和所引起的非线性,进而产生"
发硬"
的音感效果。
由于限幅失真主要是产生额外的高次谐波,因而现在设计的激励器,为了达到柔和的处理效果,在音源中,通过加置高次载波的成分来模拟限幅失真,能营造出不那么"
嘶哑"
的声激励效果。
另外,用一个高通滤波器来强化高次谐波,对原来的信号进行处理之后再叠加在经过延时处理的原信号上,这样可以产生清澈的声音效果。
所以,经过这样的处理方式后便可产生出清澈的激励。
由于激励处理和音响设备的过载失真大致类似,所以如果对音源进行过量的激励,就会产生令人不适的嘈杂感。
由于早期的音响设备保真度都不高,我们已经慢慢习惯了那种略显嘈杂的音响,而现在接触的音感清澈的高保真音响,反而让我们不太习惯,感觉它的发音十分柔弱。
人声音源中,除了那些经过特殊训练的人之外,我们大部分人的发音都缺乏劲度,所以需要对声音进行激励处理。
声激励处理主要有下面几个方面:
(1)对人声的乐音激励处理,频谱的分布以2500Hz处为中间点。
这种激励处理后的效果比较好,音源突出感的增加也很明显。
(2)对人声的鼻音激励处理,频谱的分布以500Hz为中点。
这种激励能有效地增加人声的劲度。
(3)对于人声的800Hz附近的激励,音源的喧嚣嘈杂感大大增加,然而此处理方法不应经常使用,最好只在演唱摇滚乐时使用。
(4)对人声3500-6800Hz的频谱,激励处理不适合使用,因为它容易让音源产生令人不适的嘈杂声。
(5)而人声的齿音一般不使用激励处理,那是由于此频段很容易让人察觉有失真。
如果要对齿音做少量的激励处理,可以用数字式激励器,因为数字式激励器的激励效果比较柔和,可以增强齿音的清析感。
而处理的频谱应该在7200Hz以上。
激励处理对于歌唱发音通常要保守一些。
我们在调音当中,因为激励处理所产生的音感效果可能会随听音的时间而逐渐被弱化,那么我们在调节激励效果时,时间最好在10分钟以内。
对于人声音源的激励处理,最好是用数码效果器。
它通常有以下几项调整参量:
(1)输入增益(Gmn),用来进行输入电平的调节,这里千万别使设备产生过载。
(2)调谐频率(Tuning),根据你需要处理的频段来选择一个恰当的频率。
(3)驱动电平(Drive),用来调整激励的深度。
当驱动电平较大时,会产生比较嘈杂的效果;
而驱动电平较小时,产生的效果则比较温和。
(4)混合比率(Mix),即原信号与效果信号的响度比。
2.5相位的调节
立体声的音乐作品需要进行相位的调节,这是混音中很重要的一环。
这样能使混好的音乐作品层次分明,并且真正体现"
立体声"
的效果。
相位的调节有左右,前后之分。
左右声道的调节比较简单,一般的音频软件都可以很方便的调节,只要戴上耳机,可以很轻松的调整和听到调整后的效果。
前后层次的音相调节比较复杂,一般来说,用简陋的硬件设备很难录出层次感很强的多轨音乐。
只能依靠软件后期下比较大的工夫去慢慢调节。
有一些专门调整音相的效果器插件,如PanHandle,还有Ultrafunk出的Surround插件都是不错的相位调节器。
前与后的关系,实际上就是混响时间长与短的关系。
对于要处于后方的声音,使其混响时间更长一些,它的声音便会模糊和有"
距离感"
,对于要处于前方的声音,使其混响时间稍短一些,它的声音就会清晰和"
逼近"
。
2.6整体缩混输出
这一部分实际上没有什么太多可以提及的。
因为我们用电脑软件来操作,和专业的母带生产流程自然不同。
在多轨录音软件如Samplitude2496,CoolEditPro里面编辑完成以后,选择"
Export"
命令(CoolEditPro里面是MixDown命令),就可以将多轨音频合成为2轨立体声输出。
你可以选择输出的格式,如wav、mp3、rm等等。
当然wav文件的音质最好,占的空间也要大的多。
这样,辛辛苦苦的录音、编辑、混音终于有了一个成果。
有时候,这样导出的.wav文件还需要处理一下。
比如用母带处理软件T-racks最后小小压缩一下,使声音更加柔和温暖,更符合人耳的听觉习惯。
2.7多重混响处理
多重混响的处理,大多数人都是使用反复试探性调节的方法,以寻找音感效果最好的处理效果。
此种调音方式的不足十分明显:
寻找一个理想的调音效果,需经多次猜测,所以需要教长的时间。
较好的调音效果常常是偶然遇到的,这对于调音规律的归纳总结没什么帮助,并且以后也不易再现。
不同设备的各项固定参数和可调参数都不尽相同,因而使用某一设备的经验,通常都无法用于另一设备。
发展到目前的效果处理设备,用于改变音源音色的手段并不是太多,比较常用的方法只有限幅失真、延时反馈、频率均衡等3种,但是这些效果处理设备的参数的不同组合所产生的音色大不一样。
效果处理器参数的设置可以有很多项,特别是延时反馈,模拟混响效果参数的设置在理论上可以达到几十项。
当然这些专业性非常强的参数,大多数人都难以理解。
因此,绝大部分的效果处理设备都只有一、二个参数可调,并且其可调的范围也比较狭窄。
这种使用简单的效果处理设备容许人们在上面进行微幅的调整,因而不会出现太大的问题。
但是对于处理效果要求比较高的调音场合,如在多轨录音系统当中,就必须使用更加专业的效果处理设备,用以做出更为精细的处理效果。
2.8频率均衡
很明显,如果频率均衡的分段越多,那么效果处理的精细程度也就越高。
一般调音的均衡单元通常只有三四个频段,这显然满足不了精确处理音源的要求。
为了能足够灵活的对人声进行任意的均衡处理,我们建议使用增益、频点和宽度都可调整的四段频率均衡。
大多数的频率均衡的可调参数只有增益一项,然而这并不意味着其他两项参数不存在,而且这两项参数为不可调的固定参数。
当然这两项参数设置为可调也并非难事,但这些会增加设备的生产成本,并会使其调整变得复杂化。
所以增益、频点和宽度都可调整的参量均衡的电路,常常只有在一些高档设备上才能见到。
实际上,增益、频点和宽度都是可调整的频率均衡,不可能胡猜乱试就可以找出一个接近完美的音色。
在这里我们必须探究出音频信号的技术参数和物理特性以及它们在人的听感上所对应的关系。
由于人声音源频谱的分布会比较特殊,就其发音方式而言,就有3个部分:
一是由于声带震动产生乐音,这部分发音最灵活,还有不同发音、不同音高的方式产生的频谱的变化也很大;
第二是鼻腔内形状比较稳定,所以其共鸣产生的谐音频谱的分布变化不是太大;
第三是口腔中的气流流动在齿缝间的摩擦声,它与声带震动产生的乐音基本上没有关系。
频率均衡可以大致的将这三部分频谱区分出来。
鼻音的频率段一般在500Hz以下,均衡的中点频率大概在80~150Hz,均衡带宽为4个倍频程。
比如,可以将100Hz设定为频率均衡的中点,均衡曲线可从100~400Hz
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 音频信号混响器设计 推荐 音频 信号 混响 设计