声控技术及其应用.docx
- 文档编号:6503732
- 上传时间:2023-01-07
- 格式:DOCX
- 页数:10
- 大小:141.85KB
声控技术及其应用.docx
《声控技术及其应用.docx》由会员分享,可在线阅读,更多相关《声控技术及其应用.docx(10页珍藏版)》请在冰豆网上搜索。
声控技术及其应用
滨江学院
学年论文(设计)
题目声音控制技术及其应用
院系自动控制系
专业电气工程及其自动化
学生姓名嵇朋朋
学号***********
指导教师陈炜峰
职称教授
二O一一年O二月十五日
声音控制技术及其应用
嵇朋朋
南京信息工程大学滨江学院电气工程与自动化专业,南京210044
摘要:
介绍了声音控制技术特点、发展历程及其发展趋势,声音控制技术在日常生活中的应用。
以一种基于语音信号处理芯片RSC4128开发的语音识别声控车模系统,重点介绍了声控车模的语音识别、信号发射、信号接收和信号处理等部分的结构功能以及应用特定人语音识别技术,通过构建合理的系统结构、运用自然的语音提示实现了可靠的声控车模系统的过程、展现了语音识别技术在智能玩具领域的广阔应用发展前景。
关键词:
声音控制技术;车模;声音识别;电机控制
1引言
随着社会的不断发展和多媒体通信以及声音转换技术的深入发展,声音控制技术已经得到广泛的关注。
声音控制技术经过长期快速发展,已经投入到实际应用中。
声音控制技术原理就是利用声波传到某物体表面时,使该物质材料带电,从而让声波发生变化,从而制成声敏传感器,再配上语音识别系统及一些控制装置,就形成了一套完整的声控系统。
声音控制技术是集声音识别技术、声音采集转换技术和声音检测技术与一体的现代化控制技术。
2声音控制技术的概述
所谓声控技术[1]就是利用语音识别技术来达到控制或者操作电气设备,而语音识别技术在近几年来已经有很大的进步,最新的语音识别技术可以辨别92%以上的人发音,但是这并不表示用户和声控电气设备之间能够进行类似人和人之间的自然交谈,事实上使用者还必须遵循几个特定的指令才能让电气设备明白自己的意图。
发展语音系统的高科技公司正在努力开发与人类“交谈”的软件,然而这些研发在短期内不会有重要的结果要公布。
目前电气设备中的声控技术主要是针对语音识别、转换这些环节。
1.1声音控制技术的特点
利用声学方法检测产品性能和监控生产过程是一门发展中的新技术[2]。
与光波或电磁波等形式的控制器相比,声音控制技术具有一些明显的优点:
(1)这种方式不产生电磁辐射,不会干扰附近的电气设备;
(2)不易受污物和灰尘的影响;
(3)超声射束看不见、听不到、易于形成良好的指向性,阻断声束的任何物体都会被记录下来,甚至光束对其不起作用的透明物体也可被测出来;
(4)声波可以在气体、液体、固体中传播,设计不同结构的声传感器能满足高温高压、密封防爆等特殊要求。
因此,声控技术在许多工业领域中受到了欢迎,在70年代,许多外国企业就开发了测量物位和流量的仪器及声控开关,到80年代,随着微型计算机特别是单片机技术的发展,声控技术进一步向高精度、数字化和智能化方向迅速发展。
1.2声控技术的发展历程
声控技术是随着计算机技术的广泛使用而出现的。
这种崭露头角的现代新型控制技术,给严重伤残病人的生活带来极大方便。
伤残病人用声音就可以方便的使用门窗、窗帘、电视机、电灯之类的生活用品。
在其他领域里,声控技术也有很大的用武之地。
例如:
在飞行或空战时,万一飞行员负伤,他可以靠发声来驾驶飞机[3]。
声音识别器将飞行员发出的声音与存储的声音相比较,只要声音一致,飞机就能自动地完成一系列动作,从而达到控制飞机的目的。
日常生活是一个充满声音的世界,每天你都会听到各种各样的声音,声音是无处不在,无时不在的。
然而,声音除了丰富我们的生活外,它还有很多用处。
早在我国古代就已经有关于声音运用的记载。
两千多年以前,《墨子》一书中曾这样记载:
做一个小口大肚的瓶子,一半埋在地下,瓶口露在地面上,让听觉好的人在瓶口听,这样就可以知道对方挖的地道到了哪里,然后凿开地面去消灭对方。
随着现代科学技术的飞速发展,人们对声音的认识并加以应用就更加广泛和新颖。
声纳技术就是利用超声波在水中的传播和反射来进行导航和测距的技术或设备。
人耳能够听到的声音的频率在20——20000赫兹之间。
通常把频率高于20000赫兹的声波叫做超声波,频率低于20赫兹的声波叫做次声波。
超声波和次声波[4]都是人耳无法听到的。
超声波具有方向性强,能够沿直线传播和反射的特性,根据这种特性制成声纳,在多个领域有着很大的用途。
今天,科学家还研究出了一种能“听”话的计算机,只要对着计算机说出指定的密语,计算机就会自动地按之前设定的程序开始工作。
声纹是什么呢?
狭义地说,声纹是对声音进行频率分析,整理成的频谱图。
广义地说,声纹是从各个角度分析声音的特征并进而汇集成的数据。
人之所以能够发出声音,靠的是喉咙里两片由弹性肌肉组成的声带的振动。
声带平时很松弛,两小片肌肉分隔也相当远,所以气流通过声带时不会发出声音。
在说话的时候,两片声带靠得很近,拉得很紧,气流把声带冲开,由于声带有弹性,很快又缩回去。
这种冲开缩回的连续振动,便发出了声音。
由于每个人在声带振动时所发出的声音的音调、响度和音色都不同,所以每个人的声音都是能够被辨认出来。
因为声纹表现出人独特的个性,所以声纹是无法仿制的。
目前,在一些发达国家,声纹已被作为刑事判决中的证据使用,它比指纹更加准确。
声纹还可以用来判断身高,其精确度可以在5厘米以内。
声纹也可以用来测试一个人的身体健康状况。
1.3声音控制技术发展趋势
现今,声音控制技术已经迈向技术成熟的阶段,声音控制技术也广泛应用于日常生活的各行各业。
例如,利用声音控制技术制造的声控开关、声纳探伤、声光控制路灯、声控遥控小车等等。
目前,声音控制技术发展主要有两个趋势:
其一是朝着体积小、速度快、功能强、价格低的微小型方向发展;其二是朝着高精度、智能化、数字化、网络化、多功能方向发展[5]。
1.3.1体积小、速度快、功能强、价格低
声音控制技术的控制芯片正向大规模、超大规模集成芯片发展,而声音控制芯片的体积却发展的越来越小;处理声音的速度也比早期的控制装置扩大许多倍;在功能上,声音控制技术可以和光控制技术结合,完成单一声音控制技术无法完成的任务;声音控制技术已经广泛应用于日常生活,因此,在价格上声音控制技术的控制装置也越来越低。
1.3.2高精度、智能化、数字化、网络化、多功能
(1)智能化智能传感器是自动控制系统的智能仪表发展的必然结果,智能传感器更方便和有利于传感器在总线测控系统或网络中使用。
(2)网络化网络化和加强通信能力是声音控制系统的一个重要发展趋势。
声控系统构成的网络将有多个声控装置、多个I/O模块相连,并可与IPC(工业计算机)、EPC(嵌入式计算机)、以太网等相连构成整个工厂的自动控制系统。
现场总线技术(如PROFIBUS)在工业控制中将会得到越来越广泛地应用。
(3)多功能化为了适应各种特殊功能的需要,各个公司陆续推出了多种智能模块。
智能模块是以微处理器为基础的功能部件。
它的CPU和单片机的CPU并行工作,占用主机的CPU时间很少,有利于提高声控装置的扫描速度和完成特殊的控制要求。
(4)数字化传感器与信号调理电路结合,实现数字化信号输出,便于与网络接口。
(5)高可靠性一些特定的环境和条件要求声控系统要有很高的可靠性,因而自诊断技术、冗余技术、容错技术在声控技术中都已得到厂泛的应用。
良好的兼容性,声音控制产品的优劣除了要看它内在技术优劣外,还需考察它满足国际标准化的程度和水平。
标准化一方面保证了产品出厂质量,另一方面也保证了各厂家产品的相互兼容性。
2声控技术的应用
在军事上,海军利用声纳探测器来监视敌方的潜艇,侦察海底的暗礁。
现代声纳系统还能把声波变成电讯号,使水下物体的形状显示在电子荧光屏上,变成可以看得见的图像。
在工业领域中,超声波设备是用来进行产品质量检测的重要工具,它还可以用来对物体进行清洗、加工和消毒,也可用来对物体进行探伤和钻孔。
在医药上,有各种各样的超声波诊断器和医疗设备(B超),它们是必不可少的医疗工具。
现在,声控技术已经覆盖了人们生活的各个领域。
比如,在保险箱的门上装上由声音控制的锁,只有它的主人对它说出预定的“密语”,门才能自动地打开;有些豪华住宅的大门上也装上了这种特殊的声控锁,当主人的汽车开到门前,按响喇叭时,大门便慢慢打开,这喇叭与门锁是配套的,其他人的汽车喇叭是打不开这道门。
声音控制技术还应用于声控走廊灯、声控鼠标、声控音乐喷泉以及各种声控电机驱动的设备或者装置。
本文就以声控车模系统为例,它是利用Sensory公司第四代语音信号处理芯片RSC4128开发出语音识别声控车模系统。
应用语音识别芯片作为系统核心的汽车模型是种新颖的声控汽车玩具产品。
将语音识别芯片做在遥控器内,可通过语音命令控制车模的所用动作,比如前进、后退、左转、右转等,同时保留原有的手控操纵方式,为车模玩家提供更多的选择与增添了更多的乐趣。
2.1声控车模系统的构成
声控车模系统主要分为遥控模块和接收模块两大部分[6]。
遥控模块部分包括:
(1)语音识别:
首先使用者将各种控制命令(如前进、后退、左转、右转等)通过麦克风输入遥控器内部的RSC4128,并存储在数据存储器内。
当使用者对着遥控器说出控制命令时,RSC4128对输入的声音进行识别。
(2)遥控发射:
当RSC4128判断使用者说出的语音命令是合法的,则利用无线发射模块将小车的方向和速度数据编码传输给接收模块。
图1声控车模系统的结构框图
接收模块部分包括:
(1)信号接收:
接收发射端送来的方向和速度数据。
(2)电机驱动:
当接收部分收到方向或速度数据时,单片机对模型中的电动机进行控制,实现对直流电机的方向和速度控制,以及对步进电机的左右旋转角度控制。
2.2遥控模块的设计
2.2.1语音识别部分的设计
本次设计采用Sensory公司的语音信号处理芯片RSC4128作为主芯片,RSC4128是以8位单片机为核心的CMOS器件,具有128KB存储容量的内部ROM,片上上还集成了RAM、A/D、D/A、前端放大器及功率放大器等元件[7]。
只需加上很少的外部元件,就可以组成一个完整的语音识别系统。
声控车模语音识别模块硬件原理框图如图2所示。
RSC4128是语音识别模块的主要芯片,具有很高的语音识别能力,语音信号从麦克风输入,经过放大、滤波后输入到RSC4128,先将信号进行A/D变换,再由RSC4128将此信号的数据存入RAM区内的某个特定区域,将此未知信号与RAM区内各模板逐一比较,若符合其中一个模块,则输出相应的特征信号。
该模块的作用是将识别的结果以电平形式反映在RSC4128的I/O口上,便于控制电路中的单片机对识别结果检测,并执行相应的控制操作。
硬件特征:
(1)程序及提示音等数据共占有64KB存储空间,即39LV020的00000H——0FFFFH,所以39LV020的A16、A17两根地址线应接地;
(2)将语言模板数据存储在SST28VF020中;(3)P0.2口用于选择识别结果以电平或脉冲形式反映在RSC4128的I/0口上,电路需要电平形式,所以P0.2悬空[8]。
图2语音识别声控车模硬件原理框图
2.2.2遥控发射端的设计
采用89C51单片机对识别结果的电平信号进行检测,识别模块能识别32条指令,所以RSC4128用8个I/0口或电平形式输出识别结果,接到单片机的P1.0—P1.3口上,单片机4个I/O口以10KB电阻接地,程序以位操作形式对识别信号进行检测[9]。
当检测到某一语音指令对应的编码信号后,控制P0、P2输出相应的电平,利用无线通讯模块TX-2B/RX-2B实现单片机的串行通信。
如说口令“左转”,RSC4128的I/0口上的编码为10101101,当单片机检测到此编码信号后,对应地在P1.0口输出一个高电平脉冲信号,经TX-2B发射后被车模上的接收装置接收,实现了对步进电机的控制,从而让车模向左转。
TX-2B/RX-2B是士兰公司生产的配对使用的红外线发射和接收芯片,是专用于玩具小车的成对遥控芯片,采用CMOS工艺制造,功耗小,工作电压1.5-5V。
TX-2B/RX-2B内部含有编码电路和解码电路,无需在后续的电路中对接收到的信号进行软件编程解码,因此硬件电路简单。
红外发射电路如图3所示,TX-2B中的1、4、5、14引脚分别为右转(RIGHT)、后退(BAKWORD)、前进(FORWORD)、左转(LEFT)控制端,接收来自89C51的P1.0-P1.3发送的信号。
图3红外遥控发射电路
2.3接收模块的设计
2.3.1信号接收部分的设计
接收控制端接收到数据后,按照预先约定的数据格式进行电机类型和电机运转方向数据的处理,以实现遥控车模的速度和方向的控制。
红外接收电路如图4所示,RX-2B包括内置放大器、运算器及锁存器等。
外接250KB电阻形成RC振荡器,与发射电路的频率匹配。
RX-2B接收信号后,经解码后将右转、左传、后退、前进的控制信号由对应的引脚6、7、10、11输出,传送给电机驱动电路,控制小车产生相应的动作。
图4红外信号接收电路
2.3.2电机驱动部分的设计
(1)直流电机正反转和调速控制
电机驱动电路采用4个中功率三极管组成H型直流电机驱动电路[10-11],通过与门74LS08和反相器4069组成直流电机的正反转控制和调速。
P2.6通过高低电平控制电机的正反转,P2.5的PWM脉冲控制直流电机的转速。
当P2.6输出高电平时,U1A工作,可将PWM脉冲输出,则Q3和Q4导通,同时P2.6的高电平经U2A反相,使U1B输入端为低电平,U1B不工作,使Q1和Q2截止,从而使接在J1插座的直流电机正转,小车前进。
反之,如果P2.6输入一个低电平,则Q1和Q2导通,Q3和Q4截止,电机反转,小车后退。
同时,如果改变PWM脉冲的占空比,则可以调节电机的转速,实现遥控小车模型的速度控制。
直流电机的正反转和调速控制电路如图5所示。
图5直流电机的正反转和调速控制电路
(2)步进电机的控制
电机驱动部分采用四相步进电机,其驱动电路如图6所示。
步进电机的驱动电路根据控制信号工作,控制信号由单片机产生。
这些步进电机采用单四拍换相顺序,利用相应的I/O口输出低电平使相应的三极管导通即可使某一相通电,实现步进电机的转动控制。
四相反应式步进电机有A、B、C、D四根控制线,分别控制步进电机的四相。
四相反应式步进电机单四拍工作方式就是在转动一个齿距时换相四次。
步进电机的各相绕组分别以A、B、C、D表示时,各种工作方式的换相方式为,单四拍:
A→B→C→D→A。
图6步进电机驱动电路
2.4声音控制系统中的关键技术
声音控制系统中关键技术就是信号的频率控制、延时控制、灵敏度控制,可通过调节信号接收部分的外接电阻R来改变频率的范围,从而可以控制整个系统的输出特性;通过控制信号延时特性可以改变整个系统的输出响应;通过对信号灵敏度的控制,可以做到语音识别电路随声变化的效果。
3结束语
虽然声音控制技术的发展已经取得了一定的成就,但在有些情况下,对于实际工程或一些特殊条件下的声音控制,并不容易得到准确可靠的控制效果,这就需要我们非常熟悉各种控制方法的原理及其特点,结合被控对象和工作环境要求,选择适当的控制方法。
上述设计应用基于专用语音处理芯片RSC4128的特定人语音识别技术,通过构建合理的系统结构、设计完善的硬件电路以及借助丰富的指令功能实现了语音识别声控车模遥控端和接收端的设计,并充分考虑到麦克风的放置,连线的长短、屏蔽,产品的安放设计等因素对语音输入信号的影响,使系统的识别率达到75%以上。
系统的柔性使得其可以运用到诸如语音码锁、语音控制器、个人数字助理、家电遥控、语音电话等许多产品中。
然而,我们还要不断探索新的声音控制技术,改进原有技术,以满足各种条件下的声控要求。
声音控制技术已经广泛用于日常生活和工业生产中,它通用性强、使用方便、适应面广、抗干扰能力强、可靠性高、功能强、价格低等优点已获得广泛认可。
因此,声音控制产品在自动控制领域将会得到进一步发展,也将具有广阔的发展前景。
参考文献:
[1]望月,《手机声控功能的认识》,江苏电脑报,第D03版-数字通信,2001年09月03日
[2]张同根,《声控技术及其应用》,北京,中国科学院声学所,电气应用,1993
(1)
[3]XX百科,《声控技术》,
[4]陈智超,《声音的妙用》,2005,7,[DOI]CNKI:
SUN:
CZSJ.0.
[5]XX文库,《PLC发展趋势》,
[6]卢艳,黄云龙,《一种声控车模系统的设计》,机电工程,2010,27(7):
40-42
[7]李瑞峰,李麟,《基于RSC4128的家用机器人语音人机交互系统的设计》,制造业自动化,2007,29(10):
30-33
[8]吴智量,陈智昌,陈烘华,《语音识别控制在音频、视频系统中的应用》,微计算机信息,2004,20(7):
113-114
[9]徐理英,《基于语音辨识的遥控小车的设计》微计算机信息,2009,25(4):
126-127,253
[10]屈利娟,《基于语音识别的无刷直流电机控制系统》,机电工程,2007,24(5):
86-88
[11]Xixiaojing,Linkunhui,Zhouchangle,Keytechnologyresearchforspeechrecognition,ComputerEngineeringandApplications,2006,42(11):
66-69,115
VoiceControlTechnologyanditsApplication
JiPengpeng20072340941
CollegeofBinjiang,NanjingUniversityofInformationScience&Technology,Nanjing,210044
ABSTRACT
Aboutthevoicecontroltechnology,developmentprocessanddevelopmenttrendandthevoicecontroltechniquesindailylifeoftheapplication.Aspeechrecognitionvoicemodelcarssystembasedonspeechrecognitiontechnologyofpaperwhichfocusesonthewaytoachievespeechrecognition,signaling,receivingandsignalsprocessingwhichisreliable.Itshowsthedevelopmentofsmarttoysinthebroadfieldofthespeechrecognitiontechnology.
Keywords:
Voicecontroltechnology,Modelcars,Voicerecognition,Motorcontrol
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 声控 技术 及其 应用
![提示](https://static.bdocx.com/images/bang_tan.gif)