嵌入音频在电视播出系统中的原理及应用.docx
- 文档编号:27634124
- 上传时间:2023-07-03
- 格式:DOCX
- 页数:8
- 大小:130.07KB
嵌入音频在电视播出系统中的原理及应用.docx
《嵌入音频在电视播出系统中的原理及应用.docx》由会员分享,可在线阅读,更多相关《嵌入音频在电视播出系统中的原理及应用.docx(8页珍藏版)》请在冰豆网上搜索。
嵌入音频在电视播出系统中的原理及应用
嵌入音频在电视播出系统中的原理及应用
随着数字电视技术的发展,数字播控中心也成为各电视台建设的重点,这也是从模拟向数字化过渡的特殊时期,不可能从采编到播出全部实现数字化,特别是音频系统,从模拟音频到数字音频,再到数字音频的嵌入,这是一个非常繁琐的过程,下面从实际到理论就这个过程作一下介绍。
一.音频嵌入技术在电视播出系统中的应用
对于视频、伴音分离的系统,在电视信号模数转换和传输的过程中,视频和音频不同的处理方式和特点,导致视频滞后于音频,图像和声音不协调和谐的问题也显得比较明显。
在电视节目播送中,视频信号制约于相应的音频信号,达到互相同步,或利用数字视频信号对数字音频信号加以携带,形成一个有机统一的整体(音频嵌入技术),同时又能安全的解出,以使观众得到声画同步的完美的电视图像,是我们在数字电视播出系统设计中,极为关心的问题。
以我们部门为例,简单解释一下音频信号的流程:
将模拟音频转换为AES/EBU数字音频,AES/EBU数字音频通过板卡嵌入到SDI数字视频当中,为了能够调节输出伴音,又将带嵌入音频的SDI信号分解成SDI视频和AES/EBU数字音频,再将AES/EBU数字音频通过一个D/A转换成模拟音频进行音量调整,然后经A/D转换成AES/EBU数字音频,再嵌入到SDI视频中输出,这是目前音频嵌入式播出系统的普遍模式。
音频嵌入式电视播出系统,相对于音视频分离模式的系统,有着很多优点。
一般来说,音频嵌入模式适合于较大型系统中的各种切换,达到灵活轻便。
切换中的音视频的协调统一,是靠程序控制中央处理器的统一指令完成的,而中央处理器的程序设计很容易实现,运作简单、实用、可靠。
对于小型系统,音频嵌入也有一定的使用价值,当然要看设备系统的性能价格比和需要而确定。
二.数字音频信号
1.AES/EBU数字音频
1992年,美国音频工程师协会(AES)和欧洲广播联盟(EBU)共同制定了数字音频的接口标准,即AES/EBU数字音频格式。
在这个基础上,国际电信联盟将其归纳为ITU-RBS647-2号建议书《广播演播室数字音频信号的接口》。
AES/EBU的构成:
由两个信号通道组成。
这两个声道可作为立体声的左、右声道,可作为独立的声道,可将两声道传输同样的声音,把一个AES/EBU信号作为单声道使用。
在视频领域,我们对视频的取样为8比特或10比特,而对于音频来讲,10比特是远远不够的,它不能满足声音的动态范围及信躁比的要求。
因此对于音频的取样为16-24比特。
每一个取样组成一个32位的副帧,前4位为通道状态识别位,指示后面的音频数据是哪一个通道的音频数据,其后4位的辅助数据(可以用它扩展AES/EBU为24比特)然后是20位的音频取样数据,音频取样数据之后是一位音频取样有效位,用来指明音频取样的比特位数是否有效。
在其之后用户比特位用于携带其它信息,例如:
时码。
第31位为音频通道状态位,它可以携带与信号有关的重要信息:
例如取样频率、声道类型、辅助比特的应用方式等,最后一位CRC奇偶效正位,用于对总的数据通道数据状态进行误码检测。
2.AES/EBU数据结构(如图2):
由192个副帧进一步组成一个数据帧,每一个数据帧的起始点由第一副帧的前4位的状态位来表述,即前置位表述为“Z”。
而其他副帧前置位表述为代表通道状态的“X”或“Y”.
3.AES/EBU数字音频的优点:
AES/EBU数字音频信躁比高,传输质量好。
是独立的音频通道,便于做音频处理(调音处理)对于75欧的AES/EBU数字音频系统,可用原有模拟视频系统替代。
三.嵌入数字音频
在电视领域,音频信号出现“唇音”是我们非常关注的问题。
所谓的“唇音”指的是由于视频信号和音频信号传输路径不同,因此信号的延时也不同,这样就造成了声音和图像出现延时差。
在分离的视、音系统中需要一些音频延时器予以克服。
而在数字视频SDI的传输的同时,我们可以利用SDI信号的辅助数据区,把数字音频信号嵌入到SDI信号中一起传输,从根本上消除了的除了“唇音”问题。
这也就是传输音频信号的第3种格式—嵌入音频格式。
1.嵌入数字音频的位置
在模拟视频中存在着行、场消隐期。
在行、场消隐期内并不存在着有效图象信号。
对于数字视频信号,也对应存在这样一个时间区间,这个区间被称为行、场的辅助数据区。
行辅助数据区由SMPTE(活动图像和电视工程师协会)定义为“HANC”(HorizontalAnicillaryDate),场辅助数据区由EBU定义为“VANC”(VerticalAnicillary)。
我们清楚地知道,分量数字视频格式的有效行中,625/50制共有1728个取样字(525/60制为1716个取样字),其中对Y、Cb和Cr取样有1440个取样字(0~1439)。
而对行消隐期间的取样可安排288个取样字(525/60制为276个取样字)。
数据传送中,每行的消隐期间的数据是相同的,对于数字化来说就是所谓的“冗余”部分,在标准中用“SAV”和“EAV”予以界定并作为接收端恢复的标志,就不再需要传送同步和色同步信息了。
那么在“EAV”和“SAV”之间就可用来放置288个字(525/60制为276个),作为辅助数据(包括“EAV”和“SAV”的8个字)。
因此,模拟视频中的行消隐期间,在数字视频中被称为行辅助数据区“HANC”(HorizontalAnicillaryData)。
同样,模拟视频中的场消隐期间,在数字视频中被称为场或帧辅助数据区,由EBU定义为“VANC”(VerticalAnicillaryData)。
我国广播电影电视行业标准GY/T160-2000《数字分量演播室接口中的附属数据信号格式》,是等效采用ITU-RBT1364建议书标准,规定了数字分量演播室应用的嵌入到视频数据信号中的辅助数据格式(图3)。
根据SMPTE291M标准定义的辅助数据包和空间的格式:
(1)在每个数据包的最前面,有一个包头(ADF)。
对于分量系统是由3个字组成,它们为:
000H、3FFH、3FFH。
(2)其次是表明辅助数据之内容的数据识别码ID(DID),用于组织嵌入音频所使用的数据包。
(3)在数据识别码之后是数据包号码(DBN),接收设备可根据包号码的连续性来判别是否丢失数据。
(4)数据包号码之后1个字称之为数据计数字(DC),用来表明包中数据总和。
(5)在数据计数字之后就是数据区,有255个字。
(6)最后是数据效验位(Checksum)。
分量视频数据信号的辅助数据区,可用来传输数字音频等辅助数据信号。
辅助数据信号以数据包的形式运载,每个包都带有自身的包头标识,在辅助数据区内,不可随意放置。
依据标准规定,插入在数字视频的串行数据流中,可以同时发送多达16个通道,(8个AES/EBU数据流通道)20或24比特的声音信号。
但必须紧接在EAV后面,不能有一个码字的空隙。
误码检测信号EDH(SMPTERP165定义)被放置在行辅助数据区的第5或315行(625/50制),但必须紧邻在“SAV”前面,同样不能有一个码字的空隙。
行辅助数据区的剩余部分,可安排其它数据使用。
数字音频插入的规则:
(1)第5、318行用于插入EDH的数据。
(2)第6、319行不插入任何数据,专门用于SDI的切换区。
(3)第7、320行空一行,不插入音频数据。
第8、321行用于插入音频控制数据:
该音频控制包包含以下信息:
音频的帧数、取样的频率、有效通道和视、音的相对延时,对于48KHZ的工作方式下,音频控制数据包的是可选择的,而对于其它频率,必须传送音频控制数据。
在广播电视系统中,数字音频的取样频率通常采用48KHz(其它取样频率有32KHz和44.1KHz),在每秒25帧的扫描系统中,一个视频帧的音频样值数为48000/25=1920,即一个视频帧内有整数个音频样值,这时音频的取样频率能和视频时钟保持同步,可称为同步音频。
在数字音频中,通常将由同一AES/EBU音频源中得到的两个音频通道称为一个通道对,由两个通道对组成一个音频组。
这样,一个音频组可以有4个音频通道。
音频组的编号为1至4,通道编号为1至16。
通道1至4为第1组,通道5至8为第2组,依次类推。
2.嵌入音频
目前辅助数据最大的用途是放置音频,然而被放置的音频称为嵌入音频。
采用音频嵌入方案的电视系统,最大的好处是解决了电视信号在传输中的声画同步、协调的问题。
由于嵌入音频后的视频信号可用一根电缆同时传送音视信号,还简化了设备系统。
被嵌入的音频信号是以块(或称段)为单位,打包传送的。
一个块由192个连续帧组成,每个帧包含有相关的两个子帧,每个子帧(32比特)表示一个音频通道,放置一个音频取样字,因此一个数字音频码流可以作为立体声、双声道模式使用。
每个子帧定义为32比特,其中前置码占有4比特,音频数据为24比特,在数据位后的4比特,分别是有效标志位V(Validity),用户数据位U(UserData),通道状态位C(ChannelStatusData)和子帧的奇偶校验位P(Parity)。
帧的传输速率与源取样频率要严格对应。
如果音频取样频率为48KHz,一帧的取样时间为20.83μs,每一子帧的取样时间就是10.415μs。
帧传输速率与源取样频率要严格对应。
嵌入音频实质上是采用时分复用的方式,将数字音频数据作为附属数据与数字视频数据合为一路数据信号。
嵌入音频放置在行辅助数据区内(HANC),按照SMPTE272M标准的规定,在行辅助数据区内最多可嵌入16个通道的音频数据,16个通道划分为4组,每组含有4个(即两对)音频通道。
为此需要使用两种用来传送AES/EBU音频信息的附属数据包,即音频数据包和音频控制包。
这两种音频包均应符合下表所示的附属数据包的格式,它们之间的差别仅在于用户数据部分和相关的标识符。
音频数据包中携带有数字音频的样值数据,按照标准规定,它放置在CB/CR色差信号并行数据流的行附属数据区内。
音频控制包中所含数据则用于音频数据流的解码处理,每场仅传送一次。
有关音频数据的嵌入过程和这两种音频包的具体结构,下面分别予以介绍。
音频数据包
图4表示了音频数据的嵌入过程。
为简明计,这里只画出了一个通道对(AES/EBU1为第一通道对,AES/EBU2为第二个通道对)中一个通道的嵌入示意,通道对3、4的嵌入完全相同。
音频控制包
音频控制包的作用是为接收端提供必要的解码信息,如音频通道对的取样频率和同步/异步指示、通道的有效性指示以及通道对音频/视频时延等。
它的结构如图5所示。
音频控制包位于场消隐切换点之后的第二个行辅助数据区内,即位于奇数的第8行和偶数场的第321行。
每场传送一次,音频控制包中含有音频帧序号、取样频率和各通道音频/视频间的相对时延等信息,对于48KHz同步运行模式,音频控制包的传送是可选的,但对其他运行模式,则是必需的。
五.总结及展望
纵观当今科学技术的发展,速度之快、变化之大都是前所未有的。
高新技术的发展也同样地冲击着广播电视领域,我们广播电视工作者对其在引进、开发和应用方面,进行了积极的探索和实践,取得了扎实的成果,并在许多方面都获得成功应用的经验。
高新技术的进步给广播电视带来了严峻的挑战和激烈的竞争,同时又提供了巨大的发展机遇。
我们相信在新的世纪里,电视高新技术必将更广泛、更迅速地发展和普及,其中数字化进程会进一步加快,全面贯彻于电视节目的制作、播出、传输和储存的各个环节,直至千家万户。
根据科学进步的规律,嵌入音频的应用就更为重要。
从电视节目的制作、播出、微波和光缆传输,卫星节目传送和数字电视广播等,都要有音频嵌入技术的结合,并已逐步地以行业标准的形式予以确认。
例如我国参考ITU-RBT1365建议书制定了GY/T162-200《HDTV串行接口中作为附属数据信号的24比特数字音频格式》,就是确定音频嵌入技术应用的标准。
音频嵌入技术将成为电视发展,网络化普及的基础技术之一。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 嵌入 音频 电视 播出 系统 中的 原理 应用