音频指标名称类型范围精度描述PESQScorefornarrow.docx
- 文档编号:23998933
- 上传时间:2023-05-23
- 格式:DOCX
- 页数:48
- 大小:22.89KB
音频指标名称类型范围精度描述PESQScorefornarrow.docx
《音频指标名称类型范围精度描述PESQScorefornarrow.docx》由会员分享,可在线阅读,更多相关《音频指标名称类型范围精度描述PESQScorefornarrow.docx(48页珍藏版)》请在冰豆网上搜索。
音频指标名称类型范围精度描述PESQScorefornarrow
1.1.1音频
指标名称
类型
范围
精度
描述
PESQScorefornarrow-bandsignalsaccordingtoP.862(PESQScore)PESQ分数据P.862窄带信号(PESQ分数)。
OverallPESQScore(P862)总体PESQ(P862)。
-
-0.5–4.5
ThePESQScoreaccordingtoP.862根据P.862的PESQ得分
mfPESQScoreP862配乐?
SpeechPESQScore(P862)语音PESQ(P862)。
-
-0.5–4.5
PESQScoreduringactivespeechperiods在活跃的时期PESQ讲话
mfPESQScoreP862Speech配乐?
MOSfornarrow-bandsignalsaccordingtoP.862.1(MOS-LQO)窄带根据P.862.1(MOS-LQO信号)。
OverallMOS-LQO(P.862.1)总体MOS-LQO(P.862.1)。
MOSLQO
1.02–4.56
PESQscoremappedtoMOSLQOaccordingtoP.862.1PESQ映射到MOSLQO根据P.862.1representingtheoverallquality
代表综合素质的提高
mfMOSLQO_P862_1
SpeechMOS-LQO(P.862.1)
语音MOS-LQO(P.862.1)。
MOSLQO
1.02–4.56
PESQscoremappedtoMOS-LQOaccordingtoP.862.1
PESQ映射到MOS-LQO依据P.862.1
representingthequalityofspeechpartsonly
仅代表语音质量的部分
mfMOSLQO_P862_1Speech
PauseMOS-LQO(P.862.1)
暂停
MOSLQO
1.02–4.56
PESQscoremappedtoMOSLQOaccordingtoP.862.1
PESQ映射到MOSLQO依据P.862.1
representingthequalityofspeechpausesonly代表语音停下质量
mfMOSLQO_P862_1Noise
MOSforwide-bandsignalsaccordingtoP.862.2(MOS-LQO)对宽带信号根据P.862.2(MOS-LQO)。
OverallMOS-LQO(P.862.2)总体MOS-LQO(P.862.2)。
MOSLQO
1.04–4.64
PESQscoremappedtoMOSLQOaccordingtoP.862.2representingtheoverallqualityPESQ映射到MOS¬LQO依据P.862.2
代表综合质量
mfMOSLQO_P862_2
SpeechMOS-LQO(P.862.2)语音MOS-LQO(P.862.2)。
MOSLQO
1.04–4.64
PESQscoremappedtoMOS-LQOaccordingtoP.862.2representingthequalityofspeechpartsonly
PESQ映射到MOS-LQO依据P.862.2
仅代表语音质量的部分
mfMOSLQO_P862_2Speech
TransmissionDistortionsandDelay传输失真和延迟
MinimumTransmissionDelay最小的传送延迟
ms
|λ|<∞
Shortestoccurringdelaybetweenreferenceandtestsignal.idealvalue<300ms最短的发生时间耽搁在参考和测试signal之间.理想值<300ms
mfMinDelay最小耽搁或推迟
MaximumTransmissionDelay最大的传输延迟
ms
|λ|<∞
Largestoccurringdelaybetweenreferenceandtestsignal.idealvalue<300ms最长的发生时间耽搁在参考和测试signal之间.理想值<300ms
mfMaxDelay最大耽搁或推迟
AverageTransmissionDelay平均传输延迟
ms
|λ|<∞
Averagedelaybetweenreferenceandtestsignal.idealvalue<300ms平均耽搁在参考和测试signal之间.理想值<300ms
mfAvgDelay平均耽搁或推迟
NumberofDropOuts数量的下降
int
0-∞
Numberofdropoutsinthesignal.在信号中数量的下降
Dropoutscanbecausedbypacketlosseswhenthereisnoerror/packetlossconcealmentmethodemployedinthedecoder.idealvalueis0下降可能是因为数据包遗失当没有错误时/数据包遗失的隐蔽的方法用于解码.理想值是0
iNrDropOut终止
AttenuationofTestSignal测试信号衰减
dB
[-100;100]dB
Leveldifferencebetweenreferenceandtestsignalidealvaluebetween[0;10]dBtypicalvaluebetween[-6;17]dB水平不同参考和测试信号之间的理想值为[0;10]dB典型的值[-6;17]dB
mfAttenuation衰减
InformationontheReferenceSignal在参考信号中的信息
LevelofReferenceSignal
参考信号的水平
dBov
[–100;0]dBov
Levelofthereferencesignalidealvalueis-26dBovtypicalrange[-35;-17]dBov(avg.-30dBov)参考信号水平的理想值是-26dBov典型的范围[-35;-17]dBov(avg.-30dBov)
mfLevelReference水平的参考
LevelofReferenceSignalduringSpeechBursts在语音爆发中参考信号水平
dBov
[–100;0]dBov
Levelofthespeechpartstypicalrange[-33;-15]dBov(avg.-27dBov)部分语音典型的范围[-33;-15]dBov(avg.-27dBov)
mfLevelSpeechReference语音水平的参考
LevelofReferenceSignalduringSpeechPauses在语音停顿中的参考信号水平
dBov
[–100;0]dBov
Levelofsilentintervals(backgroundnoiselevel)inthereferencesignaltypicalrange[-80;-37]dBov(avg.-58dBov)无声的间隔水平(背景噪声水平)在参考信号典型的范围[-80;-37]dBov(avg.-58dBov)
mfLevelSilentReference无声参考水平
NumberofLevelClippinginReferenceSignal在参考信号中的剪辑水平
int
0-∞
Numberoflevelclippingsinreferencesignalidealvalueis0在参考信号中的剪辑水平理想值是0
iNrClippingRef剪辑参考
NumberofUtterancesinReferenceSignal在参考信号中话语数
int
0-∞
Numberutterancesfoundinthereferencesignalidealvaluebetween[2;4]在参考信号中话语数理想值在[2;4]之间,
iNrUtterances表达,说话
ReferenceSignalLength参考信号长度
s
4–∞s
Signallengthofreferencesignalidealvaluebetween[6;20]s参考信号的信号长度理想值[6;20]s之间
mfLengthRef参考长度
ActiveSpeechlengthinReferenceSignal活跃的语音长度在参考信号中
s
0–∞s
Totalactivespeechlengthofreferencesignalidealvaluebetween[2;6]s总的活跃语音长度在参考信号中理想值是[2;6]s
mfActiveSpeechRef活跃的语音参考
SpeechActivityinReferenceSignal在参考信号中的语音活跃
100%
0-100%
Speechactivityinthereferencesignalcomparedtosignallengthidealvaluebetween[40;80]%语音活跃与信号长度之比的理想值[40;80]%
mfSpeechActivityRef语音活跃参考
InformationontheDegradedSignal在削减信号中的信息
LevelofTestSignal测试信号的水平
dBov
[–100;0]dBov
Levelofthetestsignalidealvalueis-26dBovtypicalrange[-40;-30]dBov(avg.-33dBov)
mfLevelDegraded削减水平
LevelofTestSignalduringSpeechBursts在语音爆发中的测试信号水平
dBov
[–100;0]dBov
Levelofthespeechpartsinthetestsignaltypicalrange[-36;-26]dBov(avg.-31dBov)部分语音水平测试信号的典型值[-36;-26]dBov(avg.-31dBov)
mfLevelSpeechDegraded语音水平削减
LevelofTestSignalduringSpeechPauses水平的测试信号在语音停顿
dBov
[–100;0]dBov
Levelofsilentintervals(backgroundnoiselevel)inthetestsignaltypicalrange[-80;-37]dBov(avg.-60dBov)水平的无声的间隔(背景噪声水平)在测试信号典型的范围[-80;-37]dBov(avg.-60dBov)
mfLevelSilentDegraded语音水平削减
NumberofLevelClippinginTestSignal剪辑水平数在测试信号中
int
0-∞
Numberoflevelclippingsinthetestsignalidealvalueis0剪辑水平数在测试信号中理想值是0
iNrClippingDeg剪辑程度
NumberofUtterancesinTestSignal在测试信号中话语的数量
int
0-∞
Numberutterancesfoundinthetestsignalidealvaluebetween[2;4]话语的数量在测试信号中数量的理想值是0
iNrUtterancesDeg表达程度
TestSignalLength测试信号长度
s
4–∞s
Signallengthoftestsignalidealvaluebetween[6;20]s测试信号的信号长度的理想值是[6;20]s
mfLengthDeg长度程度
ActiveSpeechlengthinTestSignal在测试信号中活跃语音长度
s
0–∞s
Activespeechlengthoftestsignalidealvaluebetween[2;6]s在测试信号中活跃语音长度的理想值[2;6]s
mfActiveSpeechDeg活跃语音程度
SpeechActivityinTestSignal在测试信号中语音活跃度
100%
0-100%
Speechactivityinthetestsignalcomparedtosignallength.idealvaluebetween[40;80]%在测试信号中语音活跃度与信号长度之比的理想值[40;80]%
mfSpeechActivityDeg语音活跃程度
MeasurementReliability测量的可靠性
HighestUtteranceCorrelation
最高的话语的相关性
float
0–1.0
Highestsignalcorrelationbetweencorrespondingutterancesofreferenceandtestsignalidealvalueis>0.9(valuesbelow0.35indicatesthatthesignalsmaybetoodifferenttobealignedtemporally)最高信号相关性的相应参考数和测试信号的理想值>0.9(价值低于0.35表明信号可能不同不能对齐
mfBestUttCorrelation最高的话语的相关性
AverageUtteranceCorrelation平均话语的相关性
float
0–1.0
Averagesignalcorrelationbetweencorrespondingutterancesofreferenceandtestsignalidealvalueis>0.9(valuesbelow0.35indicatesthatthesignalsmaybetoodifferenttobealignedtemporally)平均信号相关性的相应参考数和测试信号的理想值>0.9(价值低于0.35表明信号可能不同不能对齐
mfConfidenceMeasure信心测量
ReliabilityofPESQResultsPESQ可靠的语音结果
-
enumPESQ_RESULT_RELIABILITY
列举
PESQ_RESULT_RELI能力
Resultcodeforreliabilityofthemeasurement
.测量的可靠结果密码
eReliabilityOfResult可靠的结果
CodecDistortions/BackgroundNoise编解码器扭曲/背景噪声
SNR信噪比,
dB
[-100;300]dB
SignaltoNoiseRatiotypicalrange[-7;13]dB信噪比典型的范围[-7;13]dB
mfSnr信噪比,
SNRduringSpeechBursts在语音脉冲中信噪比
dB
[-100;300]dB
SNRduringspeechburststypicalrange[-7;13]dB在语音脉冲中信噪比典型的范围[-7;13]dB
mfSnrSpeech语音信噪比
SNRduringSpeechPauses在语音停顿的信噪比
dB
[-100;300]dB
SNRduringspeechpausestypicalrangeis[-102;-7]dB在语音停顿的信噪比典型的范围[-102;-7]dB
mfSnrSilent信噪比沉默
Qualityvs.Time质量和时间
PESQScorevs.TimePESQ分数与时间
-
-0.5–4.5
BuffercontainingthePESQscoreforeachframe缓冲包含PESQ对每一帧
fpMosOverTime(iMosOverTimeBufferSize)
在Mos延长时间
MOS-LQOvs.TimeMOS-LQO与时间
MOSLQO
1.02–4.64
BuffertoholdthelocalMOSperframemappedbyeitherP.862.1orP.862.2dependingontheinputsignals’audiobandwidth缓冲区来保存地方MOS每帧映射被P.862.1或P.862.2取决于输入信号的音频的带宽
fpMOSLQOOverTime(iMosOverTimeBufferSize)
在MOSLQO延长时间
Levelvs.Time水平与时间
SignalAttenuationvs.Time信号衰减和时间
dB
Attenuationbetweenreferenceandtestsignal参考图和测试信号衰减之间
fpLocalScale(iLocalScaleBufferSize)
局部比例
LevelClippingStartTimes
水平剪裁开始时间
ms
Vectorwiththestarttimeofeachlevelclippingperiodinthereference/testsignal向量与起始时间周期的各个层面剪裁参考/测试信号
ClippingStartRefClippingStartTest
(iNrClippingRef)
剪裁开始参考,剪辑开始测试
LevelClippingStopTimes水平剪裁停止时间
ms
Vectorwiththestoptimeofeachlevelclippingperiodinthereference/testsignal向量与各层次停止时间周期的剪裁参考/测试信号
ClippingStopRefClippingStartTest(iNrClippingRef)
剪裁停止参考,剪辑停止测试
SignalSpectrumvs.Time信号频谱和时间
ReferenceSignalSpectrumvs.Time参考信号频谱和时间
Spectrogramofthereferencesignal(Hzscale)光谱图上的参考信号(赫兹比例)。
ppfSpectrumRef(lNrFramesInSpectrogram,iNrBandsinHz)
光谱参考光谱图
TestSignalSpectrumvs.Time测试信号频谱和时间
Spectrogramofthetestsignal(Hzscale)光谱图上的测试信号(赫兹比例)。
ppfSpectrumDeg(lNrFramesInSpectrogram,iNrBandsinHz)光谱图程度
SignalLoudnessvs.Time信号响度和时间
LoudnessDensityof音量的密度
Spectrogramofthereference图上的参考
(lNrFramesInSpectrogram,多窗口光谱图
ReferenceSignal参考信号
-
signal(Barkscale)信号(吠声比例)。
iNrBandsinBark)信号吠声
ppfLoudnessDensityDeg响度密度程度
LoudnessDensityofTest响度密度的测试
Spectrogramofthedegraded图上的退化
(lNrFramesInSpectrogram,多窗口光谱图
Signal信号
-
signal(Barkscale)信号(吠声比例)。
iNrBandsinBark)信号吠声
LoudnessDensityofNoise
Signal响度密度的噪音
信号,
SpectrogramoftheNoise
Loudness(Barkscale) 图上的噪音
(吠声规模)。
ppfNoiseLoudnessGraph噪声响度曲线图
(lNrFramesInSpectrogram,多窗口光谱图
iNrBandsinBark信号吠声
VADperformanceIndicatorsVAD性能指标。
Front-EndClipping前端剪裁
ms
Vectorwithfront-endclippingtimeforeachutterance向量与时间的前端剪裁的话语
mpfFrontEndClipping(iNrUtterances)
前面最后剪裁
Hang-OverTime延迟时间
ms
Vectorwithhold-overtimeforeachutterancehold-over向量与时间对于每次话语
mpfHoldOverTime(iNrUtterances)
保留时间
TemporalSignalStructure暂时的信号结构
StartofUtterancesinReference/TestSignal在开始话语的参考/测试信号
ms
Vectorwithstart
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 音频 指标 名称 类型 范围 精度 描述 PESQScorefornarrow