Hierarchical Gaussianization for Image Classification图像等级分类.docx
- 文档编号:7915329
- 上传时间:2023-01-27
- 格式:DOCX
- 页数:35
- 大小:767.76KB
Hierarchical Gaussianization for Image Classification图像等级分类.docx
《Hierarchical Gaussianization for Image Classification图像等级分类.docx》由会员分享,可在线阅读,更多相关《Hierarchical Gaussianization for Image Classification图像等级分类.docx(35页珍藏版)》请在冰豆网上搜索。
HierarchicalGaussianizationforImageClassification图像等级分类
图像分类分层高斯化
abstract摘要
Inthispaper,weproposeanewimagerepresentation
tocaptureboththeappearanceandspatialinformationfor
imageclassificationapplications.First,wemodelthefeaturevectors,fromthewholecorpus,fromeachimageand
ateachindividualpatch,inaBayesianhierarchicalframe
workusingmixturesofGaussians..Aftersuchahierarch
icalGaussianization,eachimageisrepresentedbyaGaussianmixturemodel(GMM)foritsappearance,andseveral
Gaussianmapsforitsspatiallayout.Thenweextractthe
appearanceinformationfrowtheGMMparameters,and
thespatialinformationfromglobalandlocalstatisticsover
Gaussianmaps.Finallyweemployasuperviseddimension
reductiontechniquecalledDAP(discriminantattributeproj
ection)toremovenoisedirectionsandtofurtherenhance
thediscriminatingpowerofourrepresentation.Wejustify
thatthetraditionalhistogramrepresentationandthespati
alpyramidwatchingarespecialcasesofourhierarchical
Gaussianization.Wecompareournewrepresentationwith
otherapproachesinsceneclassification,objectrecognition
andfacerecognition,andourperformanceranksamongthe
topinallthreetasks.
在本文中,我们提出了一个新的形象代表捕获的外观和空间信息图像分类应用。
首先,我们模拟的特征向量,从整个语料,从每个图像,在每一个人的补丁,在分层贝叶斯框架使用高斯混合工作。
经过1教主ICAL高斯化,每个形象的代表,其外观为高斯混合模型(GMM)的几个高斯的空间布局的地图。
然后,我们提取外观的信息frowGMM参数,从全局和局部的统计数据的空间信息,高斯映射。
最后,我们聘请监督维还原技术,称为磷酸二铵(判别属性PROJection)消除噪音的方向,并进一步加强我们代表的鉴别力。
我们的理由传统的直方图表示和空间金字塔观看我们的分层的特殊情况高斯化。
我们比较我们的新的代表,与其他方法,在场景分类,识别物体和面部识别,我们的表现跻身在所有三项任务的顶部。
1.Introduction
Histogramrepresentation,asadescriptionfororderless
patch-basedfeatures,hasbeenwidelyusedinvisualreco
gnitionandimageretrieval[4,5].Despiteitspopularity,
however,histogramrepresentationhassomeintrinsiclim
itations.Forexample,itissensitivetoseveralfactorssuchas
outliers,thechoiceofbins,andthenoiselevelinthedata.
Mostimportantly,encodinghigh-dimensionalfeaturevectors
byarelativelysmallcodebookinclinestolargequantization
errorsandloseofdiscriminability[21].Furthermore,
histogramrepresentationdiscardsallthespatialconfiguration
ofimagepatches,whichisakeyattributeforobjectand
sceneclassification.
Severalapproacheshavebeenproposedintheliterature
1。
介绍直方图表示,作为一个无序的补丁基于功能的描述,已被广泛应用在视觉识别,图像检索[4,5]。
然而,尽管它的普及,直方图表示有一些固有的局限性。
例如,它是敏感的几个因素,如离群,选择箱,并在数据的噪音水平。
最重要的是,一个相对较小的码书编码由高维特征向量,倾斜大的量化误差,失去辨别力[21]。
此外,直方图表示丢弃所有的图像补丁的空间配置,这是一个关键属性的对象和场景分类。
文献中已经提出了几种方法
Figure1.(a)isaninputimage.(b)showsthepatchfeaturesinthe
featurespace.Each‘,+‘,denotesafeaturevector.whosedist
ributionisapproximatedbyaGMM.(c)showsasetofGanssianmaps,
eachofwhichcorrespondstooneGanssiancomponentin(b).A
superviseddimensionreductionalgorithm,DAP,isperformedin
(d)toformthefinalimagerepresentation,hierarchicalGanssianiza
tionvectortoovercometheselimitations.Softassignment,whichal
lowseachfeaturevectorbelongingtomultiplehistogram
bins,havebeensuggestedtocapturepartialsimilaritybe
tweenimages[16,19,18,26,27,28].Toenhancethedi
scriminatingcapabilityofhistograms,Farquharetal.[12]
andPeronninetal.[16]introducedseveralwaystoconst
ructcategory-specifichistograms,Larlusetal.[13]and
Yangetal.[19]suggestedtointegratehistogramconstru
ctionwithclassifiertraining,andMoosmannetal.[15]pr
oposedtouserandomizedforeststobuilddiscriminative
histograms.Asaflexiblewaytomodelavarietyofdistri
butions,GMMemergedasabetteralternativetohistogramsin
ageestimation,objectclassificationandvideoeventanalysis
[2,1,3].Ontheotherhand,toalleviatethelossofspatialinformationinhistogramrepresentation,oneofthemost
successfulapproachesbyfaristhespatialpyramidmatching
(SPM)techniqueproposedbyLazebniketal.[11].
图1。
(a)是输入图像。
(b)显示在特征空间中的补丁功能。
每个',',表示一个特征向量。
其分布近似由GMM的。
(c)显示了一套Ganssian地图,其中每个对应一个Ganssian组件(b)中。
有监督降维算法,磷酸二铵,(四)形成最终的图像表示,的层次Ganssianization载体来克服这些限制。
软任务,它允许每个特征向量属于多个histogrambins的,已建议,以捕捉图像[16,19,18,26,27,28]之间的部分相似。
直方图法夸尔,等,以提高鉴别能力。
[12]和Peronnin等[16]介绍了几种方法来构造特定类别的直方图中,Larlus等。
[13],杨等人。
[19]建议与分类培训相结合的直方图建设,Moosmann等。
[15]提出使用随机森林建立歧视性的直方图。
作为一种灵活的方式来模拟各种分布,GMM的成为一个更好的选择直方图估计年龄,对象分类和视频事件分析[2,1,3]。
另一方面,以减轻损失的空间信息的直方图表示,迄今为止最成功的方法之一是由Lazebnik等人提出的空间金字塔匹配(SPM)技术。
[11]。
Inthispaper,weproposeanewmodel-basedrepresenta
tionforimagefeatures,capturingboththeappearanceand
spatialinformation.First,weadoptahierarchicalGMMfor
featurevectorsatdifferencelevels:
thewholecorpus,each
imageandindividualpatches.Welearntheimage-specific
GMMinaBayesianframeworktoallowinformationsharing
acrossdifferentimagesandtobridgetheuniversaland
individualinformationretrievals.
在本文中,我们提出一个新的基于模型的图像特征表示,捕获的外观和空间信息。
首先,我们采用了层次差异水平的特征向量的GMM:
整个语料,每个形象和个别补丁。
在贝叶斯框架,允许在不同的图像信息共享和弥合的普及和个人的信息检索,我们学习GMM的特定图像。
Givenanimage-specificGMM,eachpatchofthatimageisassignedtoaGaussian
componentwithrespecttoaposteriorprobability.Allthese
probabilitiesconstituteasetofso-calledGaussiaureaps
overtheentirepatchgrid.AfterobtainingaGMMand
GaussianmapsforeachimagewhichwetermasaHierarchicalGaussianization(HG)process,weextracttheappearanceinformationfromtheGMMparameters,andthespatialinformationfromglobalandlocalsummarystatistics
overGaussianmaps.Finally,allparametersoftheGMM
andstatisticsoftheGaussianmapsareconcatenatedasa
super-vector,followedbyasuperviseddimensionreduction
tofurtherenhancethediscriminatingpoweroftherepresentation.Anillustrationofthisnewrepresentationisshown
inFigure1.
由于GMM的特定图像,该图像的每一个补丁被分配到一个后验概率的高斯组成部分。
所有这些可能性构成了一套所谓的Gaussiau整个补丁电网收割。
我们取得的每一个形象,我们作为分层高斯化(HG)过程的长期以GMM高斯地图后,从GMM参数提取的外观信息,空间超过高斯地图的全球和当地的汇总统计信息。
最后,GMM的和高斯地图统计的所有参数都连接为一个超级载体,由监督降维,进一步提高鉴别力表示。
这个新的代表性的插图显示
在图1。
Theremainingofthispaperisarrangedasfollows.In
Section2,weintroducethenewimagerepresentationthat
incorporatesboththevisualandspatialinformation.InSe
ction3,wejustifythatthehistogramrepresentationandthe
spatialpyramidmatchingarespecialcasesoftheHGrepr
esentation.InSection4,wedemonstratetheeffectiveness
ofourapproachonthreeimagedatabases.Conclusionsare
giveninSection5.
本文的其余安排如下。
第2节中,我们引入新的形象代表,既包括视觉和空间信息。
第3节中,我们证明,直方图表示和空间金字塔匹配的HG表示的特殊情况。
第4节中,我们证明我们的方法的有效性,对三个图像数据库。
在第5节给出结论。
2.HierarchicalGaussianizationrepresentation
2.1.GMMsforappearancerepresentation
Letzdenotesap-dimensionalfeaturevectorfromthe
I-thimage.WemodelzbyaGMM,namely,
2。
分层高斯化表示2.1。
GMMs外观表示设Z表示从第i个图像的p维的特征向量。
型号Z由GMM的,即,
whereKdenotesthetotalnumberofGaussiancomponents,
and
aretheimage-specificweight,meanand
covariancematrixofthehthGaussiancomponent,respectively.Forcomputationalefficiency,werestrictthecovariancematrices
beadiagonalmatrix
sharedbyall
images.
在K代表的总人数高斯组件,
和
是特定于映像的重量,意味着和
协方差矩阵的hth高斯成分,分别。
对于计算效率,我们限制
协方差矩阵是一个对角矩阵
共享
图像。
Thenumberofmodelparameters
increasesextensivelywith
respecttoN,thenumberoftrainingimages.Inpractice
thesizeofpatchesfromoneimageisusuallysmalland
thusinsufficientforarobustestimateofallparameters.To
overcomethisproblem,weproposeahierarchicalBayesian
frameworktojointlyestimatealltheGMMparameters.We
modeltheimage-specificGMMparameters
and
byconjugatepriors:
训练图像的数量为N,模型参数
的数量大量增加。
在实践中的修补程序从一个图像的大小通常是小,从而为所有参数的稳健估计的不足。
为了克服这个问题,我们提出了一个分层贝叶斯
框架,以共同所有的GMM参数估计。
我们模型的图像特定GMM参数
和
共轭先验:
ThepriordistributionovertheweightsisaDirichlet
distributionwithparameters(Twl,…TwK),whichcanbe
[’sinterpretedasaddingtotalTpseudo-countswithw}fractionofthemfromthekthcomponent.Thepriordistribu-
tionforthemean,,熬'sisaGaussiancenteredataglobal
mean}}withacovariancematrixshrunkbyasmoothing
parameterr.Notethatsuchapriorspecificationimposes
dependencebetweenimages.Andtherationalebehindthis
isto"borrow"strengthacrosssimilarimagesforestimation
andthereforeovercomethesmallsamplesizeissuesuffered
inconventionallearningprocesses.
的先验分布的权重,是一个Dirichlet分布参数(TWL,TWK),可以增加总TW}其中的一小部分,从第k个组件的伪计数sinterpreted。
前平均分布,熬的是中心在全球平均}高斯平滑参数r缩水协方差矩阵。
需要注意的是这样一个事先规范规定的图像之间的依赖。
和这背后的理由是“借”遇到类似图像的实力估计,因此,克服小样本问题,在传统的学习过程中遭受。
在权重的先验分布是狄
分布参数(Twl,TwK…),可以
['Tpseudo-countssinterpreted增加总与
数量-
他们决心从kth组件。
进入流通之前的
起跳的意思,,熬的是高斯集中在一个全球
意味着
与协方差矩阵缩水平滑
参数r。
注意这样一个规范对之前
图像之间的依赖。
和这背后的基本原理
是“借用”的力量在相似的图像,对评估吗
因此克服小样本问题遭受了
在传统的学习过程。
Weestimatethepriormeanvector
priorweights
andcovariancematrixE}byfittingaglobalGMMbasedon
thewholecorpus,andtheremainingparametersbysolving
thefollowingMaximumAPosteriori(MAP)loss,
我们估计前意味着向量
事先权重
和协方差矩阵E}通过安装一个全球GMM基于
整个语料库,和其余的参数求解
下面的最大后验(地图)损失,
TheMAPestimatescanbeobtainedviaanEMalgorithm:
intheE-step,wecompute
地图估计可以获得通过EM算法:
在E-step,我们计算
andintheM-step,weupdate
在M-step,我们更新
where
在
IfaGaussiancomponenthasahighprobabilisticcount,
then
approaches1andtheadaptedparametersempha-
sizethenewsufficientstatisticsm};otherwise,theadapted
parametersaredeterminedbytheglobalmodel
.Thetun-
ingparametersrandTcanalsoaffecttheMAPadaptation.
Ingeneral,thelargerrandT,thelargertheinfluenceofthe
priordistributionontheadaptation.Forexample,whenr
goestoinfinity,theMAPadaptationfor,
isfixedatthe
priormean,similarforTand
.Inpracticeweadjust:
andTempirically,basedonthetotalnumberofcoordinate
patchesforeachimage.
如果一个组件都有一个高的高斯概率统计,
然后
方法1和自适应参数强调
大小新的充分统计米};否则,改编
参数所决定的全球模型
。
调优参数r和T也会影响
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Hierarchical Gaussianization for Image Classification图像等级分类 Classification 图像 等级 分类
链接地址:https://www.bdocx.com/doc/7915329.html