正式版蛋白质折叠问题的50年历程.docx
- 文档编号:25141175
- 上传时间:2023-06-05
- 格式:DOCX
- 页数:23
- 大小:1.04MB
正式版蛋白质折叠问题的50年历程.docx
《正式版蛋白质折叠问题的50年历程.docx》由会员分享,可在线阅读,更多相关《正式版蛋白质折叠问题的50年历程.docx(23页珍藏版)》请在冰豆网上搜索。
正式版蛋白质折叠问题的50年历程
TheProtein-FoldingProblem,50YearsOn
蛋白质折叠问题的50年历程
Theprotein-foldingproblemwasfirstposedaboutonehalf-centuryago.Thetermreferstothreebroadquestions:
(i)Whatisthephysicalcodebywhichanaminoacidsequencedictatesaprotein’snativestructure?
(ii)Howcanproteinsfoldsofast?
(iii)Canwedeviseacomputeralgorithmtopredictproteinstructuresfromtheirsequences?
Wereviewprogressontheseproblems.Inafewcases,computersimulationsofthephysicalforcesinchemicallydetailedmodelshavenowachievedtheaccuratefoldingofsmallproteins.Wehavelearnedthatproteinsfoldrapidlybecauserandomthermalmotionscauseconformationalchangesleadingenergeticallydownhilltowardthenativestructure,aprinciplethatiscapturedinfunnel-shapedenergylandscapes.AndthanksinparttothelargeProteinDataBankofknownstructures,predictingproteinstructuresisnowfarmoresuccessfulthanwasthoughtpossibleintheearlydays.Whatbeganasthreequestionsofbasicscienceonehalf-centuryagohasnowgrownintothefull-fledgedresearchfieldofproteinphysicalscience.
蛋白质折叠问题是在半个世纪前第一次提出来的。
这一术语提到了三大问题:
(1)氨基酸序列决定蛋白质天然结构的物理密码是什么?
(2)蛋白质是怎样迅速折叠的?
(3)我们能设计一种计算机算法,让这种算法根据蛋白质的氨基酸序列就能预测蛋白质的结构吗?
我们回顾在这些问题上所取得的进展。
只在少数情况下,对于精细的化学模型中的物理外力,计算机模拟能够实现小型蛋白的正确折叠。
我们了解到蛋白质迅速折叠是因为随机热运动使得构象发生改变,而根据漏斗状的能量图景(funnel-shapedenergylandscapes)中所体现的原理,构象变化会使蛋白质沿着下坡路回归到天然结构。
还得感谢蛋白质数据库(PDB)中的已知结构,现在预测蛋白质结构远比早期预想的要成功。
半个世纪前,以这三个问题开始的基础科学现如今已经发展为一个对蛋白质自然科学进行研究的的成熟领域。
Proteinmoleculesembodyaremarkablerelationshipbetweenstructureandfunctionatthemolecularlevel.Proteinsperformmanydifferentfunctionsinbiochemistry.Aprotein’sbiologicalmechanismisdeterminedbyitsthree-dimensional(3D)nativestructure,whichinturnisencodedinits1Dstringofaminoacidmonomers.
蛋白质分子在分子水平上具体体现了蛋白质结构和其功能之间的显著关系。
蛋白质在生物化学中有许多不同的功能。
蛋白质的三维(3D)天然结构决定它的生物学机制,而反过来,蛋白质的氨基酸单体的一维链又对它的天然机构进行编码。
Thisyearmarksthe50thanniversaryofthe1962NobelPrizeinChemistryawardedtofortheirpioneeringworkindeterminingthestructureofglobularproteins(1–3).Thatworklaidthefoundationforstructuralbiology,whichinterpretsmolecularlevelbiologicalmechanismsintermsofthestructuresofproteinsandotherbiomolecules.Theirworkalsoraisedthequestionofhowproteinstructuresareexplainedbyphysicalprinciples.Uponseeingthestructureofmyoglobinat6Åresolution
(1),Kendrewetal.said,
1962年诺贝尔化学奖授予给了MaxPerutz和JohnKendrew,以表彰他们在确定球状蛋白质的结构这个方面所做的开创性工作(1-3),而今年是其50周年纪念日。
他们的工作奠定了结构生物学基础,也从蛋白质和其他生物分子的角度解释了分子水平上的生物机制。
他们的工作也提出这样的问题,怎样用物理原理来阐明蛋白质的结构?
如图1所示的是分辨率为6Å时的肌红蛋白结构,如Kendrewetal.所说,
Perhapsthemostremarkablefeatures ofthemoleculeareitscomplexityand itslackofsymmetry. Thearrangement seemstobealmosttotallylackinginthe kindofregularitieswhichoneinstinctivelyanticipates,anditismorecomplicatedthanhasbeenpredicatedbyany theoryofproteinstructure. Thoughthe detailedprinciplesofconstructiondonot yetemerge,wemayhopethattheywilldosoatalaterstageoftheanalysis.
或许这种分子最引人注目的特征就是其复杂性和缺乏对称性。
这种安排似乎完全缺少了人们本能会期望的那种规律,它比任何一种蛋白质结构理论所预测的还要复杂。
尽管还没有这个结构的详细原理,但我们希望在后期的分析阶段他们会做这样的工作。
图1.
In1958,Kendrewandco-workerspublishedthefirststructureofaglobularprotein:
myoglobinat6Åresolution
(1).Itspuzzlinglycomplexstructurelackedtheexpectedsymmetryandregularityandlaunchedtheprotein-foldingproblem.[WithpermissionfromtheMedicalResearchCouncilLaboratoryofMolecularBiology]
1958年,Kendrew和他的同事公开了第一个球状蛋白质的结构:
在6Å分辨率下的肌红蛋白
(1)。
它令人莫名其妙的复杂结构缺乏对称性和规则性,而肌红蛋白也正式开启了蛋白质折叠问题。
[经医学研究委员会分子生物实验室同意]
Theprotein-foldingproblemcametobethreemainquestions:
(i)Thephysicalfoldingcode:
Howisthe3Dnativestructureofaproteindeterminedbythephysicochemicalpropertiesthatareencodedinits1Damino-acidsequence?
(ii)Thefoldingmechanism:
Apolypeptidechainhasanalmostunfathomablenumberofpossibleconformations.Howcanproteinsfoldsofast?
(iii)Predictingproteinstructuresusingcomputers:
Canwedeviseacomputeralgorithmtopredictaprotein’snativestructurefromitsaminoacidsequence?
Suchanalgorithmmightcircumventthetime-consumingprocessofexperimentalproteinstructuredeterminationandacceleratethediscoveryofproteinstructuresandnewdrugs.Here,wegiveourperspectiveonthesequestionsatthebroad-brushlevel.Moredetailedreviewscanbefoundelsewhere(4–8)。
蛋白质折叠问题主要形成了三个问题:
(i)物理折叠密码:
蛋白质的一维氨基酸序列的理化特性是怎样决定蛋白质的3维天然结构的?
(ii)折叠机制:
一个多肽链可能的构象是不计其数的。
蛋白质是如何折叠得这么快的?
(iii)使用计算机来预测蛋白质结构:
我们能设计一种计算机算法,让这种算法根据蛋白质的氨基酸序列就能预测蛋白质的结构吗?
这种算法可能会避开蛋白质结构测定实验中费时的过程,从而加快蛋白质结构和新药物的发现。
在这里,我们粗略的给出了我们对这些问题的观点。
更多细节请参考(4-8)。
ThePhysicalCodeofProteinFolding
蛋白质折叠的物理密码
Whatforcesdriveaproteintoits3Dfoldedstructure?
MuchinsightcomesfromtheProteinDataBank(PDB),acollectionofnowmorethan80,000proteinstructuresatatomicdetail(9).Thefollowingfactorsappeartocontribute(10):
(i)Hydrogenbonds.Proteinstructuresarecomposedofa-helicesandb-sheets,aswaspredictedbyLinusPaulingonthebasisofexpectedhydrogenbondingpatterns(11).(ii)vanderWaalsinteractions.Theatomswithinafoldedproteinaretightlypacked,implyingtheimportanceofthesametypesofclose-rangedinteractionsthatgovernthestructuresofliquidsandsolids.(iii)Backboneanglepreferences.Likeothertypesofpolymers,proteinmoleculeshavepreferredanglesofneighboringbackbonebondorientations.(iv)Electrostaticinteractions.Someaminoacidsattractorrepelbecauseofnegativeandpositivecharges.(v)Hydrophobicinteractions.Proteinsballupintowell-packedfoldedstatesinwhichthehydrophobic(H)aminoacidsarepredominantlylocatedintheprotein’scoreandthepolar(P)aminoacidsaremorecommonlyonthefoldedprotein’ssurface.Theoryandexperimentsindicatethatfoldingisgovernedbyapredominantlybinarycodebasedoninteractionswithsurroundingwatermolecules:
TherearefewwaysagivenproteinsequenceofHandPresiduescanconfiguretoburyitshydrophobicaminoacidsoptimally(12,13).(vi)Chainentropy.Opposingthefoldingprocessisalargelossinchainentropyastheproteincollapsesintoitscompactnativestatefromitsmanyopendenaturedconfigurations(12).
什么样的作用力促使蛋白形成了它的三维折叠结构?
PDB现已集合了80,000多个原子级别的蛋白质结构,人们从PDB中得出很多见解(9)。
以下因素似乎促成了蛋白质的三维折叠结构(10):
(i)氢键。
正如莱纳斯·鲍林基于氢键预期模式的预测一样,蛋白质结构是由a-螺旋和b-折叠组成(11)。
(ii)范德华力相互作用。
折叠蛋白质中的原子都紧紧的挤在一起,这暗示了相同类型中紧密排列时相互作用的重要性,因为这种相互作用决定了液体和固体结构。
(iii)骨架角度倾向性。
像其他类型的聚合物一样,蛋白质分子也有角度倾向性:
向相邻的骨架结合的方向。
(iv)静电相互作用。
一些氨基酸因为正电荷和负电荷而相互吸引或排斥。
(v)疏水作用。
当疏水氨基酸(H)序列主要位于蛋白质核心,亲水氨基酸(P)普遍位于折叠蛋白质的表面时,蛋白质团成精密的折叠状态。
理论和实验表明折叠主要是由二元码控制,而这二元码是基于周围水分子的相互作用:
疏水残基和亲水残基中的给定的蛋白质序列几乎没有办法通过配置最好地隐藏其疏水氨基酸(12,13)。
(六)链熵。
当蛋白质从它的多开放变性组态折叠回紧凑的天然状态时,阻碍折叠进程是链熵的巨大损失。
Thesephysicalforcesaredescribedapproximatelyby“forcefields”(14).Forcefieldsaremodelsofpotentialenergiesthatareusedincomputersimulations.Theyarewidelyappliedtostudiesofproteinequilibriaanddynamics.Incomputermodeling,aproteinmoleculeisputintoaninitialconfiguration,oftenrandom.ConformationschangeoverthecourseofthesimulationbyrepeatedlysolvingNewton’sdynamicallawsofmotionfortheatomsoftheproteinmoleculeandthesolventbyusingtheforcefieldenergies.Accordingtothelawsofthermodynamics,systemstendtowardtheirstatesoflowestfreeenergy.Computationalproteinfoldingexplorestheprocessbywhichtheproteinproceedsthroughconformationalstatestostatesoflowerfreeenergies.AsshowninFig.2,thethermodynamicallystablestatesof12smallproteinstructurescanbereachedfairlysuccessfullybymeansofextensivemoleculardynamics(MD)simulationsinabathofexplicitwatermolecules(15).However,suchsuccesses,importantastheyare,arelimited.Sofar,suchmodelingsucceedsonlyonalimitedsetofsmallsimpleproteinfolds(16).And,itdoesnotyetaccuratelypredictproteinstabilitiesorthermodynamicproperties.Opportunitiesforthefutureincludebetterforcefields,bettermodelsoftheprotein-waterinteractions,andfasterwaystosampleconformations,whicharefartoolimited,evenwithtoday’smostpowerfulcomputers.
这些物理外力都可以近似的由力场(forcefields)来描述(14)。
“力场”是指能用于计算机模拟的能量模型。
他们被广泛地应用于蛋白质平衡和动力学的研究。
在计算机建模中,蛋白质分子常常是随机的放入一个初始组态中。
构象在模拟过程中发生改变是需要用能量力场不断求解蛋白质分子中的原子和溶剂的牛顿动力学运动定律方程。
根据热力学定律,系统的状态往往趋向于自由能最低的状态。
蛋白质折叠计算探索了蛋白质从构象状态到最低自由能状态的过程。
如图2所示,通过对溶剂中的水分子进行分子动力学模拟,12个小型蛋白质结构可以相当成功的转化为热力学上的稳定状态(15)。
然而,这样成功尽管重要却也受到限制。
到目前为止,这样的建模只在有限的小型简单蛋白质折叠过程中成功过(16)。
并且,它也还没有准确地预测出蛋白质的稳定性或者是热力学性质。
在将来,会有更好的“力场”(forcefields),蛋白质与水互作用也会有更好的模型,构象采样也会有更快的方法,哪怕是使用现如今最好的电脑它们也受到很大的限制。
Theearlydayssawhopesoffindingsimplesequencepatterns—sayofhydrophobic,polar,charged,andaromaticaminoacids—thatwouldpredictproteinstructuresandstabilities.Thathasnotmaterialized.Nevertheless,theresultsofthedetailedatomicsimulationsdescribedabovegiveoptimismthatatomicallydetailedmodelingissystematicallyimprovingandiscontributingtoourunderstandingofproteinsequence-structurerelationships.
早期,我们曾看到寻找到简单序列模式的希望,即疏水,极性,带电和芳香氨基酸,并想以此来预测蛋白质的结构和它的稳定性。
那个希望却并没有成真。
然而,上述详细的原子模拟结果仍能让我们觉得乐观,因为基于原子的详细模型得到系统的改善,它也加深了我们对蛋白质-序列的关系的理解。
图2
Modernphysicalmodelscancomputethefoldedstructuresofsomesmallproteins.Usingahigh-performancecustomcomputercalledAnton(48),Shawandco-workersobservedreversiblefoldingandunfoldinginmorethan400eventsacross12smallproteinstostructureswithin4.5Åoftheexperimentalstructure(15).Theexperimentalstructuresareshowninred,andthecomputedstructuresareblue.Shownarethename,PDBidentifier,andRMSD(root-mean-squaredeviationbetweenalphacarbonatoms)betweenthepredictedandexperimentalstructures.[Adaptedwithpermission(15)]
现代物理模型可以计算一些小型蛋白质的折叠结构。
使用高性能自定义的安东计算机(48),Sh
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 正式版 蛋白质 折叠 问题 50 年历