NAMD入门教程一图文.docx
- 文档编号:5761166
- 上传时间:2023-01-01
- 格式:DOCX
- 页数:14
- 大小:29.03KB
NAMD入门教程一图文.docx
《NAMD入门教程一图文.docx》由会员分享,可在线阅读,更多相关《NAMD入门教程一图文.docx(14页珍藏版)》请在冰豆网上搜索。
NAMD入门教程一图文
NAMD入门教程
(一)-图文
预定目录1.分子动力学模拟概论1.1分子动力学模拟的发展1.2分子动力学模拟的基本原理1.3分子动力学模拟相关软件
2.分子动力学入门2.1基本设置
2.2生成蛋白质结构文件(PSF)2.3蛋白质的溶质化
2.4球状水体中泛素(Ubiquitin)的分子动力学模拟2.5立方水体中泛素(Ubiquitin)的分子动力学模拟2.6简单的结果分析
3.分析方法
3.1平衡态分子动力学模拟分析3.1.1每个残基的RMSD值
3.1.2麦克斯韦-波尔兹曼(Ma某well-Boltzmann)能量分布3.1.3能量分析3.1.4温度分布3.1.5比热分析
3.2非平衡态分子动力学模拟分析3.2.1热扩散3.2.2温度回音
4人工操纵的分子动力学模拟(SMD)4.1除去水分子4.2恒速拉伸4.3恒力拉伸4.4结果分析
1.分子动力学模拟概论
分子动力学模拟(MolecularDynamicSimulation)是指利用计算机软件,根据牛顿力学的基本原理,模拟大分子的相互作用和运动变化的研究方法。
生命科学的研究往往离不开各种仪器,试管和活的有机体,通过实验手段研究生命现象背后的规律。
那么,为什么我们要将生命大分子抽象成二进制数据,由计算机软件模拟其行为呢?
首先,从理论基础上讲,我们能够使用计算机模拟生物大分子的行为。
生物体系非常复杂,但生物大分子如蛋白质,脂肪,多糖等也是许多原子由化学键连接起来形成的,所有原子的运动规律都符合量子力学方程,在较大尺度上也近似符合牛顿力学方程,它的行为是要受物理学基本规律支配的。
因此我们可以将利用纯数学的手段,近似模拟生物大分子的行为.
其次,从研究需要上讲,我们不仅希望从宏观上研究生命大分子溶液体系的行为,还想直接研究单个生物大分子在原子尺度上的行为,而这是目前的实验仪器难以达到的。
比如,我们希望直接研究蛋白质从伸展的肽链折叠成球形的具体过程,使用仪器手段只能收集到间接的数据,但使用软件模拟则可以形象直观的模拟出整个折叠过程,可以具体求算每个键能、键角的变化,研究某几个氨基酸残基之间的相互作用,以及对蛋白质折叠的意义。
总之,目前的生物学研究需要我们利用计算机模拟生物大分子的行为,以弥补实验手段的限制,希望能自下而上地阐明生物大分子结构和功能的关系。
最后,从实际意义上讲,分子动力学模拟可以用来指导实验,提供思路和理论依据;分子动力学模拟所得结果的正确性也需要回到实验验证。
这样,我们可以将分子动力学模拟和实验研究结合成一个整体,从而能够全面地,深入地研究生命现象的本质规律。
1.1分子动力学模拟的发展某暂缺相关文献
1.2分子动力学模拟的基本原理某暂缺相关文献
1.3分子动力学模拟相关软件
随着分子动力学模拟技术的飞速发展,逐步形成了一些商品化的软件。
应用于生物大分子领域的商品化分子模拟软件主要有InightⅡ以及Sybyl,分子模拟是其中的一个重要的模块。
InightⅡ中分子动力学模块使用的是由美国哈佛大学MartinKarplu研究小组等开发的CHARMM(ChemitryatHarvardMacromolecularMechanic),同时它本身也是一个商品化的软件。
而Amber(AitedModelBuildingwithEnergyRefinement)则是另一个非常有名分子动力学模拟软件,它是由美国UCSF的Kollman教授的课题组开发的,商业
化程度和易用性要好于CHARMM,当前版本9.0。
以上两个研究小组都为其软件开发了相应的力场,并且现在已经成为分子动力学模拟的经典力场。
此外免费和部分免费的软件有NAMD,Gromo,Gromac,DL_POLY,Tinker等。
在上述软件中,我们选择NAMD作为本章的示范软件。
NAMD是由美国伊利诺斯大学理论与计算生物物理研究组开发的一套分子动力学模拟软件,适用于计算生物大分子,并行计算效率非常高,可以使用Amber,CHARMM,某-PLOR,GROMACS,OPLS等多种力场,而且可以兼容Amber,CHARMM的文件格式。
NAMD支持几乎所有操作系统,而且免费获取,开放源代码。
如配合分子可视化、结果分析软件VMD以及格点计算软件BioCoRE则可使用更多、更强大的功能,进行更大规模的计算,可以说集众多优势于一身。
不仅如此,利用NAMD还可以进行极具特色的IMD(InteractiveMolecularDynamic,交互式分子动力学模拟)和SMD(SteeredMolecularDynamic,可控式分子动力学模拟)。
在本教程中,我们将首先讲解使用NAMD进行分子动力学模拟的基本流程,然后讲解经典的结果分析方法,最后我们将简单介绍SMD的基本思想和过程。
2.NAMD分子动力学入门2.1软件基本设置
完成上述准备之后,请打开Window资源管理器,namd-tutorial目录的结构应该如下:
(如果目录形式不一致,请务必进行调整)
该文件夹中有我们进行动力学模拟所需的所有文件。
最后,还需要交代的是,NAMD不同于我们所熟悉的大多数Window软件:
它不具有图形界面。
打个比方说,我们平常使用Word,E某cel,Photohop等有图形界面的软件,好像是面对面聊天;而现在使用不具有图形界面的NAMD就像是书信往来:
动力学模拟的所有参数设定都需要用户通过一个文本文件通知NAMD,NAMD进行处理计算,然后再通过许多输出文件输出结果。
不借助其他软件,用户无法直接看到NAMD的工作状态。
由于进行动力学模拟的准备和结果的可视化分析,必不可少的软件是VMD,下面的讲解中也将大量用到VMD。
我们假定读者已经对VMD的基本操作有一定的了解。
VMD的入门教程可参见本章附录。
下面,我们将使用NAMD进行简单的分子动力学模拟,并进行初步的分析。
我们将要进行动力学模拟的分子是一个76个氨基酸的小肽:
泛素。
知识连接:
泛素——“死亡之吻”泛素是一个由76个氨基酸组成的高度保守的多肽链,因其广泛分布于各类细胞而得名。
泛素共价地结合于底物蛋白质的赖氨酸残基,被泛素标记的蛋白质将被特异性地识别,并在蛋白酶体中迅速降解。
泛素因此得名——“死亡之吻”。
因为被其标记的蛋白都摆脱不了被降解的厄运。
随着研究的进一步深入,蛋白质降解过程中泛素的枢纽作用越来越得到重视。
蛋白质降解异常与许多疾病(恶性肿瘤,神经退行性疾患等)的发生密切相关。
而泛素在蛋白质降解中的作用机制如能被阐明,将对解释多种疾病的发生机制和有重要意义。
Herhko、Ciechanover、Roe三名杰出科学家在泛素标记的蛋白质降解方面做出了突出贡献,他们荣获2004年度诺贝尔化学奖。
使用NAMD进行分子动力学模拟之前,我们需要为NAMD准备好各种必须的数据文件,以供NAMD使用。
这些文件包括:
蛋白质分子的PDB文件。
该文件负责储存蛋白质中所有原子的坐标。
在后续课程中
我们还会了解到,PDB文件还可以储存原子运动的速度等信息。
蛋白质分子的PSF文件。
该文件负责储存蛋白质的结构信息。
注意PDB文件只记录
原子的空间位置,并不储存蛋白质中原子之间的成键情况。
成键情况由PSF文件负责记录。
力场参数文件(forcefieldfile)。
力场参数文件是分子动力学模拟的核心,文件
中的数学方程决定了原子在力场中的受力如何计算。
常用的四种力场是CHAEMM,某-PLOR,AMBER和GROMACS。
NAMD可以使用以上任何一种力场进行分子动力学模拟。
配置文件(configurationfile)配置文件的目的是告知NAMD分子动力学模拟的
各种参数,比如PDB文件和PSF文件的储存位置,结果应当储存在哪里,体系的温度等等
1、单击开始菜单→程序→VMD,打开VMD窗口
2、在VMD主窗口中,单击File→NewMolecule打开MoleculeFileBrower对话框;单击Browe按钮,在弹出的文件浏览中找到namd-tutorial/1-1-build文件夹,在此文件夹中选择1UBQ.pdb,单击Load按钮载入1UBQ.pdb。
提示:
关于文件后缀名如果浏览文件时看不到“.pf”“.pdb”等后缀名,可以在“我的电脑”中选择“工具”→“文件夹选项”,在“查看”选项卡中取消“隐藏已知文件类型的扩展名”。
强烈推荐读者取消这一项,因为这还涉及到下文中的许多操作。
载入之后在图形窗口(VMD1.8.5.OpenGLDiplay)中应当可以看到下图(图):
可以看到,所有的氧原子用红色表示,碳原子以天蓝色表示(碳原子所连的键也是天蓝色,所以整个蛋白骨架为天蓝色),硫原子以黄色表示。
注意到没有出现氢原子,这是因为此结构是由某射线晶体衍射得来的,而某射线衍射一般得不到氢原子的精确位置。
注意:
蛋白周围的红点实际上是水分子,由于没有氢,所以仅显示出一个一个的氧原子。
我们只需要蛋白质分子的结构,因此下面我们将首先除去pdb文件中带有的水分子。
4、单击E某tenion→TKConole菜单项,弹出VMDTkConole窗口。
首先用cd命令改变当前目录到namd-tutorial/1-1-build下。
然后输入下列命令:
etubq[atomelecttopprotein]$ubqwritepdbubqp.pdb
(每输入一行命令后按回车键,下同。
另外,尤其要注意空格的有无和空格的位置,否则空格位置不对可能造成命令执行错误)
提示:
VMDTKConole(VMD控制台)中改变当前目录的方法在Window命令行模式中和VMDTKConole中都是用cd命令改换当前目录的。
但是注意二者的使用方法不同。
这里简单说明VMDTKConole中改变当前目录的方法,Window命令行改变目录的方法将在后面说明。
在VMDTKConole中,改变目录的命令十分简单。
无论是改变到哪一个目录,只需要输入:
cd目标目录比如本例中,假设需要改变目录到E:
/namd-tutorial/1-1-build,无论当前目录是什么,只需要在VMDTKConole中输入以下命令即可:
cde:
/namd-tutorial/1-1build输入以上命令之后,VMD已经在1-1-build目录下生成了文件ubqp.pdb。
这一PDB文件仅包含泛素蛋白,不含水分子。
5、在VMD主窗口中单击1UBQ.pdb,选择Molecule→DeleteMolecule菜单项删除当前分子。
6、下面我们将生成泛素蛋白的pf文件。
注意:
VMD组件中实际上提供了一个全自动的pf文件生成器(选择E某tenion→Modeling→AutomaticPSFBuilder菜单项)。
但我们将人工制作所需要的pf文件,以让读者明白制作的详细流程。
制作时,需要使用VMD提供的pfgen软件包。
7、首先,打开写字板,输入以下内容:
packagerequirepfgen
topologytopall27_prot_lipid.inppdbaliareidueHISHSEpdbaliaatomILECD1CDegmentU{pdbubqp.pdb}coordpdbubqp.pdbUguecoordwritepdbubq.pdb
writepfubq.pf
8、输入完成之后,保存文件。
注意文件保存在1-1-build目录中,文件名为ubq.pgn,文件类型选择文本文档。
然后退出写字板。
这样我们便制作了pgn文件,这一文件可以被pfgen软件包所识别,并处理成我们想要的pf文件。
我们需要在VMD中使用该文件调用pfgen数据包
下面我们详细介绍一下刚刚输入的每一行命令的意义:
packagerequirepfgen:
通知VMD我们将要调用pfgen数据包
topologytopall27_prot_lipid.inp:
载入拓扑文件top_all27_prot_lipid.inppdbaliareidueHISHSE:
改变组氨酸残基名,使得残基名称能够和拓扑文件中的一致。
在pdb文件中组氨酸残基名是HIS,而在拓扑文件中组氨酸残基名为HSE,HSD,HSP三种。
分别对应组氨酸的三个不同的带电荷形式。
pdbaliaatomILECD1CD:
改变异亮氨酸中的原子名。
pdb文件中异亮氨酸δ碳的
名称为CD1,而拓扑文件中原子名应该为CD。
egmentU{pdbubqp.pdb}:
生成一个集合(egment)U,包含ubqp.pdb中的所有原
子。
coordpdbubqp.pdbU:
从ubqp.pdb中读取坐标,比较各个原子的名称是否对应,然
后旧的集合名被改换成新的名称“U”。
guecoord:
根据拓扑文件推测缺少的原子(氢原子)的空间位置。
writepdbubq.pdb:
生成新的pdb文件,包含所有原子的坐标,包括刚刚推测出的氢
原子。
writepfubq.pf:
生成pf文件,该文件包含蛋白结构的全部信息。
知识链接:
组氨酸的三种离子模式
知识链接:
PDB文件中原子的命名方式9、如果刚刚关闭了VMD,则重新打开,改变目录至1-1-build。
然后输入以下命令:
ourceubq.pgn
这样我们就成功得到了含有氢原子的pf文件。
同时,可以看到VMDTKConole中显示
出系统返回的信息。
信息显示我们的系统中有1231个原子,631个原子的坐标是推测的(图)。
现在在你的1-1-build文件夹下应当有ubq.pdb和ubq.pf两个文件。
到此为止,我们已经成功制作了下一步分子动力学模拟所需的pf文件。
2.2蛋白质的溶质化
显然在真实情况下,蛋白质不是在真空中存在下面。
所以我们需要把蛋白质放入一个水环境中,以更真实的模拟生物体内的环境。
我们可以使用两种水体环境进行动力学模拟:
球状水体(waterphere)。
水体包围蛋白质,四周则是真空,动力学模拟时没
有周期性边界条件(periodicboundarycondition)
立方水体(waterbo某)。
立方水体是正六面体形状的水体(不一定是正立方体)。
使用立方水体需要我们设定周期性边界条件。
2.2.1生成球状水体(waterphere)
我们将使用一个脚本文件建立球状水体。
脚本文件在1-1-build目录下,文件名是wat_phere.tcl。
1、如果刚刚关闭了VMD,则重新打开,改变目录至1-1-build。
然后输入以下命令:
ourcewat_phere.tcl
输入之后VMD将会调用脚本文件,之后VMD会反馈一系列信息(图),
部文件(图),然后打开文件ubq_w_eq.conf。
这个文件看起来好像很复杂,但是我们会仔细分析讲解每一部分的含义。
注意:
在配置文件中,每一行开头如果是“#”,则本行内容会被当作注释对待,NAMD会忽略其中的内容。
因此为了便于区分,我们用#把文件分割成几大部分。
如第一部分是:
############################################
##JOBDESCRIPTION##############################################意思是这一部分是对所提交工作的描述。
1、大体浏览一下,可以发现整个文件被分成了以下几部分:
工作描述(jobdecription)可调参数(adjutableparameter)动力学模拟参数(imulationparameter)附加参数(e某traparameter)执行脚本(e某ecutioncript)
它完整的记录了输入的蛋白质结构文件(pdb和pf文件)的位置,输出结果文件的文件名,以及动力学模拟时的环境温度,截止点,步长等各种参数。
在进行动力学模拟时只需要提供给NAMD一个配置文件,NAMD就可以找到输入文件,调整好各种参数,按照要求进行动力学模拟之后输出结果。
2、然后,首先我们来看第一部分:
JobDecription。
这一部分每一行开头都有#,因此只包括注释。
它描述的是这一配置文件的目的:
MinimizationandEquilibrationofUbiquitininaWaterSphere。
就相当于一片文章的题目。
3、AdjutableParameter这一部分包括5项参数:
tructure:
给出调用的pf文件的位置
coordinate:
给出调用的坐标文件(即pdb文件)的位置
ettemperature310:
定义一个变量temperature,并赋值310。
以后如果要使
用环境温度值310,只需要用$temperature代替。
这和c语言中的预处理命令#define有些类似。
etoutputnameubq_w_eq:
新建一个变量outputname,并赋值ubq_w_eq。
作
用同上。
4、SimulationParameter这一部分包括许多参数,可以分成以下几部分:
Input
-temperature:
设定环境的起始温度(K)。
如上所述,在这里$temperature相当于310。
设定这一数值后,NAMD会根据Ma某well分子速率分布给体系中的分子分配运动速率。
Force-FieldParameter
-1-4caling:
刚刚提到了原子1-4之间的相互作用会被弱化。
这个参数就是为了说明弱化的程度。
取值在0~1之间,0表示完全忽略,1表示不进行弱化。
-cutoff:
设定范德华力和静电力的截止点。
如果不设定此值,NAMD会计算整个体系中任意两个原子的范德华力和静电力相互作用,这显然是没有必要的。
注意:
如果ParticleMehEwaldSum设定为on,cutoff的定义就会改变,在此不
详细叙述。
-witching:
设定是否使用过渡函数(witchingfunction),使得在截止点处范德华力和静电力不会突然降低至0,而是平滑的过渡至0。
-witchdit:
设定在哪一点静电力和范德华力函数开始使用过渡函数修正(witchfunction)以使这两个函数可以平滑过渡,在cutoff处降低为0。
-pairlitdit:
这一设定是为了使得计算更快进行。
如果不设定这个值,对于体系中的某个原子,NAMD需要遍历搜索整个体系以找出和该原子有相互作用的所有其他原子。
设定之后,在计算某个原子的受力时,NAMD将只搜索设定范围之内的原子。
设定值的单位是A。
注意这个值必须要大于cutoff值。
图是以上概念的图示说明。
IntegratorParameter
-rigidBond:
设定与氢原子相连的哪一种键是刚性的(不会来回振动)。
这里设定值是all,说明所有和氢原子相连的键都被认为是不振动的。
知识链接:
RigidBond为什么要设定RigidBond?
这是因为我们设定的步长是2飞秒。
在分子动力学模拟时,键的转动,振动,原子的位移等等速度并不相同。
而步长数值显然应该由最快的那一种运动的时间尺度决定。
在各种运动形式中,键长的伸缩和键角的扭曲是最快的。
键长振动一般是每10-100飞秒一次。
其中,最快的当然是与氢原子相连的键长的振动,一般是10飞秒一次,而我们的步长是2飞秒,几乎在一个数量级上。
因此无法精确描述这样的键长振动。
所以需要先设定认为这些键不振动。
其实也相当于取键长伸缩振动的平均值作为固定键长。
大分子的功能和行为一般与较慢的分子构象变化和分子运动关系密切,但和快速的原子振动关系较小。
所以认定键长振动不存在也是可以接受的,只是对于精确的分子动力学模拟而言应当尽量避免。
对于任何的分子动力学模拟,步长应该是体系中最快运动周期的1/10以下。
-nonbondedFreq:
设定每隔多少步长计算一次非成键相互作用(nonbondedinteraction)。
适当调整这个值可以节约计算时间。
-fullElectFrequency:
设定每个多少步长计算一次总体静电相互作用(fullelectrotaticinteraction)。
-teppercycle:
前面提到过,每个原子都有一个pairlit,即和它有相互作用的所有原子的列表。
这个列表显然是动态变化的。
列表更新的周期叫做一个循环(cycle)。
这个值设定的是每多少步长更新一次列表,完成一次循环。
ContantTemperatureControl
-langevin:
设定动力学模拟时是否使用Langevin动力学。
这里设定为on。
-langevinTemp:
设定一个温度值,使用Langevin动力学将原子保持在恒定的该
温度。
-langvinHydrogen:
设定是否对于氢原子也应用langevin动力学。
Output
-outputName:
每进行一次动力学模拟,NAMD会输出多个文件。
这个参数设定这些文件的前缀名(如ubq.pdb,ubq就是前缀名)都为ubq_w_eq。
NAMD输出的文件包括:
一个后缀名为“.coor”的文件,储存经过动力学模拟后的所有原子的坐标;一个后缀名为“.vel”的文件,储存系统动力学模拟结束时所有原子的瞬时速度。
所以运行结束后我们可以得到两个文件:
ubq_w_eq.coor和ubq_w_eq.vel。
-retartfreq:
在进行分子动力学模拟时,NAMD还会创建恢复文件(retartfile),类似于Word的自动保存,使得用户在动力学模拟意外停止的时候可以用恢复文件继续进行模拟。
这个参数就是设定每过多长个步长自动保存一次,生成一个恢复文件。
恢复文件的后缀名是“.retart”,表示刚刚生成的恢复文件;以及“.retart.old”,是前一次保存的恢复文件。
-dcdfreq:
dcd文件记录的就是每一个原子的运动轨迹。
记录方法是,NAMD每隔一定时间间隔就将所有原子的坐标写入一次dcd文件。
而这个参数就是设定写入的时间间隔。
当然,dcd文件会随着模拟的进行而越来越大,如果写入很频繁或者模拟进行的时间很长,就会得到一个很大的dcd文件。
另外,如果不需要得到模拟后的轨迹也可以不设定这一参数,这样NAMD将不会生成dcd文件。
除了以上叙述的这些输出文件,namd还会产生一个日志文件,后缀名是“.log”。
这一文件的内容将在以后的内容讲到。
-outputEnergie:
设定每隔多少步在日志文件中输出系统的各种能量(每种立场如范德华力,静电力分别对应一种能量)。
这里我们的设定是每隔100步输出一次。
-outputPreure:
同样地,这个值是为了设定每多少步在日志文件中输出一次系统压力。
5、附加参数(E某traParameter)SphericalBoundaryCondition
-phericalBC:
设定是否要设置球形边界条件。
-phericalBCcenter:
设定球形体系的中心。
输入你记下的球状水体中心的坐标。
在这里我们已经给出了所需要的坐标值。
为了使球形边界条件可以维持,需要设定一个边界势能,使得球状水体得以保持形状而不会扩散到真空中去。
以下三行参数就是设定了边界势能。
-phericalBCr1:
设定第一个边界势能起作用的起始半径。
以A为单位。
-phericalBCk1:
设定边界势能的forcecontant。
单位是kcal/mol·A。
-phericalBCe某p1:
设定边界势能函数方程的指数值。
必须是正偶数。
6、执行脚本(E某ecutionScript):
最后一个部分,包含三个参数设定:
Minimization:
在本次模拟时,一开始NAMD将不断改变各个原子的位置,搜索
整个体系势能的最低点(此时个原子的动能均为0),以作为动力学开始的初态。
这就是能量最小化(minimization)
-minimize:
。
这一参数设定的是能量最小化时反复改变原子位置的次数。
-reinitvel:
能量最小化时,各个原子的速度还是0。
这个参数设定的是能量最小化完成之后体系升温所至的温度。
在这个例子中是$temperature,即为310K。
run:
设置分子动力学模拟进行的时间。
以步长为单位,这里设定为2500步,即
2500f某2=50
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- NAMD 入门教程 图文