高通量技术及其 综合性的描述与基于约束的建模Word文档下载推荐.docx
- 文档编号:19706140
- 上传时间:2023-01-09
- 格式:DOCX
- 页数:13
- 大小:37.67KB
高通量技术及其 综合性的描述与基于约束的建模Word文档下载推荐.docx
《高通量技术及其 综合性的描述与基于约束的建模Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《高通量技术及其 综合性的描述与基于约束的建模Word文档下载推荐.docx(13页珍藏版)》请在冰豆网上搜索。
在这项工作中,我们提出在细菌固氮代谢活性的基因组规模的研究。
这种方法使我们构建,充当1的导向)集成高吞吐量数据,2)描述和预测代谢活性,和3)设计实验来探讨在细菌固氮的基因型-表型关系的计算模型。
通过Rhizobiaceas进行生物固氮代表近70%需要维护的生命在我们的生物圈整个氮转化的。
同时,由这些细菌驱动的固氮构成了一个有吸引力的和自然的战略发展相比,由于作物改良它的成本效益和更环保的效果可持续农业项目于那些由化肥生产[1]。
基于这些基本问题和实际问题,细菌固氮研究是研究一个活动线,在后基因组时代要求能够测量以系统的方式由这一过程发生在自然界新陈代谢的组织新模式。
在分子水平上,共生固氮便产生了多种基因,蛋白质和代谢物,这反过来激活信号转导级联和内部菌体转录因子的协同作用的结果。
在一天结束时,后果是一定的代谢途径,其最终产品所需的抵消微环境条件盛行内结节的活化和阻遏[2-4]。
高通量技术的出现,促进了基因组尺度分析细菌固氮和输出数据构成破译其代谢组织在不同生物层次有价值的材料[5,6]。
虽然有些显著的结果在解释高吞吐量的数据已经实现,他们压倒性的数量和异构组成代表了一个连贯和系统的方式推断生物知识是一个挑战。
这种挑战是,确实是,在系统生物学的一个核心问题,它的解决需要之间的基因组规模数据,生理知识和计算机建模一体化的努力[7-11]。
促进这项综合性挑战的目的,在本文中,我们提出在细菌固氮一个系统生物学描述。
特别是,它集成了高通量的技术和通量平衡分析,以便当他们固氮共生伴随菜豆(菜豆植物)探讨根瘤菌etli菌体代谢活性[11]。
调查细菌的表型和写生过程中固氮基因和新陈代谢,转录组和蛋白质组技术进行了R.18天选择接种后与P.根植物etli菌体寻常(见实验程序和方法的详细信息)。
我们选择了基于实验的知识时已表示,它为在研发etli菌体的平均固氮酶的最大酶活性这个区间。
为了确定这些基因在固氮一个显著的作用,我们完成了在固氮阶段,在自由生活条件在研发etli基因表达谱之间的对比分析,最后这个条件主要是由丁二酸和氨碳和氮定义来源地,分别(见方法)。
同时,获得里面菌体的蛋白质谱,亦在植物接种后18天。
自由生活和氮fixation--以及编纂的菌体内部检测到的蛋白质-一组基因在细菌固氮显著的参与是通过结合这些差异表达的两种生理条件下的基因定义。
这同一套基因担任我们的基准扩展代谢重建R.etli代谢(IOR363)和评价由在硅片分析推断的代谢能力的一致性[8]。
为了评估该模型的预测范围,我们定性比较由针对该基于约束的建模,将其从对Retli得到的高吞吐量数据推导出预测代谢活性。
总体而言,我们的研究代表了朝着一个系统生物学平台,为研究代谢活性细菌固氮重建一个显著的努力。
它的特点是它的集成和描述高吞吐量数据和预测的代谢机制底层细菌固氮能力。
高通量技术指导代谢重建
要在在R.etli固氮特点的基因表达,我们在自由生活条件,在菌体驾驶接种P.后18天选择固氮相比,每个基因的活动寻常。
从微阵列实验数据存储在数据存GEO(http:
//www.ncbi.nlm.nih.gov/geo/webcite)与接入号码GPL10081为R.etli平台和GSE21638自由生活,共生的数据。
尽管可能会出现在生物组织的不同层次的各种复杂的监管机制[12],我们假定这些基因与显著过表达指示功能机制用于实现固氮。
根据这一标准,我们确定了689个基因(R.的基因组etli约11%),其转录活性,在生物过程显著增加。
调查支持固氮的作用,这些基因有,我们划分他们按照为Rhizobiaceas定义的功能类别[13,14],见面板(A)图1和附加文件1。
正如所料,大部分NIF的和修复基因的所需的翻译起始,延长菌体和其它基因,以及终止被上调内结节。
此外,我们的数据表明,基因形成翻译起始,延伸和终止的机械部分的表达不存在,尽管它在根瘤菌中显著降低,报道大豆慢生根瘤菌,苜蓿中华根瘤菌和慢生根瘤菌蓟马类菌体的共同观测[15-17]。
按照细胞分裂抑制蛋白心灵感应,一个显著一些看家基因的下调他们的固氮阶段的表达,并从微阵列数据,我们得出的结论是一般的新陈代谢速度较慢,请参阅其他文件1。
图1。
从高通量技术和基于约束的建模数据的示意性视图。
(一)在菌体调节基因功能的分布。
(B)功能类蛋白质组数据。
的上调基因和蛋白质编码确定转录组学和蛋白质组学基因(C)的数量。
重叠区域表示由两种技术进行鉴定的基因的数目。
(D)的代谢重建R.etli(iOR450)的拓扑性质。
在从左至右的顶部:
化学计量矩阵和连接分布(对数-对数标度)。
在底部,代谢对和共享的反应的其相应的号码(在双对数标度)。
(E)的图中左侧示出的酶(基因)的数量分别为:
1),在硅片确定,但也没有实验上,(蓝色);
2)通过实验和在硅片(绿色检测);
和3)实验检测到,但在硅片(红色未观察到)沿着在(F)中所列出的22通路。
在右馅饼蓝色的区域代表的基因和酶的总百分比是同时出现在硅片和高通量的数据。
(F)一套22代谢途径被用来评估在硅片和实验结果之间的协议。
左图显示糖原异生从流量平衡分析(FBA)出现的活动。
附加文件1.基因芯片数据分析。
该表显示了这些基因的人固氮菌体活动中过度表达。
得到的菌体内部的生物活性的更广泛的观点,蛋白质组分析是为R.进行etli菌体从18天P.根植物选择接种后结节同样回忆寻常[18],参见实验程序和方法。
总体而言,蛋白质组的研究使我们确定并在这过程中固氮提出的293个基因的表达的菌体表征415点的蛋白质,见图1(B)和附加文件2。
附加文件2,蛋白质组数据。
通过使用质谱法,我们在细菌固氮的R.确定了一套蛋白质etli。
在每一行,我们命名为蛋白质,并提出了一些用于缔结蛋白质识别参数。
这两种技术-转录组和蛋白质组-促成提供有关细菌的固氮更广阔的生物景观。
然而,有必要了解在实验设计,以整合并以一致的方式解释该数据这两种技术的基本一定的差异。
虽然芯片技术源于两个生理条件(自由生活和固氮阶段)进行了比较分析,蛋白质组数据鉴定期间固氮阶段仅存的最丰富的蛋白质。
如图1(C)和附加文件3显示,确定两个数据集的基因之间的稀缺重叠是由于固有的每种技术的实验观察到的清晰度。
因此,为了确定这些基因和酶在菌体代谢相关作用,反过来,形成一组基因,作为基准计算的评估,我们遵循一个综合的,而不是选择性的策略。
考虑到数据的两个来源,我们推测上调确定微阵列数据的基因和那些编纂了鉴定的蛋白的基因可能揭示那些基因在固氮主要作用。
在此假设下,这两种技术使我们总共948个基因在支持细菌固氮作用整合,见图1和附加文件1和2。
附加文件蛋白质和转录组的3相交。
这是同时被蛋白质组和转录组技术鉴定的基因。
这组基因的功能分类,从参与中心代谢和氨基酸生产的那些保持固氮的具体途径,如糖原和聚β羟基丁酸酯(PHB)的生物合成的酶之间。
此外,我们确定了参与代谢和氨基酸,趋化作用,核糖体组合物,RNA聚合酶,DNA复制,核苷酸修理,分泌系统和脂肪酸代谢合成代谢酶。
此外,显著参加人数为转运蛋白反映工厂和菌体之间的激烈的代谢串扰;
例如,参加的小分子,例如碳,氢,磷酸盐和糖转运蛋白,属于这一分类,见面板(A)和(B)的图1。
我们还确定参与在固氮,两种成分的系统,运输和细胞表面结构,能量转移,细胞的保护,以及多糖的运输和合成的调节机制的蛋白质。
从两种技术及其在代谢水平暗示出现的功能分析的扩展的讨论可以在附加文件进行审查4。
其他文件4.本文件包含扩展描述性分析,从确定蛋白质组和转录组数据的基因推导。
扩大根瘤菌etli代谢重建和选择途径的实验评估
通过高通量技术生成的数据构成了走向固氮的描述性分析的基石。
尽管这种自上而下的计划,代表监测细胞的活性在基因组规模的宝贵贡献的事实,补充说明,必须整合这些数据和调查扰动是如何遗传的影响固氮有系统和定量的方式(自下而上计划)。
在这些量化方案中,基于约束的建模是一个适当的形式主义探索细胞代谢活性和指导的实验,以改善在一个合理的,一致和最佳方式的蜂窝行为[7,8,19,20]。
为了构建细菌固氮自下而上的计划,我们的战略包括三个步骤:
1)代谢重建R.etli;
2)在硅片建模固氮的和计算的预测和实验结果的3)的环状的评估。
代谢重建方面,蛋白质组和转录组数据被用来阐述上次报告的R.etli[8],从而使某些代谢改善,包括缺席了前一版本的新的代谢途径。
在视觉上识别这些代谢反应,我们进行表示该组标识的高吞吐量数据和那些从iOR363重建成在KEGG数据库中定义的每个的代谢途径的基因。
每个通路之间的对比分析使我们看到并强调他们之间的分歧。
符合先前的代谢重建,某些反应的实验数据集被确定,而另一些使我们假定的新的代谢途径是缺席在先前重构的活性[8]。
具体地,高通量数据强烈表明脂肪酸代谢的生物活性,因此,我们包括该途径中的代谢重建,见补充材料。
总体而言,一组405的反应和450个基因组成的新的代谢重建为R.etli(i0R450)与在硅片模拟和分析进行。
从更新后的代谢重建出现拓扑性质显示在图1(D)中。
评估一致性之间的代谢活动预计在硅片和高通量技术解释,我们选择了22KEGG代谢途径[21]认为具有最高的数目由高吞吐量数据实验检测基因见图1(F)的。
根据KEGG数据库,这22代谢途径包含311个基因为R.其中etli76.7%被包括在代谢重建iOR450。
这组基因及其相应的酶构成的中央芯,用于评估在硅片预测和高吞吐量数据的解释之间的一致性。
即使在硅片评估依赖于22代谢途径的活性,在固氮的硅片分析考虑到了所有包含在代谢重建的反应。
这后一种方法将是特别有价值的探索和预测的代谢作用,额外的途径有固氮作用。
基于约束的建模:
评估代谢重建的描述和预测能力
基于约束的建模是用于预测代谢表型的微生物存活于特定的环境条件和/或受遗传扰动有用[7,22]。
与评估代谢重建的表型的能力的目的,通量平衡分析(FBA)反应进行R.etli通过强加的物理和化学约束到每个代谢反应,使用的目标函数模仿共生固氮[8],参见方法部分。
作为该分析的结果是,一组酶和基因以在固氮一个显著作用被确定,在硅片的那些背后从FBA获得的代谢通量。
量化的实验和计算解释的协议中,我们定义一个稠度系数代表基因(η基因)或酶的级分(η化酶)预测FBA活性和由高通量技术检测,参见方法部分。
这个参数的范围从0到1,其中1表示最高和0从高通量技术检测和在计算机芯片上预测的基因(或酶)之间的最低的一致性。
评价这些参数的数值,并在固氮估计建模输出和高通量数据之间的连贯性,上iOR450早期代谢模拟进行了使用目标函数原本在先前的工作中,Z修正建议[8],即
其中,糖原,赖氨酸,聚羟基丁酸酯,丙氨酸,天门冬氨酸和铵表示为糖原[C],赖氨酸[C],PHB[C],ALA[E],ASP[E]和NH4[E],分别为。
所有这些代谢物都需要支持有效的共生固氮[8],以及它们的空间位置由[C]和[E]为细胞质和外部化合物表示。
作为这种模拟的结果,我们得到η基因的稠度系数=0.6835的基因和酶的η=0.702酶。
值得注意的是,这个数值暗示基因的68.35%和在硅片预测的酶的70.2%是由持续的高通量技术鉴定。
以评价这种相关性的统计显着性,一个超几何测试在每种情况下被施加。
在酶而言,系数反映了74酶在硅片预测,52是由高通量数据中识别。
同时,该基因稠度系数表示的237表达的基因即,162进行了实验鉴定。
在这两种情况下,我们的结论是,这些相关性在统计学上显著:
p值=8.59×
10-35和p值=4.9×
10-64的基因和酶,分别基于约束的建模提高可预见性的能力这些结果鼓励我们继续进行,在硅片代谢表型的过程中固氮的分析,但一些改进是可取的,以确保有一致的理解和准确的预测模型。
以提高自顶向下(高吞吐量数据)和自底向上(在硅片建模)方案之间的定性协议,因此,我们研究发现一个扩大的目标函数,其在硅片的表型改善了蛋白质稠度系数η的可能性。
为了避免成为一个简单的计算没有神器生物基金会此过程中,我们限制了搜索的代谢产物,其显著的作用,在细菌的固氮是受到强烈的实验证据。
因此,通过在文献评论导引,2代谢物包括在目标函数:
L-缬氨酸和L-组氨酸都与在固氮生物有意义的作用。
支持这种假设,诱变制成上的支链氨基酸,如L-缬氨酸的生物合成,已被证明是有缺陷的结核形成于宿主豆科植物的启动[23]。
此外,我们发现的证据表明,L-组氨酸是参与机制,用于调节固氮的中心化合物[12],我们指出,其包括在目标函数增加与高通量数据的协议。
因此,我们构建了一个新的目标函数期间在细菌固氮模仿代谢活性,现在通过集成
其中粗体字母表示的那些加入到先前目标函数的代谢物。
考虑到这个实施和模拟通过FBA的磁通分布,如上所述,我们得到在固氮,结果如下:
η基因=0.6948和η化酶=0.7683,见图1(E)。
在酶活性而言,这数值表示在硅片预测82代谢反应,其中63被一贯通过高吞吐量数据(对-VAL=3.05×
10-64),合理的。
与此同时,基因稠度系数表明,249表达的基因,173是由高通量数据中识别(p值=4.9×
10-64)。
鉴于这种改进中,图中定义计算的预测和22代谢途径的高吞吐量数据之间的详细比较1(E)使我们区分三种可能的情况:
检测到的1)基因(酶)进行了预测,在硅片但并不表明存在实验上,2)基因(酶),这些持续在这两个方案观察到的,和3)基因(酶)进行了实验检测,但在硅片不预测,见图1(E)。
正如方法部分解释,η是关系到基因(酶)的小部分,进行了持续观察这两个方案,构成我们的模拟评估的中坚力量。
然而,生物解释如上所述(在例1和3)的差异,需要建模和实验之间的反馈评估。
例如,这些差异可以被反射的转录后和翻译后调节的过程中固氮的存在和适当的实验设计将是基本要丢弃或接受这一假说。
讨论
在硅片建模和高通量数据之间的连贯的描述是探索治理代谢Rhizobiaceas的基本原则,并在固氮预测其表型行为的首要目标。
在这项工作中,我们提出一个系统生物学的框架能够探索R.的代谢活动在共生固氮与P.etli寻常。
特别是,我们提出,集成高吞吐量数据描述,模拟和指导的实验涉及在细菌固氮代谢活性的基因组尺度的模型。
在基于约束的优化分析的一个重要问题是交替最佳通量的存在,换句话说,一组反应的存在-或者通量分布-即产生相同的定量目标函数。
作为这些替代通量的结果,其中一个途径代谢输出可以由他人被取代,使得宏观表型保持不变。
因此,有和没有一系列变异性的反应的区别是至关重要的猜测支持生物表型的代谢活性。
因此,为了表征核心代谢活性和与那些从高吞吐量数据出现比较我们在硅片代谢解释,我们进行了磁通变异性分析(FVA)[24]。
同的目的,以识别那些代表沿着设定的替代解决方案代谢活性的中央纤芯的反应,我们限制我们的分析,以这些反应与一系列等同于零的可变性。
这个集合是这样的,对于每个反应的最小和最大通量变化分别相当于与构成我们的基石在生物过程导引代谢活性。
如描绘在图2,这一分析的输出导致我们确定参与需要用于维持细菌固氮某些代谢途径的一些关键反应。
FVA,进行与COBRA工具箱[25]。
作为这项研究的结果,一些结论性意见紧随其后。
图2。
通量变异性分析(FVA)。
在面板(A),我们描绘的反应与空变化的数值参与沿着列入代谢重建7代谢途径。
反应用空变异被定义为那些上限和下限是等价的。
属于这种分类的反应的一个部分示于(B)中。
该组由FVA所得反应示于(C)。
在这里,我们使用了下列缩写:
PGM(葡萄糖磷酸),FBA(醛缩酶),TPI(磷酸丙糖异构酶),RPI(核糖-5-磷酸异构酶),PUNP1(嘌呤核苷磷酸化酶(腺苷)),PUNP2(嘌呤核苷磷酸化酶(脱氧腺苷)),PPCK(磷酸羧),PHPB(乙酰乙酰CoA还原酶),PHBS(PHB合酶),PGMT(葡萄糖磷酸),PGI(葡萄糖-6-磷酸异构酶),PDH(丙酮酸脱氢酶),个人电脑(丙酮酸羧化酶),NP1_r(核苷酸磷酸酶),INSCR(肌醇分解代谢反应(集总)),INS2D(肌醇-2-脱氢酶),GUAPRTr(鸟嘌呤磷酸),GLGC(葡萄糖-1-磷酸腺苷酰转移酶),GLCS1(糖原合酶(ADPGlc)),GAPD(甘油醛-3-磷酸脱氢酶),G6PDH2(葡萄糖-6-磷酸脱氢酶),FBP(果糖二磷酸酶),ENO(烯醇化酶),EDD(6-磷酸葡糖酸脱水),EDA(2-脱氢-3-脱氧磷酸葡糖醛缩酶),CS(柠檬酸合酶),ACONTa(顺乌头酸(半反应A,柠檬酸盐加氢裂解酶)),ACONTb(顺乌头酸(半反应B中,异柠檬酸加氢裂合酶)),NIT(固氮),NH3t(氨可逆的运输),NH3e(铵离解,外),N2tr(氮交流,扩散)和MMSAD3(甲基丙二酸半醛脱氢酶(丙二酸半醛))。
柠檬酸循环
基于约束的建模表明TCA循环期间固氮通过构成在菌体主要碳源二羧酸活化[26]见附加文件5面板(B)的补充材料。
与此相一致的发现,8蛋白参与TCA循环中的R·
检测通过蛋白质组技术(FumC,FumB,LpdAch,SucB,的sucA,SUCC,MDH和ACNA)etli菌体。
为了进一步评估这一协议,我们应用基因缺失分析,探讨一下延长删除某些酶的可以定性影响细菌的固氮活性,如果预测的行为是一致的生物学知识报道Rhizobiaceas,见方法部分。
因此,在完成对代谢重建硅片基因缺失分析使我们得出这样的结论乌头合酶(acnA)突变体在R.etli不是致命的固氮作用。
尽管这个结果还没有被实验证明在R.etli,已经在其他Rhizobiaceas验证[27]。
此外,虽然异柠檬酸脱氢酶(ICD)不是由高通量技术检测,在R中硅片的icd突变etli建议对固氮减少表型。
这个结果是定性与事实一致认为S上的icd突变根瘤菌共生是无效的[28]。
同样地,基于约束的建模的结论是,酶活性在丙酮酸脱氢酶(PDH)的降低诱导显著减少共生固氮而是发生在S的情况下,不损害其根瘤菌菌体[29],见图图3(B)。
这一发现表明,PDH在生产乙酰辅酶A的作用,可以通过在R替代途径来代替etli菌体[5]。
这个假说的实验评估R.etli代谢是一个核心问题,在未来的探索。
附加文件5.(A)MA情节和代谢活性的代表性。
在该图中,我们显示从微阵列获得的数据对MA-情节和代谢活性通过FBA在某些代谢途径的预测的所选择的表示:
(B)的TCA循环,(C)的嘌呤和嘧啶代谢。
图3,在硅片上的细菌固氮基因敲除和表型变化的评估。
面板(A)总结了用于评估的基准,在硅片说明固氮。
在第一列的黑色和蓝色的字母表示分别与其对应的代谢途径中的沉默酶。
第二列表示由所述酶在本研究中鉴定的技术。
第三列表示Rhizobiacea用于比较在硅片预测。
第四和第五列代表的计算表型和配套的计算结果的参考。
号(+),(=)和(-)分别表示一个增量,不变性和减量在固氮当突变被完成。
在由乌头酸合酶(ACONTa)进行硅片的表型效应,异柠檬酸脱氢酶(ICDHx),丙酮酸脱氢酶(PDH),磷酸烯醇丙酮酸羧(PPCK),二磷酸醛缩酶(FBA),固氮(NIT)和CTP合酶(CTPS2)是总结在面板B.实现为肌醇分解代谢反应(INSCT)的稳健性分析的左侧显示于面板B.
糖酵解,糖异生和磷酸戊糖途径
一种常见的代谢性状一些Rhizobiaceas是糖异生通路的剧烈活动[3]。
在这一发现的协议,一个显著一些糖异生和糖酵解酶通过高通量的技术鉴定,并基于约束的建模一致的结论是,糖异生途径的积极参加固氮。
PEP羧(多种亚型pckA通过蛋白质组学的技术检测),请参阅其他文件2,镜像固氮和菌体分化的关键作用。
因此,R.etliCE3pckA突变很少产生结节到其中的感染线程不出现穿透[30]。
在本报告定性协议,在硅片突变表明pckA是实现固氮的必需基因R.etli,见图3。
此外,6-磷酸葡萄糖酸内酯酶(PGL),葡萄糖-6-磷酸dehydrogenasë
(Zwf1),其染色体同源基因(由zwf2指定)和一个醛醇(TAL)通过蛋白质组检测,供给的证据表明,戊糖磷酸途径可以是积极参与固氮。
与此相一致的发现,在快速发展的Rhizobiaceas,有证据表明,戊糖磷酸和恩特纳-Doudoroff通路工作坐标动作作为可能的主要路线为糖的代谢[31]。
如之前所提到的,一些糖酵解基因通过高通量数据确定:
2磷酸丙糖异构酶(TpiAch和TpiAf),一个甘油醛3-磷酸脱氢酶(GAP),一种丙酮酸激酶II(PykA),12磷酸脱水酶(烯醇化酶),磷酸变位酶(PGM),和二磷酸醛缩酶(fbaB),请参阅其他文件1和2,另外,有实验证据表明,遗传沉默fbaB在R.etli导致稀疏,空结节根豆类发展[30]。
与此相一致的事实,计算基因缺失分析进行了该基因证实fbaB在支持细菌固氮代谢至关重要的作用[30],见图3(B)中。
尽管这些研究结果不足以推断活性糖酵解周期,他们可能会建议的糖中间体经由其他途径的代谢。
例如,一个特定的转运蛋白的存在下甘油-3-磷酸(ugpAch1,诱导3.88倍通过微阵列分析)表明,这可能是用于产生糖酵解中间体的重要来源。
类似地,6-磷酸葡萄糖酸脱氢酶(GND)的表达暗示有源戊糖途径,其用于糖酵解中间体的代谢另一个潜在的信道的存在。
肌醇分解代谢途径
肌醇是在大豆根瘤中最丰富的化合物中的一种,因此,高通量技术成功检测肌醇-2-脱氢酶蛋白的存在(IDHA和IolB)编码肌醇代谢中的蛋白质[32]。
与这一事实一致,计算在代谢分析R.etli表明减少肌醇结节内,可以减少其容量固氮,见图3
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 高通量技术及其 综合性的描述与基于约束的建模 通量 技术 及其 综合性 描述 基于 约束 建模