基因芯片技术及其应用研究进展.docx
- 文档编号:6020660
- 上传时间:2023-01-03
- 格式:DOCX
- 页数:8
- 大小:26.38KB
基因芯片技术及其应用研究进展.docx
《基因芯片技术及其应用研究进展.docx》由会员分享,可在线阅读,更多相关《基因芯片技术及其应用研究进展.docx(8页珍藏版)》请在冰豆网上搜索。
基因芯片技术及其应用研究进展
研究生课程论文
题目:
基因芯片技术及其应用研究进展
课程:
分子生物学
姓名:
贾玉臣
学号:
Y20080150
2009年5月
基因芯片技术及其应用研究进展
摘要:
作为后基因组时代中重要实验手段的基因芯片技术,因其自动化程度高、效率高、准确率高等优点,已经应用于许多领域。
本文从基因芯片的原理、分类、制备及其数据的处理与分析来概括性地介绍了基因芯片技术,然后在当前基因芯片技术应用研究基础上,对基因芯片技术的前景进行了展望。
关键词:
基因芯片,芯片数据分析,应用研究
Genechipandtheadvancesofstudiesonitsapplication
Abstract:
Genechip,animportanttechnologyinpost-genome,hasbeenappliedinmanyfieldsasitsadvantagesofautomation,efficiencyandaccuracy.Genechiptechnologyisbrieflyintroducedfirstlyfromitsprinciple,classification,productionanddataanalysis,thenaprospectongenechipismadeonthebasisofitscurrentapplication.
Keywords:
Genechip,analysisofchipdata,studiesonapplication
随着人类基因组计划(HPG)的提前完成以及分子生物学相关学科的迅猛发展,越来越多的动植物、微生物基因组序列得以测定,基因序列数据正在以前所未有的速度迅速增长。
然而,怎样去研究如此众多基因在生命过程中所担负的功能就成了全世界生命科学工作者共同的课题。
为此,建立新型杂交和测序方法以对大量的遗传信息进行高效、快速的检测、分析就显得格外重要了。
可以说,人类基因组计划催生了基因芯片技术。
基因芯片又常被称为DNA微阵列(DNAMicroarray)或DNA微阵列芯片,是后基因组时代中的重要实验手段。
基因芯片(GeneChip),是指将大量特定的寡核苷酸探针分子有序地、高密地固定于支持物上,然后与进行了标记的样品进行杂交,通过检测杂交信号的强度及分布进而对靶分子的序列和数量进行分析。
目前在基因芯片的基础上,又发展起来了许多其它生物芯片,可以说,广义上的生物芯片正是起源于基因芯片。
所谓的生物芯片是指高密度固定在固相支持介质上的生物信息分子(如寡核苷酸、基因片段、cDNA或多肽、蛋白质)的微阵列,阵列中每个分子的序列及位置都是已知的,并且是预先设定好的[1]。
由于基因芯片能一次检测大量的目标分子,自动化程度高、效率高、准确率高,在研究基因表达、疾病诊断、发现新基因、DNA测序和药物筛选中有广泛的应用前景[2]。
因此,本文将在主要概述基因芯片技术的基础上,介绍一些基因芯片技术的应用及其研究进展。
1基因芯片概述
1.1基因芯片的原理
基因芯片的测序原理是杂交测序方法,即通过与一组已知序列的核酸探针杂交进行核酸序列测定的方法。
在一块基片表面固定了一定数量序列已知的核苷酸的探针。
当溶液中带有荧光标记的靶核酸序列,经退火后,与基因芯片上对应位置的核酸探针产生互补匹配杂交时,通过确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列,据此可重组出靶核酸的序列。
大规模基因测序或多态性分析时,每个核苷酸或突变点都必须检测出来。
因此,通常设计出一套大量的核苷酸探针,在靶序列上跨越每个位点,只在中央位点的碱基设计上有所不同,根据每套探针在每个位点的杂交严谨程度,即可测定出该碱基的种类。
如果基因芯片仅是用于检测基因表达的差异,只需设计出针对基因中特定区域的几套寡聚核苷酸即可。
基因芯片把大量已知序列探针集成在同一个基片上,经过标记的若干靶核酸序列通过与芯片特定位置上的探针杂交,便可根据碱基互补匹配的原理确定靶基因的序列。
对于核酸探针而言,杂交温度是非常重要的,必须要经过反复的优化以达到最佳杂交效果[3]。
1.2基因芯片的分类
由于基因芯片的制备方法和应用范围的不同,可以将基因芯片依据不同的标准分为不同的种类。
按载体材料区分:
(1)固定在聚合物膜(如尼龙膜,硝酸纤维膜等)表面上的膜芯片。
这种方法的优点是所需检测设备与目前分子生物学所用的放射显影技术相一致,相对比较成熟。
但芯片上探针密度不高,样品和试剂的需求量大,定量检测存在较多问题。
(2)固定在玻璃板上的玻璃芯片。
这种方法点阵密度可有较大的提高,各个探针在表面上的结合量也比较一致,但在标准化和批量化生产方面仍有不易克服的困难。
(3)固定在硅板上的硅芯片。
(4)固定在陶瓷表面的陶瓷芯片等。
按制作方法可分为原位合成芯片、直接点样法芯片等。
按载体上探针的种类可分为寡聚核苷酸芯片和cDNA芯片等。
如果按应用区分,总的来说又可分为表达谱芯片和检测芯片。
平常所说的基因表达谱芯片其实是从应用上讲,可用于对基因及其表达的量进行检测的芯片,寡聚核苷酸芯片和cDNA芯片都可用于表达谱研究。
cDNA可以通过PCR扩增出,[4],一般而言,基因表达谱芯片主要用于研究基因的功能,是指将待测及对照组的mRNA通过逆转录将荧光分别标记到两种组织的cDNA上,并与基因芯片进行杂交及荧光信号扫描,通过计算机处理就能确定芯片上的基因结合了探针的量,从而来判定此基因是否表达,或在两种组织中的表达是否有变化。
1.3基因芯片的制备
1.3.1载体的准备
制备基因芯片,首先要选择一个合适的固相支持物-载体,以供基因能在上面进行杂交反应,一般的载体包括膜、玻片、塑料、陶瓷及硅等。
目前,经过化学修饰的玻片越来越成为人们青睐的对象,比如进行多聚赖氨酸修饰、APS氨基修饰、APS-PDC(异硫氰酸)修饰、APS-GA(戊二醛)修饰以及硫基修饰等,它具有其它载体所不能比拟的诸多优点:
可耐受高温、离子强度高、退火质量提高、荧光信号本底低背景干扰弱、点样方便,而且成本较低。
1.3.2基因探针的制备
探针的设计是芯片设计中的核心,探针的特异性决定芯片杂交结果的特异性,同时根据不同的研究目的,探针在选择特异性区域和保守区域时应各有侧重点。
另外,探针设计还与检测的灵敏度和稳定性密切相关。
就探针的来源,目前比较常用的有cDNA探针和寡核苷酸探针。
cDNA探针就是与mRNA互补的DNA,由逆转录方法获得,一般被认为是真实表达的基因。
完整cDNA的长度从几百个碱基对到几千个碱基对之间,由于cDNA文库构建技术已经相当成熟,人们比较容易获得一个组织或个体大量种类的cDNA,这些从文库中扩增的得到的cDNA经纯化、检测、定量分析后溶解在适当的缓冲液中,可作为探针在点样法制备基因芯片时直接使用。
寡核苷酸探针是人工合成的,随意性好,设计创意的空间也大。
设计寡核苷酸探针时,研究人员必须要对该基因有着充分的了解。
是选择基因的保守区域还是特异性区域、是一段还是几段、是保留突变点还是另引入新的突变位点等,都要求实验人员根据自己的实际要求来考虑。
一般来说,寡核苷酸探针既可以用于检测芯片的制备,也可用于表达谱芯片的制备。
长度一般选取在15~70mer左右的片段,探针往往在5’端进行氨基修饰,考虑探针在杂交过程中的自由度,在探针的5’端氨基后紧跟12个碳原子。
探针的杂交区域应尽量避免存在二聚体结构。
目前比较通用的DNA合成方法是亚磷酰胺三酯法,合成每个单核苷酸都需要四步以上的操作。
美国安捷伦以及国内的赛百盛等公司都可提供寡核苷酸合成服务。
当然,如果自己拥有一台DNA合成仪的话,就可以随时依照自己的意愿来合成目的寡核苷酸片段。
一套合适的参照体系的运用,既保证了基因芯片质量的稳定性,又保证了其在不同实验条件下的可对比性。
(1)阳性对照:
一般选用管家基因,是指基因表达水平比较稳定,不太受环境变化而产生变化的一类基因,它能保证各种芯片杂交试验中基本都能保证表达的稳定性,因而它们在各芯片上的信号应该保持一致,以它们作为校验标准,可以保证同一芯片上不同杂交样品间或不同芯片的杂交样品间表达信号的可对比性。
(2)阴性对照:
一般选用与所研究基因无同源性的其它种属的基因作为对照。
(3)空白对照:
一般选用不含任何基因的点样稀释液,空白对照可以作为分析芯片杂交结果时本底信号的参照[1]。
1.3.3点样及点样后处理
所谓点样,就是指利用点样仪将已经得到的探针序列通过接触式针点或非接触式喷点的方法点到预先进行过化学修饰的基因芯片载体上,由于核酸分子中磷酸基团的负电性使之可以通过静电相互作用同载体表面牢牢地连接起来[5]。
Hegde等[6]运用将浓度为0.2mg/mL的纯化的PCR产物与二甲亚砜按1:
1的比例来进行点样。
在基因芯片的制备过程中,对点完样的芯片进行后处理是其最后一道工序,也是其中非常关键的一道工序。
点样后处理的目的主要是为了使探针能与载体表面牢固结合,同时,还对载体上未与探针结合的游离活性基团进行封闭以避免在杂交过程中非特异性的吸附对实验结果(特别是背景)造成大的影响。
因此,基因芯片点样后处理的结果直接影响了实验结果的好坏。
更高的探针固定率可提高杂交时的灵敏度;而封闭效果好的芯片在杂交后的背景特别干净,所得到的结果也就相对更为可靠。
1.3.4靶基因的标记
当通过一定的方法获取到了靶基因后,在与基因芯片退火杂交之前必须要进行分离、扩增和逆转录,然后再进行标记,包括放射性同位素标记、荧光标记等。
虽然前者具有很强的现实强度,但由于其放射危害性,现在使用的越来越少。
新近发展的多的荧光标记方法用不同激发波长的荧光素对不同来源的靶基因进行标记,可以更直观地比较不同来源样品的基因表达差异。
目前虽然已经报道出了诸多可以用来标记的靶基因的荧光或其它标记物,但用的最多的且效果较好的是Cy3和Cy5,它们不但具有很好的荧光强度,而且可以尽可能少的与探针或载体粘连[7]。
其实对靶基因进行标记后,他们本身并不是红色或绿色的,而是经过扫描仪的扫描处理后才显现出了我们所预期的颜色。
1.4基因芯片的图像处理及数据分析
1.4.1图片获取
完成基因芯片的制备后,下一步便是根据不同的研究目的设计和选择实验标本(包括组织、细胞等),然后通过各种方法对其标记上染料分子(多用荧光分子)或同位素(32P、33P),与基因芯片进行杂交。
对于用荧光标记的标本,其杂交结果可通过专门的芯片扫描仪进行扫描得到,常用的扫描仪主要有基于PMT(光电倍增管)和CCD(电耦合器件)作为感光器件的两种。
1.4.2样点的识别
但光学扫描仪扫出的芯片图像并没有给出各个样点的信号值、背景值和荧光信号比等信息,必须通过进一步的图像处理提取并得到各个样点的相应数据信息,供进一步的统计分析。
因此,芯片图像处理的主要目的是量化芯片上样点的具体信息。
芯片图像的处理首先要识别样点并确定样点的位置。
样点识别的第一步是生成网格或圆,以确定样点的大概位置。
根据芯片上行和列的数目,由计算机自动生成一个网格或圆,每个网格或圆就为每个点提供了一个相对位置的坐标。
样点位置确定后,还得对样点进行识别,主要是对网格或圆按照一定的规则不断的调节大小,找出最合适的位置和大小,使之正好与样点一样大。
1.4.3确定信号和背景值
在样点识别并定位后,点内的区域和周围的一部分区域内的像素就用来计算信号和背景强度,所以样点代表的基因表达情况是由样点的信号值扣除背景值得到的。
1.4.4数据的预处理
在得到代表基因表达情况的数据后,应当对数据进行预先处理。
目的就是要将一些质量很低、数据可能不准确的点予以清除;还要对芯片进行归一化校正处理;另外还可以用散点图先观察数据的特性,做一些预先的分析准备工作。
以cDNA芯片为例,其常用散点图表示在两个组织中基因表达量的比例信息。
如果两个样本组织的表达程度一致,那么散点集中在通过远点的斜率为1的直线附近,如果不为1,说明两种荧光标记有一个系统误差,可以通过软件来校正。
数据的预处理还包括设定一个阈值来判断真正的弱信号点后,以及利用LOWESS函数来对芯片进行校正。
最后再进行相应的数据分析。
1.4.5数据的统计分析
经过预处理的芯片数据,其实还是枯燥无味、难以理解的。
需要采用相应的芯片数据分析对其进行分析、判断和推理,从而可以确定很多信息。
例如,可以通过分析正常组织与肿瘤组织的差异表达来确定基因DNA的变化情况,可以通过聚类分析进而确定肿瘤的不同亚型。
因此,基因芯片图像数据的统计分析必须要利用基因芯片专门数据库和一些通用数据库,以及相应的数理统计方法。
基因芯片包括了成千上万个样点的信息,对应于这些基因的序列信息及图像处理得到的信息;对于cDNA芯片还包括两种荧光的比例信息;同时,芯片制作的目的、制作条件和方法、样品的制备、杂交条件、以及检测条件等均与该芯片相对应;此外还有基因芯片数据处理与信息提取的结果等,在芯片的制作测定前与测定后都有大量的信息数据需要处理,没有专门的数据库是难以想象的。
目前比较常用的芯片数据库有许多,比如:
ArrayExpress、ChipDB、ExpressDB、GeneExpressionAtlas、GeneX、Read、GeneExpressionOmnibus、M-CHiPS以及StandfordMicroarray等。
在这些基因数据库中,除了存有基因序列信息、样本信息、实验操作信息、数据提取信息等必备信息外,有的数据库还与芯片扫描仪联机,自动将芯片扫描的结果输入数据库,进行积累。
但要真正实现这些数据的共享,就必须要有一个统一的标准来规范基因芯片的实验数据格式、处理用的统计软件以及归一化方法等。
基于这种目的,最为著名的关于基因芯片实验的最低限度信息MIAME(MinimumInformationaboutAMicroarrayExperiment)就相应的诞生了,它是由MGED(MicroarrayGeneExperssionDataSociety)提出的,建议所有芯片生产厂家、软硬件供应商和研究人员都应采用该标准,以促进高质量、注释完全的芯片数据的共享。
通过差异筛选或聚类分析后,从基因芯片中筛选出自己感兴趣的基因后,就面临着深入了解这批基因功能信息的问题。
这就需要查询相应的通用数据库来进行。
例如,在基因表达谱芯片实验后拿到自己需要的基因后,一般会获得这个基因的GenBank号,这些信息就像一把钥匙一样,只要拥有其中一项信息,通过前面以介绍到的公共数据库中进行查询并结合一些生物信息分析,就能获得这个基因的相关功能的研究信息。
近年来大量生物学实验数据的积累,形成了当前数以百计的生物信息数据库。
它们各自按一定的目标收集和整理生物学实验数据,并提供相关的数据查询、数据处理的服务。
同时随着因特网的普及,这些数据库大多可以通过网络或网络下载来访问。
三大国际一级生物信息数据库,即美国国家信息中心(NCBI)的GenBank、欧洲分子生物学室验室(EMBL-EBI)的EM-BL和日本DNA数据库(DNADataBankofJapan,DDBJ)(http:
//www.ddbj.nig.ac.jp)新收录的核酸序列数据中,EST占65%以上[8]。
2基因芯片的应用及其研究进展
归纳起来,目前基因芯片的应用主要体现在以下几个方面:
基因表达分析,基因型、基因突变和多态型分析、疾病的诊断与治疗以及应用于药物研究等[9]。
2.1基因表达分析
基因芯片具有高度的敏感性和特异性,它可以监测细胞中几个至几千个mRNA拷贝的转录情况。
与用单探针分析mRNA的点杂交技术不同,基因芯片表达探针阵列应用了大约20对寡核苷酸探针来监测每一个mRNA的转录情况。
每对探针中,包含一个与所要监测的mRNA完全吻合和一个不完全吻合的探针,这两个探针的差别在于其中间位置的核苷酸不同。
比如通过基因芯片绘出基因表达的时空图谱,有助于人类认识生命活动过程和特征;检测基因表达的差异;发现新基因以及大规模基因测序等。
KanakoKawaura等[10]利用一个22k的寡聚DNA芯片成功地对普通小麦在盐害逆境中的基因转录图谱,最终得到的小麦的转录信息也具有极高的可靠性。
Girke等[11]利用基因芯片研究了拟南芥种子发育过程中的基因表达。
Wang等[12]用5766个cDNA微阵列研究比较正常卵巢和肿瘤卵巢组织基因表达差异,发现了几个和卵巢肿瘤进展相关的基因,为卵巢癌的诊断和治疗提供了新的指导。
2.2基因型、基因突变和多态性分析
在同一物种不同种群和个体之间,有着多种不同的基因型,而这种不同,往往与个体的不同性状和多种遗传性疾病有着密切的关系。
通过对大量具有不同性状的个体的基因型进行比较,就可以得出基因与性状的关系。
但是,由于大多数性状和遗传性疾病是由多个基因同时决定的,因此分析起来就十分困难,然而基因芯片技术恰恰解决了这一问题,利用其可以同时反应数千甚至更多个基因的特性,我们就可以分析基因组中不同基因与性状或疾病的关系。
Hacia等[13]用96000个寡核苷酸探针的芯片检测了乳腺癌和卵巢癌密切相关的BRCAL1基因11外显子上的突变,在15名病人中,有14人存在位点不同的突变。
Halushka等[14]用高密度芯片检测75个非洲和北欧居民的28mb的基因序列,结果获得了1480个等位基因,对人类基因中的SNP性质、图像进行了系统全面的扫描,并试图寻找基因与血压异常性疾病的关系。
2.3疾病的诊断与治疗
人类的疾病与遗传基因密切相关,基因芯片可以对遗传信息进行快速准确的分析,因此它在疾病的分子诊断中的优势是不言而喻的,就临床一种新的、强有力的分子工具。
基因芯片技术已经被应用于感染性疾病、肿瘤、耐药菌株及耐药性的检测等方面的研究。
Hacia等[15]利用96000种20mer的DNA芯片检测遗传性乳腺癌和卵巢癌基因,测准确率达到了99%,这也说明基因芯片技术能够快速准确扫描大量基因,适用于临床试验中的大量患者标本的检测。
Falus等[16]利用基因芯片技术来诊断地中海贫血患者体内β-珠蛋白基因的突变,适用于大样本量患者的筛查,高自动化而且准确性极高,他们用红色荧光来标记探针,同时用红色荧光来标记靶基因,这样完全杂交的分子会产生黄色荧光信号,突变可通过分析两种荧光强度的对比度来区分。
2.4药物研究中的应用
从经济效益来说,最大的应用领域可能是制药厂用来开发新药。
所以已经有多家制药企业介入芯片的开发。
如:
IncytePharmaaceuticalsInc.,SequanaTherapeutics,MilleniumPharmaceuticalsInc.等。
对于寻找新药来说,目标之一是应用芯片可以在基因水平上寻找药物靶标。
Gray等[17]把基因芯片药物设计和组合化学集成在一起,针对鹅去氧胆酸28p的活性位点设计新的化学制剂,检测了它们在基因组水平上对生物体的影响,就得到了其二类结构。
李铁军等[18]用基因芯片分析补阳还五汤对脑缺血再灌注损伤大鼠的基因表达影响。
结果发现,脑缺血2h再灌注24h的大鼠脑组织共筛选出差异表达基因149条,其中69条基因表达上调,80条表达下调。
脑缺血同时灌胃补阳还五汤大鼠脑组织共筛选出差异表达基因31条,其中25条基因表达上调,6条表达下调。
提示补阳还五汤对大鼠局灶性脑缺血再灌注损伤后的许多基因表达变化都有调节作用,是其保护脑缺血再灌注损伤的机制。
这足以说明,随着基因芯片技术的不断完善,在分子水平上进行药物研究必将达到一个新的高度。
3前景展望
基因芯片发展到今天不过短短几年时间,已经在诸多领域发挥出了其非凡的作用。
基因芯片既要保证其特异性,但又要保证能检测低丰度表达的基因,目前尚未很好地解决这一问题,而且在基因芯片技术中也会经常出现假阳性问题,因此,解决好这些问题是当今和今后一段时期内国内外基因芯片技术研究的焦点。
虽然基因芯片还存在着这样那样的问题,但随着研究的不断深入和技术的更加完善,基因芯片技术必将在生命科学研究领域内发挥出其无与伦比的作用。
相信随着生物信息学的进步和发展,基因芯片技术一定会进一步成熟和深化,会给越来越多的生命科学研究提供方便,会在越来越多的生物领域中发挥重要作用,从而帮助人们认识、掌握和利用生命科学的规律。
参考文献
[1]李瑶主编.基因芯片技术,北京:
化学工业出版社,2005
[2]WANGJ.FromDNAbiosensorstogenechips.NucleicAcidsResearch,2000,28(16):
3011~3016
[3]ArminEhrenreich.DNAmicroarraytechnologyforthemicrobiologist:
Anoverview.ApplMicrobiolBiotechnol,2006,73:
255~273
[4]SchenaM,ShalonD,DavisRW,BrownPO.QuantitativemonitoringofgeneexpressionpatternswithacomplementaryDNAmicroarray.Science,1995,270(5235):
467~470
[5]Sanchez-CortesS,BerenguelRM,MadejonA,Perez-MendezM.AdsorptionofpolyethyleneimineonsilvernanoparticlesanditsinteractionwithaplasmidDNA:
asurface-enhancedRamanscatteringstudy.Biomacromolecules,2002,3(4):
655~660
[6]HegdeP,QiR,AbernathyK,GayC,DharapS,GaspardR,HughesJE,SnesrudE,LeeN.AconciseguidetocDNAmicroarrayanalysis.Biotechniques,2000,29(3):
548~556
[7]BadieeA,EikenHG,SteenVM,LovlieR.EvaluationoffivedifferentcDNAlabelingmethodsformicroarraysusingspikecontrols.BMCBiotechnol,2003,3:
23
[8]李瑶主编.基因芯片数据分析与处理,北京:
化学工业出版社,2006
[9]王廷华,冯忠堂,JeanPhilippeMerlio主编.分子杂交理论与技术,北京:
科学出版社,2005
[10]KanakoKawaura,KeiichiMochida,YukikoYamazaki,YasunariOgihara.Transcriptomeanalysisofsalinitystressresponsesincommonwheatusinga22koligo-DNAmicroarray.FunctIntegrGenomics,2006,6:
132~142
[11]GirkeT,ToddJ,RuuskaS.MicroarrayanalysiaofdevelopingArabidopsisseeds.Plantphysiology,2000,124(4)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基因芯片 技术 及其 应用 研究进展