运用遗传标记与疾病位点开展复杂疾病互作多基因定位的研究与探讨Word格式.docx
- 文档编号:16077398
- 上传时间:2022-11-18
- 格式:DOCX
- 页数:55
- 大小:687.21KB
运用遗传标记与疾病位点开展复杂疾病互作多基因定位的研究与探讨Word格式.docx
《运用遗传标记与疾病位点开展复杂疾病互作多基因定位的研究与探讨Word格式.docx》由会员分享,可在线阅读,更多相关《运用遗传标记与疾病位点开展复杂疾病互作多基因定位的研究与探讨Word格式.docx(55页珍藏版)》请在冰豆网上搜索。
2.1引言7
2.2基本概念7
2.3连锁分析方法8
2.3.1参数分析法8
2.3.2非参数分析法9
2.4关联或连锁不平衡的分析方法10
2.4.1群体关联分析11
2.4.2以家系为基础的连锁不平衡分析11
2.5连锁与关联分析方法的比较12
2.6本章小结13
第3章复杂疾病基因定位与网络构建方法14
3.1引言14
3.2基于SNP遗传谱构造IBD谱数据14
3.2.1相关概念14
3.2.2SNP遗传谱数据15
3.2.3IBD数据的计算原理15
3.2.4S.A.G.E.遗传分析系统的功能及应用17
3.2.5IBD谱的构造17
3.3SNP协作簇提取算法(MPISC)18
3.4建立SNP虚拟互作网络19
3.4.1计算SNP与疾病的关联度19
3.4.2网络的结点和边20
3.4.3生成SNP虚拟互作网络21
3.5基因作图与互作网络构建21
3.5.1由SNP定位到gene21
3.5.2建立基因间的互作关系24
3.6本章小结24
第4章SNP协作簇的特征提取方法25
4.1模式特征提取算法的研究25
4.1.1最优搜索算法25
4.1.2次优搜索算法25
4.2MPISC算法27
4.2.1算法思想28
4.2.2知识表示(编码)29
4.2.3初始化种群30
4.2.4适应度函数计算(SVM)30
4.2.5选择算子30
4.2.6交叉算子31
4.2.7变异算子32
4.2.8加速进化32
4.3本章小结33
第5章试验结果与分析34
5.1数据来源34
5.2数据预处理34
5.2.1构造IBD谱34
5.2.2补缺失值35
5.3SNP虚拟互作网络的构建35
5.3.1SNP协作簇的提取35
5.3.2SNP协作簇的筛选标准36
5.3.3与疾病显著相关的SNP36
5.3.4SNP虚拟互作网络39
5.4互作多基因的定位及网络的构建39
5.5生物学验证39
5.6MPISC算法的评价40
5.6.1算法的搜索效率40
5.6.2参数e的选取对搜索结果的影响41
5.6.3与其它算法的比较42
5.7本章小结44
第6章复杂疾病基因作图及网络构建系统的实现45
6.1引言45
6.2系统描述45
6.2.1数据管理模块45
6.2.2数据预处理模块45
6.2.3SNP组合提取模块46
6.2.4频数统计模块48
6.2.5注释模块48
6.2.6可视化模块49
6.3系统实现所用技术51
6.4本章小结51
结论52
参考文献53
摘要
人类多数(80%)疾病属于复杂疾病,复杂疾病一般是由多个遗传基因及环境因素共同交互作用而发生发展的,并且往往具有家族聚集倾向性、遗传异质性等特征,表型与基因型间没有简单对应关系。
现代医学研究认为疾病的发生、易感性及对药物的反应差异性等复杂性状与基因突变或遗传多态性密切相关。
因此,利用遗传多态性标记对复杂疾病相关基因进行精确定位是目前研究的热点和难点。
在本文的研究中我们提出了利用单核苷酸多态性(SNPs)标记对复杂疾病基因作图(定位)及互作网络构建的新方法,并将该方法应用于GAW14发布的酒精中毒数据相关互作多基因定位问题上,取得了良好的效果。
我们对比了现有的基因定位分析方法,基于连锁分析和关联分析的基因定位方法多是针对单个疾病特征标记来研究,忽略了多个可能疾病特征标记间复杂互作的综合效应。
本文中的研究中,我们将基因定位问题看作提取疾病特征标记(比如SNPs)的模式识别问题,提出了SNP协作簇的特征提取算法MPISC,这里我们。
这是一种新的全局分析方法,这种全局分析方法能够较好地反映多基因互作、多基因和环境因素共同作用等情况。
复杂疾病是受遗传机制和环境因素共同控制的,因此在我们的复杂疾病互作多基因定位方法的研究中综合考虑到了这两方面的因素。
首先将具有家系结构的SNP遗传谱转化为IBD谱,然后基于MPISC算法提取那些IBD分布在两类受累同胞对组中显著差异的SNP协作簇。
这些SNP协作簇不仅可以定位复杂疾病相关多基因,而且反应相关基因的互作关系,可以进一步构建SNP虚拟互作网络,进而映射为基因之间的互作关系,最终完成对复杂疾病互作多基因精确定位和基因互作网络构建。
关键词 复杂疾病;
基因定位;
SNP虚拟互作网络;
基因互作网络
Abstract
Abouteightypercentofcommonhumandisordersbelongtocomplextrait.Complexdiseasesareoftencausedbytheinteractionofmanylociandenvironmentaleffects,andexhibitastrongfamilialcomponentandpopulationgeneticheterogeneity.Asimplerelationshipbetweentheobservablephenotypesandtheunderlyinggeneticeffectsdoesnotexist.Variantshavebeendeemedtoconfersusceptibilitytocommondiseasesandresponsetodrugtherapyinmodernmedicinestudy.Itadvancesachallengeforgenemappingusingpolymorphicmarkers.Consequently,inourstudyweproposeanewideaforlocatinginteractivemultiplegenesandconstructingtheirinteractivenetworkresponsibletocomplexdiseaseutilizingsingle-nucleotidepolymorphisms(SNPs).WedemonstratethepropertiesofthisnovelapproachviaanapplicationtothealcoholismdatainGAW14.
Wehavemadecomparisonsamongcurrentmethodsforgenemapping.Mostmethodsbasedonlinkageanalysisandassociationanalysisconsidersonemarkeratatimeanddoesnottakeintoaccountthecorrelatedstructureofmultiplelinkedmarkers.Inthispaper,wetreatthepuzzleforgenemappingasapatternrecognitionproblemandproposeafeatureselectionalgorithm(MPISC)tomineSNPcombinationremarkablyassociatedwithcomplextrait..Thismethodoffersusanewwayforgenemappingfromaglobalview.
Complexdiseasesarecontrolledbygeneticmechanismandenvironmentaleffects.Hence,inourmethodofgenemappingforinteractivemultiplegeneswetakeintoaccountbothofthefactors.WetransformtheprofileofSNPintoIBDprofilingandusetheMPISCalgorithmproposedtoextractSNPcombinationwithdifferentialIBDdistributionsamongtheaffectedgroupsofsibpairs.WecangeneratedummyinteractionnetworkofSNPsbasedontheminedSNPcombinations,andfurtherreflecttheinteractionsamonggenesthataremappedbytheSNPsandconstructinteractionnetworkofgenes.
Keywords complexdisease;
genemapping;
dummyinteractionnetworkofSNPs;
interactionnetworkofgenes
第1章绪论
1.1课题背景
1.1.1复杂疾病研究面临的问题
许多复杂疾病具有家族聚集倾向,而且这些疾病极少是由单基因缺陷引起的,即其并非遵循简单Mendel遗传规律[],它们往往是由多基因互作以及多基因和环境因素相互作用积累所致,因此,称之为多基因病(多基因遗传病)。
该类疾病病因复杂,而且往往具有遗传异质性,基因型与表型间没有简单对应关系,通过遗传多态性标记进行定位和鉴定复杂疾病的相关基因是目前研究的热点和难点。
(1)多基因互作及微效基因的困扰
复杂疾病的特点往往是由多个中效、微效基因共同决定疾病的复杂性状,仅一个基因的改变对疾病的发生、发展,以及对药物作用的影响不大,其中某一个或某些基因位点仅对应于该疾病的某个亚型、某个症状或体征[]。
(2)环境因素的影响
复杂疾病的发病率,即疾病外显性(Penetrance)取决于后天环境因素影响的性质及程度[]。
(3)遗传异质性
一些临床上表现相同或相似的疾病实际上可能由不同的致病基因控制,这种遗传现象称为遗传异质性。
复杂疾病实际上可能是由一组致病基因、或易感基因、或环境因素不同,而表型相似的疾病组成,如糖尿病,群体中也存在具有遗传易感性但不发病或尚未发病的亚群,缺乏对疾病形成过程中环境作用的有效控制途径,必然导致研究对象的内部异质性,从而影响疾病相关基因的研究[]。
1.1.2遗传多态性标记的发展
基因组DNA是生物体各种生理、病理性状的物质基础。
人类众多个体的基因组序列的一致性高达99%以上,但个体之间各种性状的差异仍然很大,包括对疾病的易感性、对同一疾病治疗药物的反应性等。
在同一生物集团中明显存在两种以上不同的遗传性状,而且出现频率较高,称为遗传的多态性(polymo
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 运用 遗传 标记 疾病 开展 复杂 多基因 定位 研究 探讨