文档库 最新最全的文档下载
当前位置:文档库 › 个性化医疗与全基因组关联分析进展

个性化医疗与全基因组关联分析进展

个性化医疗与全基因组关联分析进展
个性化医疗与全基因组关联分析进展

万方数据

万方数据

个性化医疗与全基因组关联分析进展

作者:王慧丽

作者单位:华中科技大学文华学院 武汉430074

刊名:

按摩与康复医学(下旬刊)

英文刊名:Chinese Manipulation & Rehabilition Medicine

年,卷(期):2011,02(9)

参考文献(3条)

1.The 1000 Genomes Project Consortium A map of human genome variation from population-scale sequencing 2010

2.Amberger J;Bocchini C;Hamosh A A new face and new challenges for Online Mendelian Inheritance in Man(OMIM?)[外文期刊] 2011(05)

3.Takeuchi F;McGinnis R;Bourgeois S A genome-wide association study confirms VKORC1,CYP2C9,and CYP4F2 as principal genetic determinants of warfarin dose[外文期刊] 2009(03)

本文读者也读过(10条)

1.李淑华.薄乃秀.边俊霞.戴琪外阴癌个性化治疗与预后分析[期刊论文]-中国美容医学2011,20(z3)

2.陈国民.袁平戈.CHEN Guo-min.YUAN Ping-ge乙型肝炎病毒异质性和抗病毒治疗的个性化[期刊论文]-肝脏2008,13(4)

3.贺林通过对精神疾病的研究理解药物个性化问题[会议论文]-2005

4.孙伟药物基因组学与非小细胞肺癌个性化治疗的研究[期刊论文]-医学理论与实践2011,24(16)

5.生物保护[期刊论文]-生物学教学2006,31(10)

6.人类疾病进入个性化治疗时代[期刊论文]-世界科学2001(3)

7.闫迎军.乔群.王晓军.徐军.黄渭清.赵茹.刘志飞个性化治疗面部老化的观察研究[期刊论文]-中国实用美容整形外科杂志

2006,17(3)

8.郜恒骏.盛海辉重视药物基因组学与消化道肿瘤个性化治疗的研究[期刊论文]-国际消化病杂志2008,28(3)

9.唐燕.TANG Yan浅谈广西生物保护多样性的意义[期刊论文]-科技传播2010(21)

10.樊世斌基于基因组医学的健康管理[会议论文]-2008

本文链接:https://www.wendangku.net/doc/e013764528.html,/Periodical_amykfyx-x201109053.aspx

全基因组关联分析的原理和方法

全基因组关联分析(Genome-wide association study;GWAS)是应用基因组中 数以百万计的单核苷酸多态性(single nucleotide ploymorphism ,SNP)为分子 遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略。 随着基因组学研究以及基因芯片技术的发展,人们已通过GWAS方法发现并鉴定了大量与复杂性状相关联的遗传变异。近年来,这种方法在农业动物重要经济性状主效基因的筛查和鉴定中得到了应用。 全基因组关联方法首先在人类医学领域的研究中得到了极大的重视和应用,尤其是其在复杂疾病研究领域中的应用,使许多重要的复杂疾病的研究取得了突破性进展,因而,全基因组关联分析研究方法的设计原理得到重视。 人类的疾病分为单基因疾病和复杂性疾病。单基因疾病是指由于单个基因的突变导致的疾病,通过家系连锁分析的定位克隆方法,人们已发现了囊性纤维化、亨廷顿病等大量单基因疾病的致病基因,这些单基因的突变改变了相应的编码蛋白氨基酸序列或者产量,从而产生了符合孟德尔遗传方式的疾病表型。复杂性疾病是指由于遗传和环境因素的共同作用引起的疾病。目前已经鉴定出的与人类复杂性疾病相关联的SNP位点有439 个。全基因组关联分析技术的重大革新及其应用,极大地推动了基因组医学的发展。(2005年, Science 杂志首次报道了年龄相关性视网膜黄斑变性GWAS结果,在医学界和遗传学界引起了极大的轰动, 此后一系列GWAS陆续展开。2006 年, 波士顿大学医学院联合哈佛大学等多个研究机构报道了基于佛明翰心脏研究样本关于肥胖的GWAS结果(Herbert 等. 2006);2007 年, Saxena 等多个研究组联合报道了与2 型糖尿病( T2D ) 关联的多个位点, Samani 等则发表了冠心病GWAS结果( Samani 等. 2007); 2008 年, Barrett 等通过GWAS发现了30 个与克罗恩病( Crohns ' disrease) 相关的易感位点; 2009 年, W e is s 等通过GWAS发现了与具有高度遗传性的神经发育疾病——自闭症关联的染色体区域。我国学者则通过对12 000 多名汉族系统性红斑狼疮患者以及健康对照者的GWAS发现了5 个红斑狼疮易感基因, 并确定了4 个新的易感位点( Han 等. 2009) 。截至2009 年10 月, 已经陆续报道了关于人类身高、体重、 血压等主要性状, 以及视网膜黄斑、乳腺癌、前列腺癌、白血病、冠心病、肥胖症、糖尿病、精神分 裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的GWAS结果, 累计发表了近万篇 论文, 确定了一系列疾病发病的致病基因、相关基因、易感区域和SNP变异。) 标记基因的选择: 1)Hap Map是展示人类常见遗传变异的一个图谱, 第1 阶段完成后提供了 4 个人类种族[ Yoruban ,Northern and Western European , and Asian ( Chinese and Japanese) ] 共269 个个体基因组, 超过100 万个SNP( 约1

gwas 综述

浅谈全基因组关联分析 周小青 (湖南师范大学生命科学学院410081) 摘要全基因组关联分析(Genome-wide association study,GWAS)是应用人类基因组中数以百万计的单核苷酸多态性(single nucleotide ploymorphism,SNP)为标记进行病例对照分析,以期发现影响复杂性疾病发生的遗传特征的一种新策略。近年来,随着人类基因组计划的实施以及基因芯片技术的发展,人们已通过GWAS方法发现并鉴定了大量与人类复杂性疾病关联的遗传变异,为进一步了解控制人类复杂性疾病的遗传特征提供了重要的线索。本文介绍了近几年年来全基因组关联研究在复杂疾病研究领域内的主要发现、全基因组关联研究设计原理,总结了人类全基因组关联研究所取得成就和存在的问题,并对全基因组关联研究未来的研究重点和要解决的问题进行了展望。关键词全基因组关联分析单核苷酸多态性复杂疾病Abstract Genomewide association study (GW AS) is a novel strategy for discovering genetic basis of human complex diseases , through using millions of single nucleotide polymorphism(SNPs) as marks to conduct case-control association studies. In recent years ,following the implementation of Human Genome Project and development of Genome Chips, large number of human complex diseases associated genetic variants has been identified through GWAS method,which provides important clues

结直肠癌全基因组关联分析研究进展_张艳

收稿日期:2012-05-31修回日期:2012-11-12基金项目:国家自然科学基金(81172755);浙江省自然 科学基金(D2080011);中央高校基本科研业务费专项资金资助(2011XZZX004).作者简介:张艳(1987-),女,硕士研究生,主要从事复杂性疾病的分子流行病学研究. 通讯作者:朱益民(1968-),男,博士,教授,博士生导 师,从事复杂性疾病的分子流行病学研究;E-mail :zhuym@zju.edu.cn http :∥www.journals.zju.edu.cn /med DOI :10.3785/j.issn.1008-9292.2013.03.018 结直肠癌全基因组关联分析研究进展 张 艳1,来茂德2,朱益民 1综述 (浙江大学医学院1.流行病与卫生统计学系;2.病理学与病理生理学系,浙江杭州310058)[摘 要]结直肠癌是最常见的恶性肿瘤之一,其发生发展是环境和遗传因素共同作用的结果, 其中遗传因素在结直肠癌的发病中起重要作用。全基因组关联研究(genome- wide association studies ,GWAS )已发现了一些与结直肠癌相关联的易感位点和区域,这有助于结直肠癌遗传机制的 研究。文中对近几年来结直肠癌全基因组关联分析的研究进展作一综述,分析GWAS 结直肠癌的优点和局限性以及应用前景。 [关键词]多态性,单核苷酸;结直肠肿瘤/遗传学;疾病遗传易感性;基因组[中图分类号]R735[文献标志码]A [文章编号]1008- 9292(2013)03-0360-07Research progress on genome-wide association studies of colorectal cancer ZHANG Yan 1,LAI Maode 2,ZHU Yimin 1(1.Department of Epidemiology and Biostatistics ;2.Department of Pathology and pathophysiology ,Zhejiang University School of Medicine ,Hangzhou 310058,China )[Abstract ]Colorectal cancer (CRC ),one of the most common malignant tumors ,is caused both by environmental and genetic factors.Genetic factor plays an important role in the pathogenesis of CRC.Genome-wide association study (GWAS )is a new tool of genetic research.A series of susceptibility genes and loci of the complex diseases has been identified with GWAS strategy.In this article ,the research progress on GWAS of CRC is reviewed ,and the advantages and limitations of GWAS study as well as the prospective of its application are discussed. [Key words ]Polymorphism ,single nucleotide ;Colorectal neoplasms /genetics ;Genetic predisposition to disease ;Genome [J Zhejiang Univ (Medical Sci ),2013,42(3):360-366.] 结直肠癌(colorectal cancer , CRC )是最常见的恶性肿瘤之一, 全球结直肠癌患病人数估计有280万,每年新增病例超过100万,发病率 居于恶性肿瘤第三,死亡率处于第四位[1] 。我国随着饮食结构和生活方式的改变,结直肠癌 的发病率和死亡率呈不断上升趋势,2007年结直肠癌的发病率居恶性肿瘤第三位,死亡率居 于第五[2] 。结直肠癌已经严重威胁到居民的 第42卷第3期 2013年 浙江大学学报(医学版) JOURNAL OF ZHEJIANG UNIVERSITY (MEDICAL SCIENCES ) Vol 42No 3 2013

基于全基因组关联分析的基因(环境)交互作用统计学方法进展

万方数据

万方数据

708 图lMDR基本步骤示意图 划分为不同的分类,也就是图中的单元格。单元格中左侧直方图表示病例,右侧直方图表示对照。 第4步:在n维的每个多因子分类(单元格)中,计算病例数和对照数的比值,若病例数与对照数之比达到或超过某个阈值(例如≥1),则标为高危,反之则为低危。这样就把n维的结构降低到一维两水平。 第5步:多因子分类的集合中包含了MDR模型中各因子的组合。在所有的两因子组合中,选择错分最小的那个MDR模型,该两位点模型在所有模型中将具有最小的预测误差。 第6步:通过十重交叉验证评估模型的预测误差,一以及单元格分配时的相对误差。也就是说,模型拟合9/10的数据(训练样本),其预测误差将通过剩下1/10的数据(检验样本)来衡量。选择预测误差最小的模型作为最终的模型,取lO次检验的预测误差平均值,作为模型相对预测误差的无偏估计。由于数据分组的方式对交叉验证的结果影响较大,因此,十重交叉验证过程将重复进行10次,对n个因子可能的集合将重复进行10×10次的交叉验证。 通过十重交叉验证,在一定程度上可以避免因数据转换的偶然性,使I类错误增大而产生假阳性结果的影响。预测误差是衡量MDR模型在独立检验的亚组中预测危险状态的指标,通过十重交叉验证的亚组中每一个的预测误差的平均值来计算。根据交叉验证的预测误差的平均值,选择最佳的Tl因子模型,并根据不同的因子数重复以上过程。最终筛选出最有可能存在交互作用的基因。 MDR的优势在于不需要考虑疾病的遗传模型,它利用计算机运算速度快的优势,对多个基因进行随机组合,按照上述方法找出存在交互作用的基因位点。但当主效应存在时,用MDR方法很难得到最终模型,且同样受遗传异质性的影响;它只是一种数据挖掘方法,不是严格意义上的统计方法,还无法判断它的I类错误和检验功效。 MDR分析软件包可在http://www.epistasis.org/mdr.html免费下载。 4基于复合LD的交互作用分析法 吴学森等Ⅲ’提出基于复合LD的交互作用的分析法。该方法以病例一对照试验设计为基础,基于LD计算方法,构建完全有别于以上方法的一种新型基因间交互作用的统计分析方法:(1)用两个位点(基因)单倍型的外显率(只。)与等位基因的边际外显率的乘积(Pa?P。)的偏差(6.口=PA。一只?P8),分别定义病例组和对照组两个位点交互作用的度量.进而综合两组交互作用度量构造检验交互作用的统计量;(2)对于基因一环境交互作用模型的构建,则将环境(分类型变量)变量视为“虚拟位点”(例如E=l表示环境暴露。E=0表示即非暴露),则同样依据上述方法构建其模型。4.1基因型数据的联合概率分布及其表达对于基因之间、基因与环境之间的交互作用统计量的构建,无论是二阶或高阶情形,均至少涉及两个变量。在本研究中,均以病例一对照试验设计为基础,个体的基因数据一律用其基因型表示。无论是病例组还是对照组,均设两个位点的等位基因分别为A,a;B,b,则它们的联合基因型分布可表述为表3的形式: 则.配子的LD系数为:6.。=%一PAP。;非配子的LD系数为:乳口=九日一只-匕,其中,P.e=尸竺+PAB舳+碟+P竺;JD∥。=P竺+P竺+P::+形:。但是,当计算病例组或对照组的6.。时,需要知道双杂合子的概率P苫、P::。然而。当它们的相未知时,则无法确定其值,只能进行单倍型推断。由于单倍型推断总是存在误差,这给后面构造的检验交互作 用的统计量带来很多不确  万方数据

全基因组关联分析(GWAS)解决方案

全基因组关联分析(GWAS)解决方案 ※ 概述 全基因组关联研究(Genome-wide association study,GWAS)是用来检测全基因组范围的遗传变异与 可观测的性状之间的遗传关联的一种策略。2005年,Science杂志报道了第一篇GWAS研究——年龄相关性黄 斑变性,之后陆续出现了有关冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂症等的研究报道。截至2010年 底,单是在人类上就有1212篇GWAS文章被发表,涉及210个性状。GWAS主要基于共变法的思想,该方法是 人类进行科学思维和实践的最重要工具之一;统计学研究也表明,GWAS很长时期内都将处于蓬勃发展期(如 下图所示)。 基因型数据和表型数据的获得,随着诸多新技术的发展变得日益海量、廉价、快捷、准确和全面:如 Affymetrix和Illumina公司的SNP基因分型芯片已经可以达到2M的标记密度;便携式电子器械将产生海量的表型 数据;新一代测序技术的迅猛发展,将催生更高通量、更多类别的基因型,以及不同类别的高通量表型。基于 此,我们推出GWAS的完整解决方案,协助您一起探索生物奥秘。 ※ 实验技术流程 ※ 基于芯片的GWAS Affymetrix公司针对人类全基因组SNP检测推出多个版本检测芯片,2007年5月份,Affymetrix公司发布了 人全基因组SNP 6.0芯片,包含90多万个用于单核苷酸多态性(SNP)检测探针和更多数量的用于拷贝数变化(CNV)检测的非多态性探针。因此这种芯片可检测超过180万个位点基因组序列变异,即可用于全基因组 SNP分析,又可用于CNV分析,真正实现了一种芯片两种用途,方便研究者挖掘基因组序列变异信息。 Illumina激光共聚焦微珠芯片平台为全世界的科研用户提供了最为先进的SNP(单核苷酸多态性)研究平 台。Illumina的SNP芯片有两类,一类是基于infinium技术的全基因组SNP检测芯片(Infinium? Whole Genome Genotyping),适用于全基因组SNP分型研究及基因拷贝数变化研究,一张芯片检测几十万标签SNP位点,提 供大规模疾病基因扫描(Hap660,1M)。另一类是基于GoldenGate?特定SNP位点检测芯片,根据研究需要挑选SNP位点制作成芯片(48-1536位点),是复杂疾病基因定位的最佳工具。 罗氏NimbleGen根据人类基因组序列信息设计的2.1M超高密度CGH芯片,可以在1.1Kb分辨率下完成全基 因组检测,可有效检测人基因组中低至约5kb大小的拷贝数变异。

不同类型肿瘤的基因组研究综述

不同类型肿瘤的基因组研究 [摘要]肿瘤的发病率和死亡率逐年递增,与心血管疾病一同成为造成人群死亡的主要原因。DNA序列的变异是所有肿瘤细胞发生的重要的分子层面原因。多基因的发生低频率改变可能逐渐聚集导致肿瘤发生,但是要发现这些低频变异位点需要大规模样本进行全基因组检测,全基因组关联研究可以帮助我们实现这个目标。肿瘤基因组研究工作目前发现了许多肿瘤的致癌基因。本文将主要阐述肺癌、肝癌、乳腺癌的基因组研究。 关键词:肿瘤、全基因组关联研究、肿瘤基因组 1.全基因组关联研究 全基因组关联研究(genome-wideassociation studies,GWAS)是以微阵列技术为基础,通过对大规模的群体DNA样本进行全基因组高密度遗传标记分型,寻找与复杂疾病相关的遗传因素的研究方法。目前,GWAS研究已经在100多种肿瘤中发现了上千个低频变异位点[1]。单核苷酸多态性GWAS(single-nucleotide polymorphisms GWAS,SNP-GWAS)和少量的拷贝数变异GWAS(copy number variation GWAS,CNV-GWAS)是现阶段GWAS研究的主要方向。大量研究发现SNP在肿瘤的发生中扮演重要的角色。大量研究发现SNP在肿瘤的发生中扮演重要的角色。SNP即在不同个体的同一条染色体或同一位点的核苷酸序列中,绝大多数核苷酸序列一致,而只有一个碱基不同的现象。SNP是人类基因组DNA 序列中最常见的变异形式。在数以百万计的SNP中,对肿瘤发生和药物治疗有重大影响的SNP只占很小一部分。从整个基因组SNP,到导致氨基酸编码改变或基因表达调控改变的SNP,最后到导致蛋白质活力改变的SNP,数目都在迅速递减。联合SNPs和肿瘤表型的研究,可以为肿瘤预测、诊断和药物敏感性分析提供精确的遗传标志。拷贝数变异(copy number variation,CNV):指在人类基因组中广泛存在的,从1000bp到数百万bp范围内的缺失、插入、重复和复杂多位点变异。拷贝数变异是染色体结构性差异的一种形式。CNV通过改变基因的份数影响表达程度,打乱基因编码区结构,改变基因调控序列的位置或长度,暴露隐形突变等方式影响个体表型[2]。 2.不同类型肿瘤基因组研究

全基因组关联分析

全基因组关联分析(Genome-wide association study,GWAS) 是一种对全基因组范围内的常见遗传变异: 单核苷酸多态性(Single nucleotide polymorphism , SNP) 进行总体关联分析的方法, 即在全基因组范围内选择遗传变异进行基因分型, 比较病例和对照间每个变异频率的异差, 计算变异与疾病的关联强度, 选出最相关的变异进行验证并最终确认与疾病相关。 单核苷酸多态性(英语:Single Nucleotide Polymorphism,简称SNP,读作/snip/)指的是由单个核苷酸—A,T,C或G的改变而引起的DNA序列的改变,造成包括人类在内的物种之间染色体基因组的多样性。 在后GWAS时代,利用已有的GWAS数据在多个人群间进行meta分析已经成为一种常用的分析手 段,这不仅可以进一步扩大样本量,更重要的是提高了统计效能。GWAS meta分 析已经成功应该用在多种复杂疾病的遗传学研究,发现一批新的易感基因。 全基因组关联水平(P_meta < 5.0×10-8)罕见等位基因(MAF < 5%), 基因型填补(imputation):依据已分型位点的基因型对数据缺失位点或未分型位点进行基因型预测的方法。可用于精细定位(fine-mapping),填补已确认的关联位点附近的位点,以便评价相邻SNP位点的关联证据。加快复杂性疾病易感基因的定位。 连锁与连锁不平衡(linkage disequilibrium,LD): 连锁:如果同一条染色体上2个位点的位置比较近,则这2个位点上的等位基因倾向于一起传递给下一代。 连锁不平衡:又称等位基因关联,是指同一条染色体上,两个等位基因间的非随机相关。即当位于同一条染色体上的两个等位基因同时存在的概率大于人群中因随机分布而同时出现的概率时,就称这两个位点处于LD状态。所谓的连锁不平衡是一种遗传标记的非随机性组合。比如,一个基因有两个位点,一个位点有两种基因型,那么子代应该有2的2次方,即4种基因型。但是发现子代的基因型往往会少于4种,这就是连锁不平衡现象。这是由于两个位点距离较近引起的两个位点上的等位基因经常同时出现在同一染色体上。

GWAS原理剖析资料

全基因组关联分析(Genome-wide Association Study)是利用高通量基因分型技术,分析数以万计的单核苷酸多态性(SNPs)以及这些SNPs与临床表型和可测性状的相关性。简单地理解全基因组关联分析,GW AS就是标记辅助选择在全基因组范围上的应用,在全基因组层面上开展大样本的、多中心的、重复验证的技术,并对相关基因与复杂性状进行关联研究,从而全面地揭示出不同复杂性状的遗传机制和基础。GW AS是一项开创性的研究方法,因为它可以在以前很难达到的分辨率水平上对成千上万无关样本的全基因组进行研究,且不受与疾病有关的先验性假设的限制,GWAS在全基因组范围、零假设性较候选基因研究都迈出了重要的一步,而且随着高通量测序成本的降低,GW AS在人类疾病以及畜禽经济性状的研究上都表现出巨大的优势。 GW AS的优势除了可以一次性检测到数以万计的SNPs信息,从而提高试验效率以及检验功效以外,其还有其他两个显著的优势,主要表现在:(1)对未知信息的基因进行定位探索。传统的QTL定位仅仅限于对已知的候选基因进行分析探索,而GW AS是对全基因组的范围内的所有位点进行关联分析,因此其拥有更广泛的关联信息,相比候选基因分析GW AS 更有可能找到与性状真正关联的候选基因,因此不再受到预先假设的候选基因的限制。(2)对于GWAS在研究不同的复杂性状之前,不需要像以往的研究一样“盲目地”预设一些假定条件,而是通过在病理和对照组中,有目的地比较全基因组范围内所有SNPs的等位基因频率或者通过家系进行传递不平衡检验(TDT,Transmission disequilibrium test),从而找出与复杂性状显著相关的序列变异。到目前为止,利用全基因组关联分析研究已经挖掘出众多与各种复杂性状相关联的基因和染色体区域,在这些被新鉴定出的位点和区域中,只有小部分结果位于以前对这些性状研究的区域之中或者附近,绝大多数位于以前从未被研究过的区域,GW AS的研究结果表明以前没有被纳入研究的未知区域有可能对于复杂性状也是十分

相关文档