文档库 最新最全的文档下载
当前位置:文档库 › 基于选择牵连效应的标记_性状关联分析方法简介

基于选择牵连效应的标记_性状关联分析方法简介

HEREDITAS (Beijing) 2007年7月, 29(7): 881―888 ISSN 0253-9772 https://www.wendangku.net/doc/8c19087755.html,

技术与方法

收稿日期: 2006?11?23; 修回日期: 2007?02?04

基金项目: 国家重点基础研究(编号: 2004CB117202)及国家高技术研究发展计划项目(国家863计划)(编号: 20060110Z1136)资助项目[Supported by the Chinese Ministry of Science(No.2004CB117202) and Chinese National Programs for High Technology Research and Develop-ment(863 Program) (No. 20060110Z1136)]

作者简介: 游光霞(1972?), 男, 河南新县人, 博士, 研究方向: 小麦遗传多样性与育种。E-mail: youxia72@https://www.wendangku.net/doc/8c19087755.html,

通讯作者: 张学勇(1962?), 男, 甘肃临洮人, 研究员, 博士, 博士生导师, 研究方向: 小麦基因组进化、遗传多样性及基因克隆。E-mail: xueyongz@https://www.wendangku.net/doc/8c19087755.html,

致 谢:董玉琛先生、郝晨阳博士及盖红梅、贾贞同学对此文提出许多宝贵意见,作者在此一并致谢。

DOI: 10.1360/yc-007-0881

基于选择牵连效应的标记/性状关联分析方法简介

游光霞, 张学勇

中国农业科学院作物科学研究所, 农业部作物品种资源与生物技术重点实验室, 北京 100081

摘要: 许多重要农艺性状如产量、品质、抗逆性等多表现为数量性状, 是由多个基因和环境共同作用的结果, 对其遗传基础的研究比较困难。近年发展起来的以选择牵连效应分析为基础, 通过标记/性状之间的关联分析方法为这些性状的作图和遗传解析提供了新的手段, 也为作物的分子设计育种提供了新的思路, 其与QTL 作图结果互相验证、互相补充, 必将促进数量遗传学、应用基因组学和育种学的发展。文章对关联分析的思路、方法、优缺点及应用时应注意的问题进行了比较系统的介绍。 关键词: 数量性状; 连锁不平衡作图; 选择牵连效应; 关联分析

Identification of important genes by marker-trait association analy-sis based on hitchhiking mapping

YOU Guang-Xia, ZHANG Xue-Yong

Key Laboratory of Crop Germplasm Biotechnology, MOA, Institute of Crop Sciences, Chinese Academy of Agricultural Sciences , Beijing 100081, China

Abstract : Most agronomic traits such as yield, quality and stress-tolerance of crops are quantitative traits. It is not easy to

dissect genetic basis of these traits because they are controlled by multi-genes that are affected by environmental factors. Hitchhiking mapping offers a new method for identifying of loci controlling those traits and assessing their allelic variations. Marker-trait association analysis based on the hitchhiking effects will play an important role in dissection of complex traits. Combination of quantitative trait loci (QTL) mapping with marker-trait association analysis will facilitate dissection of complex traits, resulting in important information and markers for molecular breeding by design in crops. In this review, we presented a brief introduction of hitchhiking effects, marker-trait association analysis and practical considerations.

Keywords: quantitative traits; linkage disequilibrium (LD); hitchhiking effect; association analysis

不断提高作物产量、改善品质、增强品种的抗病性和适应性、提高水肥利用效率是现代育种的主要目标。品种的改良有赖于所掌握资源的数量和对其农艺性状遗传基础的了解与掌握的程度。作物的性状可分为两类, 即由单基因(或寡基因)控制的质

量性状和由多基因控制的数量性状。作物的许多重要农艺性状, 如产量、营养加工品质、抗逆性等多表现为数量性状。由于数量性状受环境的影响较大, 因此对其遗传基础的研究比较困难。随着基因组学的发展和生物统计软件的完善, 特别是分子标记技

882 HEREDITAS

(Beijing)2007第29卷

术在遗传育种领域的广泛应用, 基于选择牵连效应(Hitchhiking effects)的关联分析方法(association mapping 或association analysis)的出现为数量性状遗传的研究提供了新的思路[1]。本文对基于选择牵连效应的标记/性状关联分析方法进行了比较系统的介绍。

1选择牵连效应

1.1选择及选择牵连效应对基因组遗传多样性的影

遗传、变异和选择是推动生物进化的主要动力。在生物的自然进化中, 自然选择致使生物朝着利于物种生存和繁衍的方向发展, 而驯化和育种使作物向着既适应特定生态环境又满足人类需要的方向发展。研究表明, 在生物的进化过程中, 许多基因都经历了正向达尔文选择作用。对果蝇蛋白质的研究发现, 大约有40%以上的氨基酸替代都受到了自然选择的影响 [2,3], 人类的绝大部分氨基酸替代作用也与自然选择有关[4]。疟原虫、老鼠、狗、牛等动物的基因组都存在明显的选择烙印[5~8]。

作物基因组更是深深地留下了自然和人工选择的烙印。玉米基因组中大约有2%~5%的基因在驯化和现代育种中经历了选择 [9,10], 对1号染色体上21个基因的序列分析发现, 有3个基因座(sse1、seed2和dwarf8)经受了选择的作用[11]。在从大刍草驯化为玉米的过程中, 与株型相关的基因座tb1、储藏蛋白表达调节基因座pbf、决定胚乳颜色的基因座(Y1)和支链淀粉酶基因座su1都经受了很强的选择作用[12~17]。水稻的Waxy基因座[18]、控制小麦株高和产量的一些基因座[1,19]、控制西红柿果实大小的基因座fw2.2 [20]、花椰菜与开花相关的基因座CAULIFLOWER[21]和向日葵的含油量相关基因[22]等都留下了选择的烙印。

在生物的进化过程中, 当某一“有利”变异(或等位基因)由于选择而被保留下来(正向选择), 群体中具有此等位基因个体的比例将会不断增加, 从而成为优势变异, 并被固定下来; 相应地, 携带其它等位基因的个体则会逐渐减少以至消失, 该基因座的遗传多样性因此而急剧下降。由于连锁关系, 该基因两侧一定范围内的序列(包括中性基因座)也会因连锁而随着该“有利”等位基因的固定而被大量保留下来, 从而使其遗传多样性也大大降低。遗传学上将这种对个别基因的正向选择致使其侧翼遗传多样性降低的现象称为选择牵连效应, 也称选择搭载效应[23]。

选择牵连效应的强弱主要与被选择基因所在基因组区域的重组率和对之实施的选择压的大小有关。若该遗传区段的重组率较低, 并且所经受的选择压较高, 则产生的选择牵连效应较强; 反之, 选择牵连效应则较弱[24]。当某区段的重组率为0时, 则可造成该区段DNA序列多态性的完全丧失[25]。但由于遗传重组的存在, 这种情况一般不会发生[26]。对果蝇的研究显示, 当某基因座所经受的选择系数为10?3, 此区段的重组率为10?8(果蝇基因组重组率的平均水平)时, 受选择牵连效应的影响, 其侧翼500 bp的序列可存在10%的多态性[27]; 而当某基因座所经受的选择系数仍为10?3, 但该区的重组率下降10倍(果蝇X染色体的重组率水平)时, 其侧翼5 kb的范围内才可存在10%的多态性[28]。

一般说来, 对与生命休戚相关基因的选择所引起的选择牵连效应较强, 而对发育调控相关基因的选择引起的选择牵连效应较弱。对作物重要农艺性状基因的选择也易产生较强的选择牵连效应 [1, 26]。如水稻waxy基因两侧500 kb的基因组区域的多样性明显偏低[29]; 玉米tb1基因上游60~90 kb的基因组区域的多样性明显低于其野生祖先大刍草[30], Y1基因上游200 kb和下游600 kb的区域的多样性也受到影响[16]。此外, 选择牵连效应的强弱还与作物的授粉习性密切相关, 自花授粉作物更易在较大的连锁区域发生选择牵连效应, 因为其重组率显著低于异花授粉作物。

选择对群体遗传多样性的影响不同于迁移、遗传漂变、重组和突变等因素的作用。迁移和遗传漂变通常会造成群体整个基因组遗传多样性的改变, 而重组和突变通常只会增加靶基因座的遗传多样性, 因此它们都不会造成基因组某个染色体区段遗传多样性的急剧下降。只有选择及所伴随的选择牵连效应才会造成靶基因座及其侧翼的遗传多样性在短期内急剧下降。

1.2选择牵连效应作图(Hitchhiking mapping)

选择牵连效应通常会产生3种效应, 即显著降低被选择基因座(靶基因)两侧序列的遗传多样性[31?33], 增加该基区段内基因座之间的连锁不平衡性[5,8,34,35], 改变该区段各基因座等位变异的分布模式, 使其产生

第7期游光霞等:基于选择牵连效应的标记/性状关联分析方法简介 883

偏分布 [1,9,36,37]。这3种信号可以在后代群体中保留一定的时间。因此, 以这些“信号”为依据, 定位基因的方法被称之为选择牵连效应作图法[31,38]。其基本思路是: 进行群体全基因组扫描, 搜寻存在“选择信号”的基因组区段(或基因座), 并对之进行进一步的精细扫描定位。是寻找和鉴定重要基因组区段和优异等位变异(基因)的群体遗传学方法[1,38]。

越来越多的研究表明, 选择牵连效应作图是一种鉴定、标记和定位与生态环境适应相关基因的有效方法。Harr等[31]对非洲果蝇X染色体上一段850 kb序列分析时, 发现S06335b基因座附近的遗传多样性显著偏低, 是由于对其附近的一个与生态适应相关的有益变异的选择所造成, 并将该基因锁定在几个kb的染色体区段内。有人也利用该法, 把田鼠杀鼠灵抗性基因Rw定位在2.2 cM的基因组区段内[8]。Vigouroux等[9]利用EST-SSR在对玉米及其祖先大刍草的501个基因进行扫描时发现, 在15个存在选择迹象的SSR中, 其中7个标记附近区域存在着与玉米驯化或改良有关的QTLs, 后来证实它们是与穗型、粒重相关的主效QTLs。我们对中国小麦初选核心种质5,029份材料78个SSR基因座的分子数据分析后, 发现了一些等位变异发生严重偏分布的基因座, 存在很强的选择烙印, 关联分析证实这些基因座的附近存在着重要的农艺性状基因[1]。因此, 这种方法对作物重要农艺性状基因的鉴定与定位作图是十分有效的。

如果发现基因组某基因座的等位变异分布极不均匀, 存在着高频等位变异(也称优势等位变异), 就可以断定此基因座(或其附近区域)存在着与生态适应性或重要农艺性状相关的主效基因, 在近期经历过很强的正向选择作用[25]。但是, 并非所有我们需要定位的基因在过去都经历了很强的选择作用, 它们只是经受了一定的自然选择或人工选择作用, 因此这些基因座具有的“选择信号”通常不会十分明显, 加之其它进化因素如重组、突变、遗传漂变、迁移、群体扩张、瓶颈效应等的影响, 这些基因座所在基因组区段一般不会出现“优势等位变异”, 因而我们很难依据单基因座信息判断某基因组区段是否经历了选择, 而必须进行多基因座分析。经历了选择作用的基因组区段其遗传多样性一般呈现“V”字型变化, 即以被选择基因座为中心向两侧延伸, 遗传多样性会逐步增加, 而其基因座间的连锁不平衡(LD)应呈现不断下降的趋势。这是寻求“被选择基因”的有效途径, 并可排除其它因素对分析结果的影响[38]。

目前, 选择牵连效应作图的方法体系已基本成熟, 具体做法是: (1)选择常用的分子标记(例如SSR、EST-SSR、SNP等)对群体进行全基因组扫描; (2)利用分子数据进行多基因座分析, 寻找存在“选择信号”的基因组区段(或基因座); (3)高密度扫描候选基因组区段, 逐渐缩小目标基因(基因座)所在区域; (4)利用候选区段的基因组序列或SNP多态信息鉴定出目标基因(基因座)[1, 38, 39]。

2基于牵连效应作图的标记/性状关联分析2.1连锁不平衡(Linkage disequilibrium)及其估计

方法

关联分析是利用不同基因座等位变异(基因)间的连锁不平衡(Linkage disequilibrium, 简称LD)关系, 进行标记与性状的相关性分析, 以达到鉴定控制特定性状基因(或染色体区段)的目的。连锁不平衡是指群体内不同基因座基因间的非随机性关联, 它既包括染色体内的连锁不平衡, 又包括染色体间的连锁不平衡[39]。连锁不平衡并不等同于遗传连锁, 它们之间既有联系又有区别, 遗传连锁考虑的是两基因座间的重组率是否等于0.5, 一般来说, 同一染色体上任何两基因座间都存在一定的连锁关系。连锁不平衡考虑的是不同基因座基因之间的相关性, 只要一个基因座上的特定等位变异与另一基因座上的某等位变异同时出现的频率大于群体中随机组合几率(期望值)时, 就称这两个等位变异处于连锁不平衡状态; 当然, 当两基因座间处于紧密连锁状态时, 其等位基因间可能存在较强的连锁不平衡关系。

连锁不平衡程度通常用r2(squared allele- frequency correlations)和D′(standardized disequilib-rium coefficients)两个参数来表示, r2和D′的取值范围介于0~1。通常, r2和D′值越大, 两基因座间的连锁不平衡性越强。当r2和D′都等于1时, 两基因座处于完全连锁状态, 而当r2和D′都等于0时, 两基因座处于遗传平衡状态。在r2和D′中, D′较多地反映了重组率的影响, 而r2可同时考虑重组率和突变率的影响, 因此, r2更能客观地反映不同基因座基因间的连锁不平衡关系。假设考察的两个基因座, 其中一个具有等位变异A和a, 另一个具有B和b, 它们在群体中的等位变异频率分别为πA、πa、πB和πb,

884 HEREDITAS (Beijing) 2007 第29卷

4种可能单倍型AB 、Ab 、aB 和ab 的频率分别为πAB 、πAb 、πAb 及πab , 则r 2和D ′的计算公式为: ()2

2

A b

B B

ab D r ππππ=

; 2ab A b a B ()||(D 0)min()

ππππ′=

2ab A B a b ()||(D 0)min()

ππππ′=

其中, D ab =(πAB -πA πB ), 式中min(πA πb , πa πB )和min(πA πB , πa πb )分别表示选取πA πb 与πa πB , πA πB 与πa πb 两个数值中的较小者。在进行统计时, 频率小于5%或10%的等位变异可以忽略不计[39]。 2.2 关联分析是有效的基因作图技术

关联分析最早被用于人类致病基因的研究, 取得了巨大成就。近几年的研究结果表明, 关联分析在作物中也是一种理想的数量性状基因作图技术。2004年, Gebhardt 等

[40]

利用600份马铃薯栽培品种

的农艺性状数据和分子标记数据进行的关联分析, 将抗晚瘟病基因R1定位在0.2 cM 的基因组区段内。Thornsberry 等[41]利用92个玉米自交系的开花期数

据和Dwarf8序列多态数据进行的关联分析取得了与早期突变体分析和QTL 作图相一致的结果, 证实Dwarf8不仅控制玉米株高, 同时还影响开花期。对64个燕麦地方品种和育成品种的研究发现, RFLP 数

据与13个农艺性状数据关联分析的许多结果都可以与QTL 作图的结果联系起来[42]。

Virk 等[43]进行的关联分析为水稻的6个农艺性状(分蘖数、株

高、开花期、穗长、叶长和粒宽)找到了RAPD 标记, 发现一个可以解释其分蘖数变异49.84%的标记。Kraakman 等[44]对146个二棱大麦的AFLP/性状的

关联分析, 也找到了与产量相关联的16~18个AFLP 标记, 这些标记可解释40%~58%的变异。2002年Ivandic 等[45]在利用39个野生大麦的SSR 数据和农

艺性状数据进行关联分析时发现, 大麦的开花期与其早熟基因(一个与大麦开花相关的基因)紧密连锁的标记间存在着极显著的相关。利用32份大麦品种的春化和光周期表现数据与RFLP 数据进行的关联分析, Igartua 等[46]也取得了与预期相一致的结果。

在中国小麦的遗传多样性研究中, 我们利用关联分析的方法, 研究了19个等位变异严重偏分布的基因座(outlier loci), 结果证实了这些基因座与小麦的千粒重、

穗长、穗粒数、小穗数、有效分蘖和株高等重要农艺性状相关联, 其中Xgwm232-138、Xgwm212-98和Xgwm130-132等的降秆能力达6 cm 以上, Xgwm149-153、Xgwm212-98和Xgwm130-132对千粒重的影响都接近

2.0g, 作图效果比较理想[1]。

与QTL 作图技术相比, 关联分析具有3个明显的优势(图1): (1)不需构建作图群体——关联分析利用的群体是自然群体, 不需再人工构建,省时省力, 并有较多的群体可供利用, 而QTL 作图至少需要花费2年以上的时间去完成群体的构建[1,47~49]; (2)作图定位更精确——关联分析利用的是自然群体在长期

图1 关联分析与其他作图方法在解析率、考察等位变异数目和研究所需时间上的比较[49]

Fig. 1 Schematic comparison of various methods for identifying nucleotide polymorphism trait association in terms of resolution, research time and allele number [49]

第7期游光霞等:基于选择牵连效应的标记/性状关联分析方法简介 885

进化中所积累的重组信息, 具有较高的解析率, 可实现数量性状基因座的精细定位, 甚至可能直接定位到基因本身, 而QTL作图利用的是群体构建中配子的重组信息, 解析率较低, 一般只能将基因定位到10~30 cM的基因组区间内; (3)可同时考察一个基因座的多个等位基因——关联分析可实现对其作图群体(自然群体)一个基因座上所有等位基因的考察, 而绝大部分QTL作图所利用的群体是两亲杂交、重组自交后代, 每一基因座一般只能涉及两个等位基因。

2.3连锁不平衡对关联分析的影响

关联分析是一种以连锁不平衡为基础的作图技术, 因此对作图群体连锁不平衡状况的了解程度直接关系到关联分析结果的准确性与精确性。一般来说, 对基因座间连锁不平衡性较低的染色体区段, 在进行关联分析时需要检测较多的分子标记, 但极易找到与靶基因(或QTL基因座)紧密连锁的标记, 实现关联分析的精确作图。反之, 在连锁不平衡性高的基因组区段, 可能只需检测很少的标记就可以找到与目标基因座相关联的标记,

, 因此, 作图效果不会太理想[39,49,50]。

由于受重组、遗传漂变、选择、瓶颈效应、群体融合等因素的影响, 不同物种, 同一物种的不同群体的连锁不平衡程度是有差异的。例如, 玉米地方品种基因组连锁不平衡的平均长度为1 kb[11], 自交系则为2 kb[47], 而商用的主要自交系却高达100 kb[51]。欧裔人群基因组的连锁不平衡性要高于非洲人群[52]。

重组会增加连锁基因座间的遗传多样性, 降低基因座间的连锁不平衡性, 有利于关联分析的精确作图。而选择和瓶颈效应则会增加基因座间的连锁不平衡性, 降低关联分析的精确性; 同时, 它们同遗传漂变、群体融合一样, 能使群体产生群体结构(population structure 或 population stratification), 致使非连锁基因座间产生连锁不平衡性, 出现伪关联(spurious association)。

同一基因组的不同染色体区段基因座间的连锁不平衡性也表现很大的差异。例如, 与玉米的八氢番茄红素合成酶基因psy2存在连锁不平衡的基因组区段仅为1 kb, 而位于Y1外侧4 kb的基因座, 还与Y1存在着极强的连锁不平衡[15]。植物的授粉方式对连锁不平衡也有很强影响。一般来说, 由于异花授粉植物的重组率要普遍高于自花授粉植物, 因此, 连锁不平衡水平一般前者要低于后者。一个完全异花授粉的植物基因座间存在连锁不平衡的平均长度可为500 bp, 而在一个自交率为95%的植物基因组中, 一个基因座的连锁不平衡性可延伸到10 kb以上。例如自花授粉植物拟南芥基因组基因座间存在连锁不平衡性的平均长度可达几百kb, 而异花授粉玉米的仅为几个kb, 相差250倍[39]!因此, 异花授粉植物的关联分析效果要普遍好于自花授粉植物。但在进行作图时, 异交作物需要检测更多的分子标记。例如, 玉米必须保证每100~200 bp检测一个SNP, 而拟南芥只需每50 kb一个多态性标记即可[11]。

2. 4关联分析的方法体系

目前, 进行关联分析的方法主要有两种, 即全基因组扫描法和候选基因法。全基因组扫描法是指选取一定数量的标记对群体进行全基因组扫描, 再利用所得的分子数据与表型数据进行关联性分析。但是, 这种方法往往需要检测数量巨大的分子标记, 例如人类需要检测70,000个标记, 拟南芥需要检测2,000个, 玉米地方品种需要检测750,000个, 商用的主要玉米育种自交系也需要检测50,000个[39], 才能保证对绝大部分重要的基因实现作图, 因此其应用受到限制。尽管随着分子生物学和基因组学的发展, 大量的分子标记不断被发掘, 高通量基因型检测系统也日臻完善, 但是这种方法后期大量的数据处理也令人望而却步。不过, 这种方法对基因组连锁不平衡性较高的群体, 例如自花授粉植物群体和瓶颈效应群体, 还是比较适用的[53]。候选基因法是在对目标性状基因有一定了解的基础上, 利用关联分析对其候选基因座等位变异的作用进行验证的方法, 目前应用较多。

在进行关联分析时, 一个必需考虑和解决的问题是群体的结构。因为群体结构会增加染色体间的连锁不平衡性, 使目的性状与不相关的基因座间表现出关联, 即造成伪关联, 可能会导致作图错误。解决这一问题的办法是在假设群体结构对基因组所有基因座影响相同的情况下, 选出一定数量的与目的基因座不连锁的分子标记, 去检测它们间是否存在关联性, 并予以矫正[41,52,54]。Pritchard 等[55,56]主张: (1)在候选基因基因座的周围选取一定数量的分子标记(Ⅰ类标记), 对目标作图群体和对照群体进行扫描,

886 HEREDITAS

(Beijing) 2007 第29卷

图2 关联分析的基本程序

Fig. 2 Flow chart illustrating the steps involved in association analysis

获得分子数据; (2)进行标记/性状的关联性分析, 找到目标性状的靶基因座; (3)选出一定数量与靶基因座不连锁的分子标记(Ⅱ类标记), 对群体进行检测, 利用获得的分子数据与目的性状进行关联性分析; (4)对所得结果进行分析, 若发现性状与Ⅱ类标记间

不存在关联性, 则表示群体结构不存在, 关联作图结果有效, 否则, 则需要比较两类标记的关联性分析结果, 予以统计处理, 以消除群体结构的影响。

在实际操作中, 应尽量使用无群体结构或群体结构效应不明显的群体进行关联分析。此外大群体有利于减少不利因素对关联分析结果的影响, 提高作图能力, 并且可以增加等位基因的数量, 因此可以通过增加品种数削弱群体结构的负面影响。Long 和Langley 的研究表明, 对由500个个体组成的群体进行的关联分析, 可检测到贡献率为5%的QTL 基因座; 模拟显示加大群体样品的数量比增加检测SNP 的数量更能提高关联分析作图的解析力[57]。对玉米农艺性状的关联分析表明, 群体应尽可能包含所有表现类型, 基本能涵盖该作物的育种基因源[1,48]

目前, 进行关联分析的基本统计分析方法有方

差分析

[46]

、t -检验

[42]

和回归分析

[40,43,44,47]

等。进行关

联分析的基本程序主要包括群体的选择、群体结构的估测、表型数据的考察、候选基因多样性或与其紧密连锁标记基因座多样性的鉴定和统计关联分析(图2)[48]。

标记/性状关联分析是一种比较有效的作图方法, 可以实现数量性状的精确作图, 但还有一些问题有待进一步解决和完善, 譬如如何排除群体结构的影响。关联分析也存在作图的“盲区”, 对遗传多样性偏低群体的作图效果还不如QTL 作图[48]。关联分析中大量的数据处理急需进一步地开发、完善统计学软件。因此, 在实际研究中应该把关联分析同QTL 作图、遗传渗入系(genetic introgression lines)

等结合起来, 取长补短, 更好地实现对目标性状的精细作图。

参考文献 (References):

[1] ZHANG Xue-Yong, TONG Yi-Ping, YOU Guang-Xia,

HAO Chen-Yang, GE Hong-Mei, WANG Lan-Fen, LI Bin, DONG Yu-Shen, LI Zhen-Sheng. Hitchhiking effect map-ping: A new approach for discovering agronomic impor-tant genes. Scientia Agricultura Sinica , 2006, 39(8):

1526?1535.

张学勇, 童依平, 游光霞, 郝晨阳, 盖红梅, 王兰芬, 李滨, 董玉琛, 李振声. 选择牵连效应分析: 发掘重要基因的新思路. 中国农业科学, 2006, 39(8): 1526?1535. [2] Fay JC, Wu CI. The neutral theory in the genomic era.

Curr Opin Genet Dev , 2001, 11(6): 642?646.

[3] Smith NG, Eyre-Walker A. Adaptive protein evolution in

Drosophila . Nature , 2002, 415(6875): 1022?1024. [4] Fay JC, Wyckoff GJ, Wu CI. Positive and negative selec-

第7期游光霞等:基于选择牵连效应的标记/性状关联分析方法简介 887

tion on the human genome. Genetics, 2001, 158(3): 1227?1234.

[5] Wootton JC, Feng X, Ferdig MT, Cooper RA, Mu J, Ba-

ruch DI, Magill AJ, Su XZ. Genetic diversity and chloro-

quine selective sweeps in Plasmodium falciparum. Nature,

2002, 418(6895): 320?323.

[6] Wiener P, Burton D, Ajmone-Marsan P, Dunner S , Mom-

mens G, Nijman IJ, Rodellar C, Valentini A, Williams JL.

Signatures of selection? Patterns of microsatellite diver-

sity on a chromosome containing a selected locus. Hered-

ity, 2003, 90(5): 350?358.

[7] Pollinger JP, Bustamante CD, Fledel-Alon A, Schmutz S,

Gray MM, Wayne RK. Selective sweep mapping of genes

with large phenotypic effects. Genome Res, 2004, 15(12):

1809?1819.

[8] Kohn MH, Pelz HJ, Wayne RK. Natural selection mapping

of the warfarin-resistance gene. Proc Natl Acad Sci USA,

2000, 97(14): 7911?7915.

[9] Vigouroux Y, McMullen M, Hittinger CT, Houchins K,

Schulz L, Kresovich S, Matsuoka Y, Doebley J. Identify-

ing genes of agronomic importance in maize by screening

microsatellites for evidence of selection during domesti-

cation. Proc Natl Acad Sci USA, 2002, 99(15): 9650?

9655.

[10] Wright SI, Vroh BI, Schroeder SG, Yamasaki M, Doebley

JF, McMullen MD, Gaut BS. The effects of artificial se-

lection on the maize genome. Science, 2005, 308(5726): 1310?1314.

[11] Tenaillon MI, Sawkins MC, Anthony D, Long AD, Gaut

RL, Doebley JF, Gaut BS. Patterns of DNA sequence polymorphism along chromosome 1 of maize (Zea mays ssp. mays L.). Proc Natl Acad Sci USA, 2001, 98(16): 9161?9166.

[12] Vicente-Carbajosa J, Moose SP, Parsons RL, Schmidt RJ.

A maize zinc-finger protein binds the prolamin box in zein

gene promoters and interacts with the basic leucine zipper

transcriptional activator Opaque2. Proc Natl Acad Sci USA, 1997, 94(14): 7685?7690.

[13] Rahman A, Wong K, Jane J, Myers AM, James MG. Char-

acterization of SU1 Isoamylase, a determinant of storage

starch structure in maize. Plant Physiol, 1998, 117(2): 425?435.

[14] Jaenicke-Després V, Buckler ES, Smith BD, Gilbert MT,

Cooper A, Doebley J, P??bo S. Early allelic selection in maize as revealed by ancient DNA. Science, 2003, 302(5648): 1206?1208.

[15] Palaisa K, Morgante M, Williams M, Rafalski A. Con-

trasting effects of selection on sequence diversity and linkage disequilibrium at two phytoene synthase loci.

Plant Cell, 2003, 15(8): 1795?1806. [16] Palaisa K, Morgante M, Tingey S, Rafalski A. Long-range

patterns of diversity and linkage disequilibrium surround-

ing the maize Y1 gene are indicative of an asymmetric se-

lective sweep. Proc Natl Acad Sci USA, 2004, 101(26): 9885?9890.

[17] Gaut BS, Long AD. The lowdown on linkage disequilib-

rium. Plant Cell, 2003, 15(7): 1502?1506.

[18] Olsen KM, Purugganan MD. Molecular evidence on the

origin and evolution of glutinous rice. Genetics, 2002, 162(2): 941?950.

[19] Peng J, Richards DE, Hartley NM, Murphy GP, Devos KM,

Flintham JE, Beales J, Fish LJ, Worland AJ, Pelica F, Sudhakar D, Christou P, Snape JW, Gale MD, Harberd N .

‘Green revolution’ genes encode mutant gibberellin re-

sponse modulators. Nature, 1999, 400(6741): 256?261. [20] Frary A, Nesbitt TC, Grandillo S, Knaap E, Cong B, Liu J,

Meller J, Elber R, Alpert KB, Tanksley SD. fw2.2: A quantitative trait locus key to the evolution of tomato fruit

size. Science, 2000, 289(5476): 85?88.

[21] Purugganan MD, Boyles AL, Suddith JI. Variation and se-

lection at the CAULIFLOWER floral homeotic gene ac-

companying the evolution of domesticated Brassica oleracea.

Genetics, 2000, 155(2): 855?862.

[22] Burke JM, Tang S, Knapp SJ, Rieseberg LH. Genetic

analysis of sunflower domestication. Genetics, 2002, 161(3): 1257?1267.

[23] Maynard Smith J, Haigh J. The hitch-hiking effect of a

favorable gene. Genet Res, 1974, 23(1): 23?35.

[24] Andolfatto P. Adaptive hitchhiking effects on genome

variability. Curr Opin Genet Dev, 2001, 11(6): 635?641. [25] Fay JC, Wu CI. Hitchhiking under positive Darwinian se-

lection. Genetics, 2000, 155(3): 1405?1413.

[26] Rieseberg LH, Widmer A, Arntz AM, Burke JM. Direc-

tional selection is the primary cause of phenotypic diver-

sification. Proc Natl Acad Sci USA, 2002, 99(19): 12242?12245.

[27] Stephan W, Wiehe HE, Lenz MW. The effect of strongly

selected substitutions on neutral polymorphism-analytical

results based on diffusion theory. Theor Popul Biol, 1992,

41(2): 237?254.

[28] Aguadé M, Miyashita N, Langley CH. Reduced variation

in the yellow-achaete-scute region in natural populations

of Drosophila melanogaster. Genetics, 1989, 122(3): 607?615.

[29] Olsen KM, Caicedo AL, Polato N, McClung A, McCouch

S, Purugganan MD. Selection under domestication: Evi-

dence for a sweep in the rice waxy genomic region. Ge-

netics, 2006, 173(3): 975?983.

[30] Clark RM, Linton E, Messing J, Doebley JF. Pattern of diver-

sity in the genomic region near the maize domestication gene

888 HEREDITAS

(Beijing)2007第29卷

tb1. Proc Natl Acad Sci USA, 2004, 101(3): 700?707.

[31] Harr B, Kauer M, Schl?tterer C. Hitchhiking mapping: A

population-based fine-mapping strategy for adaptive mu-

tations in Drosophila melanogaster. Proc Natl Acad Sci USA, 2002, 99(20): 12949?12954.

[32] Schl?tterer C. A microsatellite-based multilocus screen for

the identification of local selective sweeps. Genetics, 2002, 160(2): 753?763.

[33] Nurminsky D, Aguiar DD, Bustamante CD, Hartl DL.

Chromosomal effects of rapid gene evolution in Droso-

phila melanogaster. Science, 2001, 291(5501): 128?130. [34] Hudson RR, Bailey K, Skarecky D, Wiatowski JK, Ayala

FJ. Evidence for positive selection in the superoxide dis-

mutase (Sod) region of Drosophila melanogaster. Genet-

ics, 1994, 136(4): 1329?1340.

[35] Huttley GA, Easteal S, Southey MC, Tesoriero A, Giles GG.

Adaptive evolution of the tumour suppressor BRCA1 in hu-

mans and chimpanzees. Nat Genet, 2000, 25(4): 410?413. [36] Braverman JM, Hudson RR, Kaplan NL, Langley CH,

Stephan W. The hitchhiking effect on the sites frequency spectrum of DNA polymorphisms. Genetics, 1995, 140(2):

783?796.

[37] Storz JF. Using genome scans of DNA polymorphism to

infer adaptive population divergence. Mol Ecol, 2005, 14(3): 671?688.

[38] Schl?tterer C. Hitchhiking mapping-functional genomics

from the population genetics perspective. Trend Genet,

2003, 19(1): 32?38.

[39] Flint-Garcia, Thornsberry JM, Buckler ES. Structure of

linkage disequilibrium in plants. Annu Rev Plant Biol,

2003, 54: 357?374.

[40] Gebhardt C, Ballvora A, Walkemeier B, Oberhagemann P,

Schüler K. Assessing genetic potential in germplasm col-

lections of crop plants by marker-trait association: a case study for potatoes with quantitative variation of resistance

to late blight and maturity type. Mol Breed, 2004, 13(1): 93?102.

[41] Thornsberry JM, Goodman MM, Doebley J, Stephen

Kresovich S, Nielsen D, Buckler ES. Dwarf8 polymor-

phisms associated with variation in flowering time. Nat

Genet, 2001, 28(3): 286?289.

[42] Beer SC, Siripoonwiwat W, O’Donoughue LS, Souza E,

Matthews D, Sorrells ME. Associations between molecu-

lar markers and quantitative traits in an oat germplasm pool: Can we infer linkages? J Agric Genomics,1997. [43] Virk PS, Ford-lloyd BV, Jackson MT, Pooni HS, Clemeno

TP, Newbury HJ. Predicting quantitative variation within rice germplasm using molecular markers. Heredity, 1996, 76(3): 296?304.

[44] Kraakman AT, Niks RE, Berg PM, Stan P, Eeuwijk FA.

Linkage disequilibrium mapping of yield and yield stabil-

ity in modern spring barley cultivars. Genetics, 2004,

168(1): 435?446.

[45] Ivandic V, Hackett CA, Nevo E, Keith R, Thomas WT,

Forster BP. Analysis of simple sequence repeats (SSRs) in

wild barley from the Fertile Crescent: associations with

ecology, geography and flowering time. Plant Mol Biol,

2002, 48(5-6): 511?527.

[46] Igartua E, Casas AM, Ciudad F, Montoya JL, Romagosa I.

RFLP markers associated with major genes controlling

heading date evaluated in a barley germ plasm pool. He-

redity, 1999, 83(5): 551?559.

[47] Remington DL, Thornsberry JM, Matsuoka Y, Wilson LM,

Whitt SR, Doebley J, Kresovich S, Goodman M M, Buck-

ler ES. Structure of linkage disequilibrium and phenotypic

associations in the maize genome. Proc Natl Acad Sci USA,

2001, 98(20): 11479?11484.

[48] Flint-Garcia SA, Thuillet A, Yu J, Pressoir G, Romero SM,

Mitchell SE, Doebley J, Kresovich S, Goodman MM,

Buckler ES. Maize association population: a high-resolution platform for quantitative trait locus dis-

section. Plant J, 2005, 44(6): 1054?1064.

[49] YU J, Buckler ES. Genetic association mapping and ge-

nome organization of maize. Curr Opin Biotech, 2006,

17(2): 155?160.

[50] Neale DB, Savolainen O. Association genetics of complex

traits in conifers. Trend Plant Sci, 2004, 9(7): 325?330. [51] Ching A, Caldwell KS, Jung M, Dolan M, Smith OS, Tin-

gey S, Morgante M, Rafalski AJ. SNP frequency, haplo-

type structure and linkage disequilibrium in elite maize

inbred lines. BMC Genet, 2002, 3(1): 1?14.

[52] Reich D. Linkage disequilibrium in the human genome.

Nature, 2001, 411(6834): 199?204.

[53] Palaisa KA, Morgante M, Williams M, Rafalski A. Con-

trasting effects of selection on sequence diversity and

linkage disequilibrium at two phytoene synthase loci.

Plant Cell, 2003, 15(8): 1795?1806.

[54] H?stbacka J, de la Chapelle A, Kaitila I, Sistonen P,

Weaver A, Lander E. Linkage disequilibrium mapping in

isolated founder populations: diastrophic dysplasia in

Finland. Nat Genet, 1992, 2(3): 204?211.

[55] Pritchard JK, Rosenberg NA. Use of unlinked genetic

markers to detect population stratification in association

studies. Am J Hum Genet, 1999, 65(1): 220?228.

[56] Pritchard JK, Stephens M, Donnelly P. Inference of popu-

lation structure using multilocus genotype data. Genetics,

2000, 155(2): 945?959.

[57] Long AD, Langley CH. The power of association studies to

detect the contribution of candidate genetic loci to variation

in complex traits. Genome Res, 1999, 9(8): 720?731.

相关文档
相关文档 最新文档