文档库 最新最全的文档下载
当前位置:文档库 › 全基因组关联分析馒头比容与质构SNP标记

全基因组关联分析馒头比容与质构SNP标记

全基因组关联分析馒头比容与质构SNP标记

刘娟1陈广凤2田纪春3 吴澎1 赵子彤1杨艺1李向阳1 唐晓珍1

(山东省高校食品加工技术与质量控制重点实验室;山东农业大学食品学院1,泰安271018)(德州学院生态与景观学院2,德州253023)(山东农业大学小麦品质育种研究室;山东省作物生物学重点实验室3,

泰安271018)

摘要为从分子水平研究控制馒头比容与质构性状的基因位点,以205份不同小麦品种为实验材料,利用分布于小麦全基因组的24355个单核苷酸多态性(SNP)标记对馒头比容与质构性状进行关联分析。共检测到42个比容性状显著关联位点,其中8个极显著关联位点(P<0.0001),同时也是高遗传贡献率位点(R2>10%),2个位点至少在两个环境中稳定表达;检测到313个质构性状显著关联位点,其中31个极显著关联位点,46个高遗传贡献率位点,11个位点至少在两个环境中稳定表达。同时,发掘了5个质构性状主效关联位点,如3B染色体上黏聚性关联位点Kukri_c13329_800等。本研究所得到的这些标记为在分子水平上研究馒头品质性状提供了有价值的参考。

关键词馒头比容馒头质构单核苷酸多态性标记全基因组关联分析显著关联位点

中图分类号:TS201.1 文献标识码:A

Genome-Wide Association Analysis between SNP Markers and Specific volume and

Texture Related Traits of Steamed Bread

LIU Juan1, CHEN Guangfeng2, TIAN Jichun3, WU Peng1*, ZHAO Zitong1, YANG Yi1,

LI Xiangyang1, TANG Xiaozhen1

(Key Laboratory of Food Processing Technology and Quality Control in Shandong Province;College of Food Science and Engineering, Shandong Agricultural University1, Taian 271018) (College of Ecology and Landscape Architecture, Dezhou University2, Dezhou 253023) (State Key Laboratory of Crop Biology;Group of Quality Wheat Breading, Shandong Agricultural University3, Taian 271018)

AbstractIn order to study the gene loci that control specific volume and texture of steamed bread, 205 diverse wheat varieties were used to conduct trait-markers association using 24355 single nucleotide polymorphism (SNP) markers covered the whole genome of wheat. In the results, 42 significant markers were detected for specific volume of steamed bread distributed across 7 chromosomes of wheat, including 8highly significant markers (P<0.0001), as well as high genetic contribution markers (R2>10%), 2markers detected in two or more environment.313 significant markers were detected for texture traits of steamed bread mapped onto 15 chromosomes of wheat, including 31 highly associated markers(P<0.0001), 46 high genetic contribution markers and 11 stable markers. At the same time, 5 main sites were detected for texture of steamed bread, such as Kukri_c13329_800on chromosome 3B. These results will facilitate further researches in sensory properties in steamed bread.1

Keywordsbread specific volume,bread texture, single nucleotide polymorphism markers, genome-wide association analysis, significant markers

馒头的比容和质构性状作为影响馒头感官品质和市场销售的重要指标,一直以来都是馒头加工或品质改良研究的热点领域,目前对于馒头比容和质构的研究多倾向于原料、添加剂

基金项目:山东省重点研发计划(公益类)(2017GNC10101)

山东农业大学作物生物学国家重点实验室开放课题(2015KF14)

收稿日期:2017-10-09

作者简介:刘娟,女,1994年出生,硕士,食品科学

通讯作者:吴澎,女,1972年出生,副教授,食品安全与质量控制

田纪春,男,1953年出生,教授,小麦作物育种

以及小麦颗粒度等方面[1-6],对加工技术的研究多于基础研究。小麦是异源六倍体作物,因而对其基因的研究相较于玉米[7]、水稻[8]等较晚,但近几年检测手段的进步,使得对小麦农艺性状及品质性状的的基因研究日趋完善,但对小麦类产品如馒头、面条等感官性状的基因研究尚鲜见报道。

随着当前单核苷酸多态性(SNP)标记研究的快速发展,以及测序技术和基因芯片技术的发展,自动化程度更高的第3代SNP标记已迅速取代SSR、RFLP等传统标记,成为最具有发展潜力的分子标记[9]。SNP标记遗传稳定、数量多、分布广且易于检测的特点使其能满足全基因组关联分析对大样本、高密度标记的要求,适合于数量庞大的检测分析,可极大的提高关联分析的效力[10-11],现已广泛应用于小麦遗传连锁图谱的构建[12-14]、分子标记辅助育种[15-17]、遗传分析和物种进化等研究方面[18-20]。本研究以205份不同小麦品种为实验材料,通过全基因组关联分析以求找到与馒头比容和质构紧密关联的SNP标记,为从分子层面研究馒头品质性状提供有价值的参考。

1材料与方法

1.1实验材料与表型鉴定

205份不同小麦品种,其中203份来自于中国十个种植冬小麦的省份,包括山东138份、河南24份、河北14份、安徽8份、江苏6份、北京5份、陕西4份、甘肃2份、贵州与宁夏分别1份;剩余2份分别来自法国与墨西哥。其中,骨干亲本132份,高代品系73份,高代品系均来源于山东省。

在2014年和2015年间分别将试验材料种植于山东泰安(山东农业大学)和山东德州(德州市农业科学院),播种时每份材料播种三行,行长2 m,行间距0.25 m,均匀播种70粒。在小麦生长期间,对其进行常规的田间管理,没有出现严重的病虫害及倒伏现象。待小麦成熟后将其进行收割、标记并研磨成粉。馒头的制作参考周素梅[21]等人的方法并略做改进。待馒头冷却后开始测量馒头的质量、体积与质构。馒头的体积采用菜籽置换法测量,体积与质量之比即为比容[22];体积测量结束后,用切割机将馒头沿竖直方向平行切割成三片,取中间片于质构仪上,在TPA模式下采用P35探头进行压缩实验[23],测试前速率3.00 mm/s,测试速率1.0 mm/s,测试后速率1.0 mm/s,下压程度50%。第一次压缩结束后,探头回到起始位置,等待3s后进行第二次压缩。并采用SPSS18.0 软件统计分析所得数据。

1.2 DNA提取和90K SNP 芯片分型

根据稍作改动的Triticarte (https://www.wendangku.net/doc/5818785600.html,.au)方法提取小麦幼叶中DNA,并用0.8%的琼脂糖电泳对提取到的DNA进行浓度与质量的检测。委托加利弗尼亚大学生物技术检测中心,使用最新开发的90K基因芯片(含81587个SNP)对实验材料DNA进行分型,并利用GenomeStudio软件对分型结果进行读取及保存。为确保得到的基因数据的质量,用PLINK v1.07[24]对基因数据进行处理,选取检出率大于0.8和低频基因频率大于0.05的SNP 标记,最终得到24355个SNP用于馒头比容和质构关联分析。

在参照Wang[25]等整合的遗传图谱的基础上,得到本实验群体的SNP复合遗传图谱信息。(表1)。

表1 SNP复合遗传图谱信息

1.3性状与标记间的关联分析

运用TASSEL 3.0软件中的MLM模型对馒头比容及质构性状与标记之间进行关联分析,当结果中关联标记的P<0.001时,认为该标记与目标性状存在显著关联;P<0.0001时,认为标记与目标性状存在极显著关联,当标记在两个及以上环境中同时被检测到则认为其是目标性状相对稳定的关联位点。

2.结果与分析

2.1比容与质构性状表型变异分析

四个环境下,小麦粉馒头比容与质构表型数据如表2所示。各性状均有较大的变异系数,表2中,E4环境下馒头比容性状的变异系数最大(19.54%),E1环境下变异系数最小(8.45%);表3中,E1环境黏着性变异系数最大(58.50%),弹性变异系数最小(3.21%)。除个别环境外,各性状的偏度和峰度的绝对值大部分都小于1,符合正态分布,变现为数量性状遗传,适合进行关联分析。

表2四个环境下馒头比容、质构在群体中的表型数据

性状环境最小值最大值范围均值±标准差CV/% 偏度峰度比容E1 1.55 2.91 1.36 2.40±0.20 8.45 -0.179 1.017 E2 1.82 3.38 1.56 2.76±0.28 10.22 -0.727 0.553

E3 1.33 2.66 1.34 1.95±0.28 14.46 0.033 -0.501

E4 1.02 3.19 2.17 1.96±0.38 19.54 0.096 -0.259 硬度E1 1989.68 11733.98 9744.31 5551.34±2019.18 36.55 0.76 0.355 E2 1989.68 10334.01 8344.33 4971.16±1627.60 32.74 0.4 0.109

E3 718.08 11693.88 10975.8 4932.76±2017.13 40.89 0.403 0.706

E4 213.69 9031.89 8818.2 4055.87±1860.59 45.87 0.232 -0.377 黏着性E1 0.07 34.67 34.6 5.87±3.44 58.50 1.152 1.136 E2 0.01 34.67 34.67 6.06±3.04 50.04 1.241 0.701

E3 0.02 47.89 47.87 5.39±4.36 41.88 0.936 1.139

E4 0.09 48.89 48.8 5.12±5.08 38.05 0.814 0.95 弹性E1 0.75 0.97 0.22 0.92±0.03 3.21 -1.348 1.377 E2 0.67 0.97 0.3 0.92±0.05 5.92 -1.561 1.896

E3 0.19 2.37 2.18 0.88±0.28 31.34 1.983 1.109

E4 0.11 1.87 1.76 0.82±0.22 26.69 -1.243 0.973 黏聚性E1 0.61 0.82 0.22 0.74±0.05 7.11 -0.608 -0.658 E2 0.54 0.83 0.29 0.75±0.04 5.69 -1.579 4.803

E3 0.58 0.94 0.36 0.747±0.07 9.31 1.035 1.144

E4 0.14 0.98 0.84 0.76±0.08 10.40 -1.946 1.302 胶著性E1 1604.28 7946.13 6341.85 4044.45±1231.72 30.45 0.535 0.377 E2 1604.28 7097.2 5492.93 3721.19±1073.51 28.85 0.144 -0.378

E3 548.92 8102.41 7553.49 3574.79±1312.60 36.72 0.293 0.977

E4 191.81 6326.79 6134.98 3043.64±1267.87 41.66 0.161 -0.278 咀嚼性E1 1543.19 7340.96 5797.78 3752.17±1147.58 30.58 0.569 0.291 E2 1543.19 6486.19 4943 3432.67±1000.27 29.14 0.187 -0.431

E3 129.83 7173.33 7043.51 3189.95±1297.82 40.68 -0.15 0.549

E4 20.72 8515.79 8495.08 2678.41±1325.78 49.50 0.33 0.312 回复性E1 0.26 0.46 0.21 0.36±0.06 15.02 -0.243 -0.763 E2 0.23 0.46 0.24 0.38±0.04 11.58 -0.653 0.745

E3 0.26 0.63 0.36 0.38±0.08 21.65 1.3 1.22

E4 0.1 0.67 0.57 0.40±0.09 21.88 1.021 1.912 注:E1:2014年泰安点;E2:2014年德州点;E3:2015年泰安点;E4:2015年德州点,余同。

2.2SNP标记与馒头比容、质构相关性状的关联分析

通过对四个环境中小麦粉馒头性状与标记间的关联分析,共得到42个比容性状显著关联位点(P<0.001),分布于小麦21条染色体中的16条,单个位点表型遗传变异贡献率为6.57~18.31%。其中8个极显著关联位点(P<0.0001),同时也是高遗传贡献率位点(R2>10%),2个相对稳定位点(在两个及以上环境中表达),分布于小麦的2A、2B、2D、3A、4B、6B、7A染色体上。位于4B染色体上的极显著关联位点Tdurum_contig4974_355遗传贡献率最大,可解释17.10%的表型变异,但只在E4环境中检测到(表3)。

四个环境下共检测到313个质构性状显著关联位点,分布于小麦的17条染色体上,单个位点表型变异贡献率为5.49~25.14%。其中31个极显著(P<0.0001)关联位点,11个相对稳定关联位点,46个高遗传贡献率位点,分布于小麦的15条染色体上(1A、1B、2A、2B、2D、3A、3B、4A、5A、5B、5D、6A、7A、7B 和7D)。同时,检测到5个极显著位点,如3B染色体上黏聚性关联位点Kukri_c13329_800、7B染色体上咀嚼性关联位点Tdurum_contig61884_836等,在两个环境中表达,且贡献率大于10%,为主效关联位点。

表3 四个环境中与馒头比容、质构性状相关的极显著(P<0.0001)、高贡献率和稳定位点

性状标记染色体位置R2/% P值环境

比容BobWhite_c31163_694 2A 143 12.77 2.78E-05 E1 Kukri_c58096_480 2B 134 9.51,8.71 3.46E-04,2.66E-04 E1,E4

Kukri_c13329_800 2D 37 11.97 1.16E-05 E4

GENE-1820_661 3A 91 10.89 3.37E-05 E1

Ku_c73010_143 3A 91 10.89 3.37E-05 E1

Excalibur_c41557_147 3A 89 10.43 4.87E-05 E1

Tdurum_contig4974_355 4B 61 17.10 2.04E-07 E4

wsnp_Ra_c30621_39857295 6B 24 13.71 3.78E-06 E1

wsnp_Ex_c14654_22713386 7A 42 18.31 3.75E-08 E4

tplb0027d07_633 7A 60 9.19,8.53 1.31E-04,2.41E-04 E1,E4 黏着性Kukri_c59535_186 1B 161 13.67 2.41E-05 E3 Kukri_c79633_88 2A 163 14.77,10.14 6.48E-05,5.43E-05 E1,E2

Kukri_c102346_668 2A 48 13.51 2.26E-06 E4

GENE-0592_268 2B 57 12.89 3.28E-04 E3

RAC875_rep_c107702_75 2B 161 10.46 4.06E-04 E2

Kukri_c19434_936 2D 9 13.51 2.26E-06 E4

BS00022276_51 2D 18 10.12 7.80E-05 E3

Kukri_c1526_666 2D 97 14.48 1.38E-04 E2

BS00110564_51 3A 129 10.35 4.01E-04 E2

RFL_Contig5418_347 3B 70 25.14 1.72E-09 E3

wsnp_Ex_c40060_47197713 3B 70 9.15,8.53 4.51E-04,2.71E-04 E2,E3 RAC875_c58159_989 3B 71 19.77 6.57E-08 E3

Tdurum_contig23273_315 5B 111 12.43,11.32 5.27E-06,3.68E-05 E3,E4 GENE-2794_534 5B 110 11.36 2.98E-05 E3

BS00084907_51 5B 144 10.26 7.00E-05 E3

BS00067911_51 7A 232 11.60 4.19E-05 E4

wsnp_JD_c13673_13606066 7B 136 10.51 2.69E-05 E4

BS00023069_51 7B 171 10.42 3.57E-04 E2 咀嚼性Excalibur_c4948_90 7B 145 14.61 4.12E-05 E2 Tdurum_contig61884_836 7B 148 13.38,10.41 4.35E-05,2.52E-05 E1,E2 IAAV8836 7B 144 13.24 4.75E-05 E2

BS00041585_51 2B 70 9.70 1.03E-05 E1 黏聚性BS00065168_51 1A 17 10.93 9.99E-04 E2 Kukri_c13329_800 2D 37 13.80,12.75 5.99E-06,5.35E-06 E1,E4 Tdurum_contig5009_349 3A 182 10.36 4.87E-04 E2

RFL_Contig3008_1370 3B 9 10.74 5.68E-04 E3

Tdurum_contig45817_193 3B 106 9.64 9.72E-05 E1

BS00067744_51 5B 101 8.93,7.83 2.37E-05,4.79E-04 E3,E4 RAC875_c27696_718 7A 136 11.85 1.50E-05 E2

Tdurum_contig56175_791 7A 136 9.35 7.07E-05 E2 硬度BS00041585_51 2B 70 10.51 5.82E-05 E1 IAAV4206 2B 70 10.26 6.28E-05 E1

RAC875_c12766_461 2B 70 10.26 6.28E-05 E1

IAAV2277 2B 70 10.17 6.79E-05 E1

BobWhite_c8436_391 4A 153 8.62,7.49 3.21E-04,6.85E-04 E1,E4 Tdurum_contig61884_836 7B 148 13.49 4.59E-05 E2

Excalibur_c4948_90 7B 145 13.03 1.00E-04 E2

IAAV8836 7B 144 11.97 1.16E-04 E2

BS00066342_51 7B 155 9.43,7.31 7.65E-05,8.64E-04 E2,E3 弹性wsnp_Ex_c10595_17291999 1A 71 10.42 6.13E-05 E3 Ex_c21450_396 1A 71 9.86 9.46E-05 E3

Ra_c69908_1877 1A 71 9.82 9.72E-05 E3

Ex_c3201_1046 1A 140 10.49 3.39E-04 E2

wsnp_Ex_c59373_60260876 2A 83 10.02 4.54E-04 E2

IAAV1535 2B 145 13.66 5.06E-05 E2

Tdurum_contig10048_61 2B 146 10.07 4.44E-04 E2

Tdurum_contig52627_726 2B 146 10.07 4.44E-04 E2

BobWhite_c12911_788 2B 147 10.07 4.44E-04 E2

wsnp_CAP11_c3226_1588070 2B 147 10.07 4.44E-04 E2

Excalibur_c4964_275 5A 39 10.13 4.31E-04 E2

BS00099401_51 6A 141 10.47 3.44E-04 E2

GENE-4717_796 7D 193 10.03 4.56E-04 E2

回复性Kukri_c13329_800 2D 37 13.10 9.39E-06 E1 RAC875_c5427_447 3B 92 10.58 3.58E-04 E2

RAC875_c27696_718 7A 136 9.32,7.63 7.11-04,5.87E-04 E2,E4 胶著性Ex_c5445_981 5A 16 6.19,5.49 4.92E-04,9.49E-04 E1,E2 BS00000020_51 5D 103 15.01,11.78 2.62E-11,4.44E-10 E1,E2

3.讨论

标记本身的特性决定了其在遗传连锁图谱上的分布密度,进而对其所定位的QTL产生影响,本研究整合的遗传连锁图谱全长3674.16cM,标记间平均距离0.15 cM,且标记的数量远超过4000个。因此,该图谱具有分子标记数目较多,覆盖的遗传距离长,标记间平均距离小等突出特点,且该图谱的建成将有助于鉴别和挖掘优异的遗传变异位点。在所有的标记中,B染色体组检测到的标记数目最多,A染色体组次之,D染色体组标记数目最少,这可能是由于小麦D染色体组具有相对较高的保守性造成的[26]。

本研究利用SNP标记对馒头比容和质构相关性状进行关联分析,采用MLM模型,将协变量(每个品种个体的Q值、亲缘关系)纳入回归分析,并设置较高的阈值(P≤0.0001)来防止因亲缘关系和群体分层所引发的伪关联,从而确保实验结果的可信度。在不同环境中所得到的位点常会出现不一致的情况,或许是由于环境的作用,这是多基因控制的数量性状的首要特点。有些位点在两个及以上环境中同时被检测到,被称作相对稳定的关联位点。与SSR标记相比,SNP标记与功能基因的关联更加紧密,这是由于SNP标记不仅在小麦基因中有遗传稳定、数量多等特点,而且有些基因内的SNP会对蛋白质的结构和表达有直接影响[27]。本研究通过关联分析得到2个比容性状相对稳定位点,11个质构性状相对稳定位点,如E1、E4环境中同时检测到的与比容显著关联的位点tplb0027d07_633, E1、E4个环境中检测到的与硬度关联的位点BobWhite_c8436_391等,可作为参考应用于小麦分子标记辅助育种。

4.结论

利用分布于小麦全基因组的24355个SNP位点对205份不同小麦粉馒头的比容和质构性状进行全基因组关联分析。检测到42个馒头比容性状显著关联位点,其中8个极显著(P<0.0001)且高遗传贡献位点,2个相对稳定关联位点,分布于小麦的7条染色体上。检测到313个馒头质构性状显著关联位点,有31个极显著(P<0.0001)关联位点,11个相对稳定关联位点,46个高遗传贡献率位点(R2>10%),分布于小麦的15条染色体上。同时,检测到5个质构性状主效关联位点。本实验所得到的这些标记对从分子水平深入研究小麦粉的品质性状具有重要意义,并为小麦分子育种提供一定参考。

参考文献

[1]魏春红,李春辉,鹿保鑫,等. 不同粒度小米粉性质及对馒头品质的影响[J]. 粮食与油脂,2017,30(07):65-68

WEI Chunhong,LI Chunhui,LU Baoxin,et al. Characteristics of millet flour with different size and its influence on the quality of steamed bread[J]. Cereals & Oils,2017,30(07):65-68

[2]程晶晶,王军,周小青,等. 绿豆超微全粉对馒头品质的影响[J]. 食品工业,2017,38(04):113-116

CHENG Jingjing,WANG Jun,ZHOU Xiaoqing,et al. Effect of superfine grinded whole mung bean powder on quality of steamed bread[J].The Food Industry,2017,38(04):113-116

[3]赵玲玲,王文亮,弓志青,等. 杏鲍菇粉对小麦面团、馒头质构及品质的影响[J]. 食品科技,2017,42 (06):147-151

ZHAO Lingling,WANG Wenliang,GONG Zhiqing,et al. Effect of pleurotus eryngii powder on quality and textural properties of wheat dough and chinese steamed bread[J]. Food Science and Technology,2017,42 (06):147-151

[4]王军,程晶晶,杨璐,等. 糙米超微全粉对馒头品质的影响[J]. 食品与发酵工业,2017,43(06):219-224

WANG Jun,CHENG Jingjing,YANG Lu,et al. Effect of brown rice super powder on quality of steamed bread [J]. Food and Fermentation Industries,2017,42 (06):147-151

[5]张苗,木泰华,韩俊娟. 甘薯膳食纤维对馒头品质及老化的影响[J]. 江苏师范大学学报(自然科学版),2016,34(04):20-24

ZHANG Miao,MU Taihua,HAN Junyan. Effect of potato dietary fiber on the quality and aging of steamed bread[J]. Journal of Jiangsu Normal University(Natural Science Edition),2016,34(04):20-24

[6]张煌,杨晓露,李逸群,等. 压延工艺对面团及馒头基本指标的影响[J]. 食品研究与开发,2016,37(17):1-5

ZHANG Huang,YANG Xiaolu,LI Yiqun,et al. The effects of sheeting process on the basic indicators of dough and steamed bread[J]. Food Research and Development,2016,37(17):1-5

[7] Wilson L M,Whitt S R,Ibanez A M,et al. Dissection of maize kernel composition and starch production by candidate gene associations[J]. Plant Cell,2004,16:2719-2733

[8] Huang X H,Wei X H,Sang T,et al. Genome-wide association studies of 14 agronomic traits in rice landraces[J]. Nature Genetics,2010,42:961-967

[9] Mick E,McGough J J,Middleton F A,et al. Genome-wide association study of blood pressure response to methylphenidate treatment of attention-deficit/hyperactivity disorder[J]. Progress in Neuro -Psychopharmacology & Biological Psychiatry,2011,35:466–472

[10]Altmann T,Roder MS. SNP identification in crop plants[J]. Current Opinion in Plant Biology,2009,12:211–217

[11]陈秋玲,高建明,罗峰,等. 分子标记技术在禾本科作物基因定位上的研究进展[J].中国农学通报,2010,26(9):42–48

CHEN Qiuling,GAO Jianming,LUO Feng,et al. Research and development of molecular marker technologies for gene mapping of gramineous crops[J]. Chines Agriculture Science bulletin,2010,26(9):42–48

[12]Colasuonno P,Gadaleta A,Giancaspro A,et al. Development of a high-density SNP-based linkage map and detection of yellow pigment content QTLs in durum wheat[J]. Molecular Breeding,2014,34(4):1563-1578 [13]Zanke C,Ling J,Plieske J,et al. Genetic architecture of main effect,QTL for heading date in European winter wheat[J]. Front Plant Science,2014,5:217

[14]Raz A,Moran N,Tamar E,et al. Ultra-dense genetic map of durum wheat×wild emmer wheat developed using

the 90K iSelect SNP genotyping assay[J]. Molecular Breeding,2014,34(4):1594-1592

[15]Gao L,Kielsmeier-Cook J,Bajgain P,et al. Development of genotyping by sequencing (GBS)-and array-derived SNP markers for stem rust resistance gene Sr42[J]. Molecular Breeding,2015,35(5):207-215 [16]Lin M,Cai S,Wang S,et al. Genotyping-by-sequencing (GBS) identified SNP tightly linked to QTL for pre-harvest sprouting resistance[J]. Theoretical and Applied Genetics,2015,128(7):1385–1395

[17]Tan MK,El-Bouhssini M,Emebiri L,et al. A SNP marker for the selection of HfrDrd,a Hessian fly-response gene in wheat [J].Molecular Breeding,2015,35(7):216

[18]Mangini G,Margiotta B,Marcotuli I,et al. Genetic diversity and phenetic analysis in wheat (Triticum

turgidum subsp. durum and Triticum aestivum subsp. aestivum) landraces based on SNP markers[J].Genetic Resources and Crop Evolution,2016,64(6):1-12

[19]Ren J,Chen L,Sun D,et al. SNP-revealed genetic diversity in wild emmer wheat correlates with ecological factors[J]. BMC Evolutionary Biology,2013,13(3):169-176

[20]曹廷杰,谢菁忠,吴秋红,等. 河南省近年审定小麦品种基于系谱和SNP标记的遗传多样性分析[J].作物学报,2015,41(02):197-206

CAO Yanjie,XIE Jingzhong,WU Qiuhong,et al. Genetic Diversity of Registered Wheat Varieties in Henan Province Based on Pedigree and Single-Nucleotide Polymorphism[J]. Acta Agronomica Sinica,2015,41(02):197-206

[21]周素梅,张国增,张梅红,等.北方馒头实验室制作与评价[J].科技导报,2011,29(29):75-79

ZHOU Sumei,ZHANG Guozeng,ZHANG Meihong,et al. Processing procedure in the laboratory and quality evaluation method of northern style Chinese steamed bread[J].Science&Technology Review,2011,29(29):75-79

[22]张国权,叶楠,张桂英,等. 馒头评价体系构建[J]. 中国粮油学报,2011,26(7):10-15

ZHANG Guoquan,YE Nan,ZHANG Guiying,et al. Construction of Quality Evaluation System for Steamed Bread[J]. Journal of the Chinese Cereals and Oils Association,2011,26(7):10-15

[23]郝春明. 全麦粉的制备及其品质特性研究[D]. 郑州:河南工业大学,2012

HAO Chunming. Study on the preparation and quality characteristics of whole wheat flour[D]. Zhengzhou:Henan technology University, 2012

[24]Purcell S,Neale B,Todd-Brown K,et al. PLINK:a tool set for whole-genome association and population-based linkage analyses[J]. American Journal of Human Genetics,2007,81(6):559–575 [25]Wang SC,Wong D,Forrest K,et al. Characterization of polyploidy wheat genomic diversity using a high-density 90000 single nucleotide polymorphism array[J]. Plant BiotechJournal,2014,12(5):787-796 [26] 师翠兰,郑菲菲,陈建省,等. 小麦山农01-35×藁城9411重组自交系遗传图谱构建及粒重QTL分析[J]. 作物学报,2012,38 (8):1369-1377

SHI Cuilan,ZHENG Feifei,CHEN Jiansheng,et al. Construction of genetic map and analysis of QTLs for grain weight using a RIL population derived from Shandong 01-35×Gaocheng 9411[J]. Acta Agronomica Sinica,2012,38 (8):1369-1377

[27] Lu Y L,Yan J B,Guimaraes C T,et al. Molecular characterization of global maize breeding germplasm based on genome-wide single nucleotide polymorphisms. Theoretical and Applied Genetics,2009,120(1):93-115.

全基因组关联分析的原理和方法

全基因组关联分析(Genome-wide association study;GWAS)是应用基因组中 数以百万计的单核苷酸多态性(single nucleotide ploymorphism ,SNP)为分子 遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略。 随着基因组学研究以及基因芯片技术的发展,人们已通过GWAS方法发现并鉴定了大量与复杂性状相关联的遗传变异。近年来,这种方法在农业动物重要经济性状主效基因的筛查和鉴定中得到了应用。 全基因组关联方法首先在人类医学领域的研究中得到了极大的重视和应用,尤其是其在复杂疾病研究领域中的应用,使许多重要的复杂疾病的研究取得了突破性进展,因而,全基因组关联分析研究方法的设计原理得到重视。 人类的疾病分为单基因疾病和复杂性疾病。单基因疾病是指由于单个基因的突变导致的疾病,通过家系连锁分析的定位克隆方法,人们已发现了囊性纤维化、亨廷顿病等大量单基因疾病的致病基因,这些单基因的突变改变了相应的编码蛋白氨基酸序列或者产量,从而产生了符合孟德尔遗传方式的疾病表型。复杂性疾病是指由于遗传和环境因素的共同作用引起的疾病。目前已经鉴定出的与人类复杂性疾病相关联的SNP位点有439 个。全基因组关联分析技术的重大革新及其应用,极大地推动了基因组医学的发展。(2005年, Science 杂志首次报道了年龄相关性视网膜黄斑变性GWAS结果,在医学界和遗传学界引起了极大的轰动, 此后一系列GWAS陆续展开。2006 年, 波士顿大学医学院联合哈佛大学等多个研究机构报道了基于佛明翰心脏研究样本关于肥胖的GWAS结果(Herbert 等. 2006);2007 年, Saxena 等多个研究组联合报道了与2 型糖尿病( T2D ) 关联的多个位点, Samani 等则发表了冠心病GWAS结果( Samani 等. 2007); 2008 年, Barrett 等通过GWAS发现了30 个与克罗恩病( Crohns ' disrease) 相关的易感位点; 2009 年, W e is s 等通过GWAS发现了与具有高度遗传性的神经发育疾病——自闭症关联的染色体区域。我国学者则通过对12 000 多名汉族系统性红斑狼疮患者以及健康对照者的GWAS发现了5 个红斑狼疮易感基因, 并确定了4 个新的易感位点( Han 等. 2009) 。截至2009 年10 月, 已经陆续报道了关于人类身高、体重、 血压等主要性状, 以及视网膜黄斑、乳腺癌、前列腺癌、白血病、冠心病、肥胖症、糖尿病、精神分 裂症、风湿性关节炎等几十种威胁人类健康的常见疾病的GWAS结果, 累计发表了近万篇 论文, 确定了一系列疾病发病的致病基因、相关基因、易感区域和SNP变异。) 标记基因的选择: 1)Hap Map是展示人类常见遗传变异的一个图谱, 第1 阶段完成后提供了 4 个人类种族[ Yoruban ,Northern and Western European , and Asian ( Chinese and Japanese) ] 共269 个个体基因组, 超过100 万个SNP( 约1

全基因组关联分析(GWAS)解决方案

全基因组关联分析(GWAS)解决方案 ※ 概述 全基因组关联研究(Genome-wide association study,GWAS)是用来检测全基因组范围的遗传变异与 可观测的性状之间的遗传关联的一种策略。2005年,Science杂志报道了第一篇GWAS研究——年龄相关性黄 斑变性,之后陆续出现了有关冠心病、肥胖、2型糖尿病、甘油三酯、精神分裂症等的研究报道。截至2010年 底,单是在人类上就有1212篇GWAS文章被发表,涉及210个性状。GWAS主要基于共变法的思想,该方法是 人类进行科学思维和实践的最重要工具之一;统计学研究也表明,GWAS很长时期内都将处于蓬勃发展期(如 下图所示)。 基因型数据和表型数据的获得,随着诸多新技术的发展变得日益海量、廉价、快捷、准确和全面:如 Affymetrix和Illumina公司的SNP基因分型芯片已经可以达到2M的标记密度;便携式电子器械将产生海量的表型 数据;新一代测序技术的迅猛发展,将催生更高通量、更多类别的基因型,以及不同类别的高通量表型。基于 此,我们推出GWAS的完整解决方案,协助您一起探索生物奥秘。 ※ 实验技术流程 ※ 基于芯片的GWAS Affymetrix公司针对人类全基因组SNP检测推出多个版本检测芯片,2007年5月份,Affymetrix公司发布了 人全基因组SNP 6.0芯片,包含90多万个用于单核苷酸多态性(SNP)检测探针和更多数量的用于拷贝数变化(CNV)检测的非多态性探针。因此这种芯片可检测超过180万个位点基因组序列变异,即可用于全基因组 SNP分析,又可用于CNV分析,真正实现了一种芯片两种用途,方便研究者挖掘基因组序列变异信息。 Illumina激光共聚焦微珠芯片平台为全世界的科研用户提供了最为先进的SNP(单核苷酸多态性)研究平 台。Illumina的SNP芯片有两类,一类是基于infinium技术的全基因组SNP检测芯片(Infinium? Whole Genome Genotyping),适用于全基因组SNP分型研究及基因拷贝数变化研究,一张芯片检测几十万标签SNP位点,提 供大规模疾病基因扫描(Hap660,1M)。另一类是基于GoldenGate?特定SNP位点检测芯片,根据研究需要挑选SNP位点制作成芯片(48-1536位点),是复杂疾病基因定位的最佳工具。 罗氏NimbleGen根据人类基因组序列信息设计的2.1M超高密度CGH芯片,可以在1.1Kb分辨率下完成全基 因组检测,可有效检测人基因组中低至约5kb大小的拷贝数变异。

全基因组关联分析

全基因组关联分析(Genome-wide association study,GWAS) 是一种对全基因组范围内的常见遗传变异: 单核苷酸多态性(Single nucleotide polymorphism , SNP) 进行总体关联分析的方法, 即在全基因组范围内选择遗传变异进行基因分型, 比较病例和对照间每个变异频率的异差, 计算变异与疾病的关联强度, 选出最相关的变异进行验证并最终确认与疾病相关。 单核苷酸多态性(英语:Single Nucleotide Polymorphism,简称SNP,读作/snip/)指的是由单个核苷酸—A,T,C或G的改变而引起的DNA序列的改变,造成包括人类在内的物种之间染色体基因组的多样性。 在后GWAS时代,利用已有的GWAS数据在多个人群间进行meta分析已经成为一种常用的分析手 段,这不仅可以进一步扩大样本量,更重要的是提高了统计效能。GWAS meta分 析已经成功应该用在多种复杂疾病的遗传学研究,发现一批新的易感基因。 全基因组关联水平(P_meta < 5.0×10-8)罕见等位基因(MAF < 5%), 基因型填补(imputation):依据已分型位点的基因型对数据缺失位点或未分型位点进行基因型预测的方法。可用于精细定位(fine-mapping),填补已确认的关联位点附近的位点,以便评价相邻SNP位点的关联证据。加快复杂性疾病易感基因的定位。 连锁与连锁不平衡(linkage disequilibrium,LD): 连锁:如果同一条染色体上2个位点的位置比较近,则这2个位点上的等位基因倾向于一起传递给下一代。 连锁不平衡:又称等位基因关联,是指同一条染色体上,两个等位基因间的非随机相关。即当位于同一条染色体上的两个等位基因同时存在的概率大于人群中因随机分布而同时出现的概率时,就称这两个位点处于LD状态。所谓的连锁不平衡是一种遗传标记的非随机性组合。比如,一个基因有两个位点,一个位点有两种基因型,那么子代应该有2的2次方,即4种基因型。但是发现子代的基因型往往会少于4种,这就是连锁不平衡现象。这是由于两个位点距离较近引起的两个位点上的等位基因经常同时出现在同一染色体上。

基于全基因组关联分析的基因(环境)交互作用统计学方法进展

万方数据

万方数据

708 图lMDR基本步骤示意图 划分为不同的分类,也就是图中的单元格。单元格中左侧直方图表示病例,右侧直方图表示对照。 第4步:在n维的每个多因子分类(单元格)中,计算病例数和对照数的比值,若病例数与对照数之比达到或超过某个阈值(例如≥1),则标为高危,反之则为低危。这样就把n维的结构降低到一维两水平。 第5步:多因子分类的集合中包含了MDR模型中各因子的组合。在所有的两因子组合中,选择错分最小的那个MDR模型,该两位点模型在所有模型中将具有最小的预测误差。 第6步:通过十重交叉验证评估模型的预测误差,一以及单元格分配时的相对误差。也就是说,模型拟合9/10的数据(训练样本),其预测误差将通过剩下1/10的数据(检验样本)来衡量。选择预测误差最小的模型作为最终的模型,取lO次检验的预测误差平均值,作为模型相对预测误差的无偏估计。由于数据分组的方式对交叉验证的结果影响较大,因此,十重交叉验证过程将重复进行10次,对n个因子可能的集合将重复进行10×10次的交叉验证。 通过十重交叉验证,在一定程度上可以避免因数据转换的偶然性,使I类错误增大而产生假阳性结果的影响。预测误差是衡量MDR模型在独立检验的亚组中预测危险状态的指标,通过十重交叉验证的亚组中每一个的预测误差的平均值来计算。根据交叉验证的预测误差的平均值,选择最佳的Tl因子模型,并根据不同的因子数重复以上过程。最终筛选出最有可能存在交互作用的基因。 MDR的优势在于不需要考虑疾病的遗传模型,它利用计算机运算速度快的优势,对多个基因进行随机组合,按照上述方法找出存在交互作用的基因位点。但当主效应存在时,用MDR方法很难得到最终模型,且同样受遗传异质性的影响;它只是一种数据挖掘方法,不是严格意义上的统计方法,还无法判断它的I类错误和检验功效。 MDR分析软件包可在http://www.epistasis.org/mdr.html免费下载。 4基于复合LD的交互作用分析法 吴学森等Ⅲ’提出基于复合LD的交互作用的分析法。该方法以病例一对照试验设计为基础,基于LD计算方法,构建完全有别于以上方法的一种新型基因间交互作用的统计分析方法:(1)用两个位点(基因)单倍型的外显率(只。)与等位基因的边际外显率的乘积(Pa?P。)的偏差(6.口=PA。一只?P8),分别定义病例组和对照组两个位点交互作用的度量.进而综合两组交互作用度量构造检验交互作用的统计量;(2)对于基因一环境交互作用模型的构建,则将环境(分类型变量)变量视为“虚拟位点”(例如E=l表示环境暴露。E=0表示即非暴露),则同样依据上述方法构建其模型。4.1基因型数据的联合概率分布及其表达对于基因之间、基因与环境之间的交互作用统计量的构建,无论是二阶或高阶情形,均至少涉及两个变量。在本研究中,均以病例一对照试验设计为基础,个体的基因数据一律用其基因型表示。无论是病例组还是对照组,均设两个位点的等位基因分别为A,a;B,b,则它们的联合基因型分布可表述为表3的形式: 则.配子的LD系数为:6.。=%一PAP。;非配子的LD系数为:乳口=九日一只-匕,其中,P.e=尸竺+PAB舳+碟+P竺;JD∥。=P竺+P竺+P::+形:。但是,当计算病例组或对照组的6.。时,需要知道双杂合子的概率P苫、P::。然而。当它们的相未知时,则无法确定其值,只能进行单倍型推断。由于单倍型推断总是存在误差,这给后面构造的检验交互作 用的统计量带来很多不确  万方数据

GWAS原理剖析资料

全基因组关联分析(Genome-wide Association Study)是利用高通量基因分型技术,分析数以万计的单核苷酸多态性(SNPs)以及这些SNPs与临床表型和可测性状的相关性。简单地理解全基因组关联分析,GW AS就是标记辅助选择在全基因组范围上的应用,在全基因组层面上开展大样本的、多中心的、重复验证的技术,并对相关基因与复杂性状进行关联研究,从而全面地揭示出不同复杂性状的遗传机制和基础。GW AS是一项开创性的研究方法,因为它可以在以前很难达到的分辨率水平上对成千上万无关样本的全基因组进行研究,且不受与疾病有关的先验性假设的限制,GWAS在全基因组范围、零假设性较候选基因研究都迈出了重要的一步,而且随着高通量测序成本的降低,GW AS在人类疾病以及畜禽经济性状的研究上都表现出巨大的优势。 GW AS的优势除了可以一次性检测到数以万计的SNPs信息,从而提高试验效率以及检验功效以外,其还有其他两个显著的优势,主要表现在:(1)对未知信息的基因进行定位探索。传统的QTL定位仅仅限于对已知的候选基因进行分析探索,而GW AS是对全基因组的范围内的所有位点进行关联分析,因此其拥有更广泛的关联信息,相比候选基因分析GW AS 更有可能找到与性状真正关联的候选基因,因此不再受到预先假设的候选基因的限制。(2)对于GWAS在研究不同的复杂性状之前,不需要像以往的研究一样“盲目地”预设一些假定条件,而是通过在病理和对照组中,有目的地比较全基因组范围内所有SNPs的等位基因频率或者通过家系进行传递不平衡检验(TDT,Transmission disequilibrium test),从而找出与复杂性状显著相关的序列变异。到目前为止,利用全基因组关联分析研究已经挖掘出众多与各种复杂性状相关联的基因和染色体区域,在这些被新鉴定出的位点和区域中,只有小部分结果位于以前对这些性状研究的区域之中或者附近,绝大多数位于以前从未被研究过的区域,GW AS的研究结果表明以前没有被纳入研究的未知区域有可能对于复杂性状也是十分

玉米穗行数全基因组关联分析

作物学报 ACTA AGRONOMICA SINICA 2014, 40(1): 1?6 https://www.wendangku.net/doc/5818785600.html,/ ISSN 0496-3490; CODEN TSHPA9 E-mail: xbzw@https://www.wendangku.net/doc/5818785600.html, 本研究由国家自然科学基金项目(31201219)和国家重点基础研究发展计划(973计划)项目(2011CB100106)资助。 * 通讯作者(Corresponding authors): 翁建峰, E-mail: jfweng@https://www.wendangku.net/doc/5818785600.html,; 李新海, E-mail: lixinhai@https://www.wendangku.net/doc/5818785600.html, 第一作者联系方式: E-mail: zhanghuanxin150@https://www.wendangku.net/doc/5818785600.html, Received(收稿日期): 2013-06-19; Accepted(接受日期): 2013-09-16; Published online(网络出版日期): 2013-10-22. URL: https://www.wendangku.net/doc/5818785600.html,/kcms/detail/11.1809.S.20131022.1730.016.html DOI: 10.3724/SP.J.1006.2014.00001 玉米穗行数全基因组关联分析 张焕欣 翁建峰* 张晓聪 刘昌林 雍洪军 郝转芳 李新海* 中国农业科学院作物科学研究所 / 作物分子育种国家工程实验室, 北京100081 摘 要: 穗行数是玉米产量的重要组成性状, 其遗传解析对高产育种具有指导意义。本文以203份主要玉米自交系为材料, 2007年在新疆乌鲁木齐、吉林公主岭和海南三亚进行穗行数测定; 采用分布于玉米基因组的41 101个单核苷酸多态性(SNP)标记对穗行数进行关联分析。共鉴定出9个与穗行数显著关联(P < 0.0001)的SNP, 分别位于染色体框1.02、1.10、7.03、8.02、9.06和10.03。8个SNP 位于已定位的数量性状座位(QTL)区间内。在显著SNP 位点LD 区域内发掘出4个候选基因, 分别编码含F-box 结构域的生长素受体蛋白、玉米kn1蛋白、AP2结构域蛋白和富亮氨酸重复的跨膜蛋白激酶。采用全基因组关联分析策略发掘穗行数基因位点及候选基因, 将为克隆控制玉米产量性状基因奠定基础。 关键词: 玉米; 穗行数; 全基因组关联分析; 候选基因 Genome-wide Association Analysis of Kernel Row Number in Maize ZHANG Huan-Xin, WENG Jian-Feng *, ZHANG Xiao-Cong, LIU Chang-Lin, YONG Hong-Jun, HAO Zhuan-Fang, and LI Xin-Hai * Institute of Crop Science, Chinese Academy of Agricultural Sciences / National Engineer Laboratory of Crop Molecular Breeding, Beijing 100081, China Abstract: Kernel row number (KRN) is one of grain yield components in maize (Zea mays L.). Investigation of its genetic archi-tecture will help develop high-yield varieties in maize. In this study, the KRN in a panel of 203 maize inbred lines was detected in Urumqi of Xinjiang, Gongzhuling of Jilin, and Sanya of Hainan in 2007, and used to perform the genome-wide analysis for KRN using MaizeSNP50 BeadChip. A total of nine SNPs were found to be significantly associated with KRN at a threshold of P < 0.0001, which were on chromosome Bins 1.02, 1.10, 7.03, 8.02, 9.06, and 10.03, respectively. Eight of these SNPs were located in the QTL intervals reported previously. Meanwhile, four candidate genes were scanned, encoding auxin signaling F-box containing protein, kn1 protein, AP2 domain containing protein and leucine-rich repeat transmembrane protein kinase respectively. In sum-mary, these identified genes and SNPs will offer essential information for cloning yield-related genes in maize. Keywords: Maize; Kernel row number; Genome-wide association analysis; Candidate gene 玉米穗行数(kernel row number, KRN)形成于小穗分化期, 由小穗成对分生组织数目决定[1]。穗行数是决定玉米产量的主要构成因素, 属于数量性状, 广义遗传力较高[2], 其遗传解析对玉米高产育种具有指导意义。分子标记的发展使得QTL 作图成为解析穗行数遗传结构的有效方法[3]。目前, 关于穗行数定位研究报道较多, 影响穗行数的QTL 在玉米10条染色体上均有分布。Ma 等[4]利用综3×87-1构建 的294份重组自交系(recombinant inbred line, RIL)群体检测出13个穗行数QTL, 分别位于第1、第3、第4、第5、第8、第9和第10染色体。Lu 等[5]利用掖478×丹340的150个F 2:3家系共定位到13个控制穗行数的QTL, 位于染色体框7.03位点来自丹340的穗行数主效QTL qkrn7可解释平均表型变异17.86%。Guo 等[6]用郑58×昌7-2的231个F 2:3家系在两种播种密度下进行穗行数QTL 定位, 分别检测

相关文档