决赛答辩-文章数据呈现与内容补充

数据可视化基于R-Shiny

Data visualization is based on R-shiny

本部分为决赛答辩的补充部分,
主要对发表于《Gene》的论文数据进行交互可视化呈现
并对《Gene》和《植物营养与肥料学报》的文章内容和思路进行简单补充陈述
所有可视化程序基于R语言Shiny构建,其中包含部分HTML文本
部分可视化程序已实现用户交互,依托于shinyapps.io构建
文章的补充内容(包括附图、附表、补充文献)可在文末下载
此文中所有内容已隐去作者信息和单位信息

以下为部分文章数据的可视化呈现(部分已实现交互)

以下为实验思路的补充陈述

图1、本研究技术路线

本研究被分为两个部分:其中一部分部分基于421个自交系进行,基于高密度的SNP标记和转录组数据进行,以筛选根系构型的候选基因,来探究田间根系性状的遗传机制;另一部分基于田间生产常用的18个杂交种进行,通过高低密度种植挖掘耐密高产品种地下协同的响应机制。
我们的研究希望指明田间玉米根系育种的可行路线,即一方面,通过组学数据挖掘根系构型的调控基因;另一方面,通过大田实验指明田间玉米株型和根系构型的潜在改良方向,从而实现田间需求导向的玉米育种。

图2、两个群体的亲缘关系

自交系群体和杂交种群体的选择并非随机的,两个群体之间具有紧密的遗传关联。自交系群体信息见附件 Table S6,杂交种信息见附件  。图a为自交系群体的祖先成分分析,通过自交系群体的高密度SNP在Linux系统上使用admixture软件,选择K=3条件下分析得到,结果通过R语言排序后呈现。图b为杂交种群体的父母本情况,由于部分杂交种通过自选系杂交得到,未知其父母本信息。

以下为研究进展的补充

图3、2015年以来的玉米根系GWAS和QTL研究

在开始实验之前,我们考察了2015年以来的GWAS和QTL研究。大多数的研究是基于温室苗期进行的,对于大田成熟期根系的GWAS研究是较少的。具体文献详见附件。

以下为研究结果的补充

第一部分-大田玉米根系的GWAS分析

大田玉米根系的GWAS研究基于421个自交系群体进行,已发表于《Genes》,详见附件

材料与方法部分

  1. 试验材料和设计:所使用的关联群体共包含421份自交系,来源于中国、美国和国际玉米小麦改良中心(CIMMYT)。田间试验在海南省三亚市南滨农场(18.18°N,109.03°E)布置,采用用完全随机区组设计,每个自交系单行种植,行长 4 m,行距为50 cm,株距 20 cm。基施复合肥(氮肥 90 kg N ha-1,磷肥 90 kg P2O5 ha-1,钾肥 90 kg K2O ha-1)。
  2. 根系构型性状的测定:于成熟期选取田间长势均匀一致的 3-5 株进行玉米根系的挖掘,挖掘深度为 30 cm。使用抖土法抖掉根系附着在根系上的大部分土壤后使用洗涤剂浸泡,最后使用清洗机清洗残留土壤。清洗干净后,用剪刀剪掉超过 20 cm 深度的根系,将根系转移至光源稳定的摄影棚对根系进行二维图像的采集。使用高通量定量化分析的软件为DIRT得到与根系宽度、深度、角度和面积相关的 8 个根系性状(DIRT平台的介绍和使用可见本网站推文,如下)。
  3. 数据统计与分析:数据呈现主要基于R 4.03进行,GWAS分析基于Tassel 5.0(混合线性模型), 共表达网络使Camoco 软件计算,Cytoscape 软件绘制。基因表达量使用 Trizol 试剂提取测序后使用HISAT2 软件序列比对,比对完成后利用 StringTie 软件组装得到FPKM值。

此部分涉及的数据分析方法详情

  • 数据统计性描述 – R 4.03 软件;相关性分析 – R 包”Hmisc” ;主成分分析(PCA) – R 包”ggord”;箱型图 – R 包”boxplot”;热图-R包 “corrplot”
  • 关联群体的基因型、群体结构和亲缘关系数据来源 – MaizeGO(http://www.maizego.org/index.html)
  • 基因型数据对应的参考基因组 – B73 RefGen_v2 (https://www.maizegdb.org/)
  • 候选基因的注释 – MaizeGDB ( https://www.maizegdb.org )、 NCBI  ( https://www.ncbi.nlm.nih.gov ) 和 TAIR
    (https://www.arabidopsis.org)数据库

点击此处查看DIRT平台的介绍和详情

大田玉米根系的GWAS分析结果

八个根系表型性状的描述及其统计数据表

根系性状的概率分布直方图

注:红线为拟合的正态分布曲线。a-h:根系顶角(a)、根系底角(b)、根系骨架宽度(c)、根系宽度最大值(d)、根系宽度均值(e)、根系投影面积(f)、平均根密度(g)和根数(h)的概率分布直方图。

共测定了8个根系性状(如左图),根系表型的变异都呈现出近似正态分布(如右图),这表明本研究选择的八个根系性状为典型的数量性状。

根系构型性状和地上部性状的主成分分析

注:a-b:地上部和根系性状的 PCA 图。虚线范围内为 95%置信区间。

第一主成分可以解释 99.9%的变异(图 3-2)。根系性状 AREA 和 RTP_COUNT 落在 95%置信区间之外。这一结果说明八个根系构型性状中,根系面积、根数是根系表型变异的主要组成部分。

根系构型性状和地上部性状的相关性分析

注:相关性分析基于皮尔逊相关进行,数字表示相关系数,*表示 P < 0.05,**表示 P < 0.01。

地上部性状的株型性状与根系性状存在普遍相关,表明地下部的根系性状在很大程度上决定着地上部的生长发育,且根系性状与地上部性状的株型性状存在相似的机制

不同亚群根系性状的差异分析

注:相关性分析基于皮尔逊相关进行,*表示 P < 0.05,**表示 P < 0.01。a-h:不同玉米亚群的根系顶角(a)、根系底角(b)、根系骨架宽度(c)、根系宽度最大值(d)、根系宽度均值(e)、根系投影面积(f)、平均根密度(g)和根数(h)的箱型图。

因为从遗传育种方面来说,玉米的种质有着不同亲缘,广泛接受的有SS、NSS和TST种质,其中SS与NSS来源于温带种质,TST来源自热带和亚热带种质,而无法划分的被认为是Mixed种质。因此我们对不同种质的表型进行了差异分析。总的来说,玉米 SS 亚群与其他亚群相比具有较为普遍的根系构型差异,具体表现为较陡峭且宽度更小的根系。

地上部性状与根系性状的遗传相关

注:a:地上部性状曼哈顿图,阈值以下的点显示为灰色;b:根系性状曼哈顿图,红色虚线标注阈值(LOD = 5.0),阈值以下的点显示为灰色;c:地上部性状和根系性状的关联 SNP 重叠状况;d:地上部性状和根系性状的关联候选基因重叠状况。

根系和地上部性状关联 SNP 和候选基因数目

以 B73 RefGen_v2 为参考基因组在这些显著 SNP 位点上下游 50 kb 进行候选基因的查找,共鉴定到 189 个候选基因。利用全基因组关联分析对地上部 8 个农艺(来源自他人研究)与产量性状进行基因定位,共鉴定到 280 个候选基因。将地下部根系构型与地上部性状的定位结果比较发现,共定位到九个一致性的候选基因。总体上,本研究鉴定了根系构型的潜在候选基因,发现地上部农艺性状与根系构型性状存在遗传机制差异。

根系性状候选基因的共表达网络分析

注:每一个节点表示一个候选基因,节点之间的连线表示两个基因间的共表达。红色节点标注了四个高优先的候选基因,预计与玉米根系发育密切相关。

为了进一步鉴定出高可信度的根系构型的候选基因,本研究结合根系 RNA-seq和 GWAS 分析的结果,进行了共表达分析。在 189 个 GWAS 候选基因中,通过基因的共表达分析,鉴定到其中的 88 个根系性状候选基因为优先候选基因,结合候选基因的基因注释和同源基因信息,确定了四个高优先的候选基因(红色标注)

候选基因 GRMZM2G099797 连锁分析及单倍型分析

注:a:四个根系性状的曼哈顿图;b:GRMZM2G099797 的基因结构及 LD 热图,圆形点代表显著关联的 SNP 位点。c:不同单倍型的根系性状 WIDTH_MED 差异;d:不同单倍型的基因表达差异。*表示 P < 0.05,**表示 P< 0.001。

玉米根系性状关联的高优先候选基因

注:a:候选基因 GRMZM2G354338 和 GRMZM2G085042 的局部曼哈顿图(上)和 LD 热图(下);b:候选基因GRMZM5G812926 的局部曼哈顿图(上)和 LD 热图(下);c:不同单倍型的根系底角差异;d:不同单倍型的基因(GRMZM2G354338 和 GRMZM2G085042)表达差异;e:不同单倍型的根数差异;f:不同单倍型的基因(GRMZM5G812926)表达差异。*表示 P < 0.05,**表示 P < 0.01,当差异不显著时,标注 P 值。

其中候选基因 GRMZM2G099797 同时影响性状 WIDTH_MED、WIDTH_MAX、SKL_WIDTH 与RTP_COUNT。基因共表达分析发现该基因与 GRMZM5G812926 基因存在共表达。该基因编码细胞分裂素反应调节因子(ZmRR8),在根系中大量表达,在玉米细胞分裂信号的传导中起到重要作用。该基因对应的拟南芥同源基因 AT3G16857.2(ARR2、RR2)被报道可以降低细胞分裂素对根伸长和侧根形成抑制的敏感性。通过显著SNP(chr1.S_28415629)的单倍型分析发现,该基因不同单倍型间的根系构型存在显著的表型差异和基因表达差异。

与 ANG_BTM 关联的标记(chr6.S_142873590)前后 50 kb 区域内含有两个候选基因(GRMZM2G354338 和 GRMZM2G085042),不同的单倍型材料间的根系性状ANG_BTM 与基因表达具有显著差异(P < 0.001)。其中 GRMZM2G354338是玉米特异的基因,其表达的蛋白是植物中特有的。GRMZM2G354338 编码的玉米ARGOS8(ZmZAR8)是玉米 ARGOS 基因家族的成员,该家族包含一个保守的 TPT结构域,该基因通过调节对乙烯的敏感度介导了玉米节根的发生 另一个 RTP_COUNT 关联的显著 SNP 落入基因 GRMZM5G812926 内,不同的单倍型材料的 RTP_COUNT 具有显著差异(P < 0.001,图 3-8),基因表达未表现出显著性差异(P = 0.51)。该基因在玉米中的功能尚未被报道,其拟南芥同源基因 AT1G30440.1 编码的光响应 NPH3 家族蛋白,是生长素依赖性植物向光性生长反应的关键组成部分

至此,我们挖掘了4个高优先的根系构型候选基因

第二部分-不同耐密性玉米品种地上部和根系性状的协同响应

不同耐密性玉米品种地上部和根系性状的协同响应部分基于18个常用杂交种进行,已被《植物营养与肥料学报》接收,详见附件

材料和方法部分

  1. 试验设计:田间试验在吉林省梨树县(43°2’N,123°3’E)开展,供试土壤为黑土,土壤基本化学性质:总氮:1.09 g/kg,有效磷:43.3 mg/kg,速效钾:139.8 mg/kg,pH = 5.2。试验设置 2 个种植密度,分别为低密(6 万株/公顷)和高密(7.5 万株/公顷),行长 4 m,行距 0.6 m,株距分别是 28 与 22 cm,每个品种种植 10 行。试验为完全随机区组设计,每个处理 3 个重复,田间施肥用量为:N 240 kg/hm2、P2O5 100 kg/hm2、K2O 100 kg/hm2。选用品种18个,详见附件。
  2. 样品采集与指标测定:每个重复选取 5 株,收集地上部和根系样品。以植株为中心,用平直铁铲进行根系取样,按单株所占的面积,挖取深度为 40 cm。清洗后利用数码相机进行根系图像的采集,并利用 REST 软件进行根系构型性状的定量化分析,得到 6 个根系性状数据:分别是根系开放角度(ROA)、 根系投影面积(AREA)、根系骨架区面积(ACH)、投影结构根长(TPSL)、最大宽度(RMAW)和最大宽度所处的深度(DMAW)。在根系图像采集后调查节根数(NRN),在 根系烘干后测定根系干重(RDW)。植株地上部分为茎秆和叶片,于 105℃下杀青 30 分钟 后,在 80℃下烘干至恒重。烘干后测定单株茎干重(SDW_S)和单株叶干重(LDW_S), 并计算单株地上部生物量(ADW_S = SDW_S + LDW_S)。按照类似步骤采集成熟期单株茎干重和单株叶干重, 并计算单株地上部生物量,同时测定4 个穗部性状:穗长(EL)、穗粗(ED)、穗粒数(KN)和百粒重(HKW)
  3. 数据处理:T 检验、单因素方差分析和多重比较(Duncan’s)通过 SPSS 25.0 软件在 0.05 置信度下进行;方差成分分析通过 SPSS 25.0 软件 的一般线性模型进行。地上部与根系性状与产量的相关分析通过 R 语言“cor.test”函数完成;地上部与根系性状对产量的贡献利用“lm”函数进行分析。

此部分的计算公式

  • 茎秆花后干物质增加量(SDWMS, g/plant) = SDW_M – SDW_S;
  • 花后干物质积累量(SLKDWS, g/plant) = ADW_M – ADW_S;
  • 成熟期地上部生物量(SLKDW) = SDW_M + LDW_M + KDW_M
  • 花前干物质积累量占成熟期地上部生物量比值(SLDW/SLKDW)= 花前干物质积累量 /成熟期地上部生物量;
  • 花后干物质积累量占成熟期地上部生物量比值(SLKDWS/SLKDW) = 花后干物质积累量/成熟期地上部生物量。

地上部和根系性状的方差成分分析

注(Note):方差成分分析通过一般线性模型进行。*和**分别表示P < 0.05和P < 0.01。性状缩写详见材料与方法。

不同种植密度下地上部和根系性状的差异分析

注(Note): P 值通过T检验得到。性状缩写详见材料与方法。

方差分析表明(左图),地上部产量构成因子EL、ED、KN、HKW与GY及茎叶性状SDW_M、 KDW_M、ADW_M与Biomass_M共9个性状受到种植密度的显著影响(P < 0.05)。产 量构成因子EL、ED、KN、HKW与GY及茎叶性状SDW_S、ADW_S、SDW_M、LDW_M和 HI共10个性状受到基因型的显著作用。在根系性状中,性状ROA单独受到基因型的影响,而DMAW单独受到密度的影响(P <0.05),其余6个根系性状(NRN、RDW、AREA、ACH、RMAW、TPSL)均同时受到种植 密度和基因型的显著影响。这些结果表明,本研究选取的根系性状受到种植密度和基因型的广泛影响,而几乎不受种植密度和基因型的交互作用影响。地上部性状受到密度和基因型的单独调控,且基因型对于地上部和根系性状具有显著作用。因此,通过不同品种玉米解析地上部和根系性状协同的种植密度响应差异是切实可行的。

随着种植密度的增加,地上部性状中,多数性状表现出一定程度的下降(右图)。总的来说,提高种植密度降低了玉米单株的生产能力,但却增加了群体的生物量和籽粒产量,并且种植密度的改变对于玉米地上部性状的影响主要体现在成熟期,而对吐丝期性状的影响较小。随着种植密度的增加,在根系性状方面,根系性状NRN、ROA和RMAW无显著变化,其它5个根系性状表现 出显著降低

不同品种玉米的产量均值和分组

注(Note):竖线和横线分别表示低种植密度和高种植密度下的产量均值。

不同玉米品种亚类的性状差异比较

注(Note):多重比较在0.05置信度下通过邓肯方法进行。性状缩写详见材料与方法。

四种玉米品种类型的多重比较分析发现,与双低型玉米相比,双高型玉米在高低密条件下的单株茎干重(SDW_S)与单株地上部生物量(ADW_S)均表现出显著差异(P < 0.05)。此外,双高型玉米的产量显著高于双低型玉米,这说明在密度增加过程中,维持较高的地上部生物量,对保证玉米的耐密高产具有重要作用。进一步对双高型与双低型比较发 现,除成熟期叶片生物量(LDW_M)外,双高型品种的吐丝期和成熟期生物量性状都表现 出增加趋势,双低型玉米在高种植密度下具有更低的收获指数(HI)(P < 0.05)。以上结果说明不同类型玉米品种在花前花后干物质积累和分配方面存在差异,这可能是导致品种间耐密性差异的原因。
在根系性状方面,双高型与双低型品种相比,节根数(NRN)在低密和高密下均降低(P < 0.05),这表明玉米根系的节根数性状可能是冗余性状。此外,在高密下,与双低型品种相比,双高型表现出降低的根系干重(RDW),增加的ROA、AREA、ACH、RMAW、 DMAW和TPSL,但未达到显著水平。以上结果表明,在适当减少植株的根系干重和节根数的同时,保持良好的根系构型及扩大根系面积对于玉米的耐密高产具有重要作用,这可能是 导致双高型品种更耐密的主要原因。

不同玉米品种类型的干物质分类差异

注(Note):多重比较在0.05置信度下通过邓肯方法进行。性状缩写详见材料与方法

多重比较表明,不同类型的玉米在干物质积累上存在差异。因此,我们进一步探究不同品种耐密性的潜在机制,本研究分析了不同玉米品种在花前花后干物质的积累和分配差异。与双低型品种相比,在高密与低密下,双高品种均具有更高的花前干物质积累量(SLDW)(P < 0.05),其它性状指标差异不显著。

不同种植密度下的各个性状与产量的相关系数

利用相关分析探究了不同密度条件下产量构成因子、地上部性状及根系性状与产 量的相关关系。结果表明,产量构成因子EL与产量GY在高低密条件下存在显著的相关性(P < 0.05)。ED、KN和HKW在高低密条件下与产量无显著相关性(P > 0.05)。研究发现,产量构成因子EL的密度响应与产量响应存在较强的相关性(表5; P < 0.05)。 在地上部性状方面,低密条件下,SDW_S、LDW_S与产量存在显著正相关(P < 0.05);高密条件下,KDW_M、HI与产量存在显著正相关,而LDW_M与产量存在较强的负相关(P < 0.05)。在密度响应方面,LDW_M对产量的响应存在显著负相关(P < 0.05),其它性状未表现出显著相关(P > 0.05)。以上结果表明,在保持花前地上部干重(SDW_S、LDW_S) 的同时,减少花后营养器官的干重(SDW_M、LDW_M),并提高籽粒干重(KDW_M)能 够促进高密下的产量提升。根系性状方面,在低种植密度下,NRN与产量存在显著负相关。 其它性状无显著性相关(P > 0.05)。总体上,根系性状在密度响应方面对产量的贡献是负趋势(P > 0.05)。

地上部性状与根系对籽粒产量的贡献

注(Note):(a)低密与高密条件下地上部与根系对籽粒产量的贡献。(b)双高与双低基因型地上部与根系对籽粒产量的贡献。

在高低密条件下,本研究利用地上部性状与根系性状对产量的贡献进行比较分析。结果发现低密下,与产量相关性较高的地上部性状SDW_S、SDW_M与LDW_M对产量的决定系数为0.51,而根系性状NRN,RMAW与TPSL对产量的决定系数为0.30。高密下,与产量相关性较高的地上部性状SDW_S,SDW_M与LDW_M对产量的决定系数为0.47,而根系性状NRN, RMAW与TPSL对产量的决定系数为0.22。地上部与根系性状协同对产量的贡献分析中,发现低密下的决定系数为0.53,而高密下的决定系数0.61。这些结果说明,高密下地上部SDW_S,SDW_M与LDW_M性状,与根系性状NRN、RMAW与TPSL之间具有更好的协同性,进而增加了对产量的贡献(图a)。

双高与双低型品种的比较分析发现,双高品种与产量相关性较高的地上部性状SDW_S、 SDW_M与LDW_M对产量的决定系数为0.43,双低品种的为0.20。根系性状方面,双高品种的NRN,RMAW与TPSL对产量的决定系数为0.18,双低品种的为0.10。地上地下性状协同对产量的贡献分析发现,双高品种对产量的决定系数为0.77,而双低品种的为0.26(图b)。以上结果说明,在高密条件下,双高品种通过高效协同地上部SDW_S、SDW_M与LDW_M与地下部根系性状NRN、RMAW与TPSL增加了产量

高密下理想的地上部根系协同构型

 

 

 

理想的地上部和根系构型

  • 较高的叶片花前干物质积累
  • 花后干物质较少向茎秆分配
  • 促进花后干物质向籽粒转移
  • 较少节根数
  • 较小根系开放角度
  • 减少干重
  • 维持根系长度和表面积

补充内容-附件

附图

1、Histogram of distribution of eight root traits.
2、Principal component analysis of root and aboveground traits.
3、Manhattan plot of eight root traits analyzed by GWAS
4、Manhattan map of aboveground traits analyzed by GWAS.
5、Co-expression network analysis of root candidate genes.
6、GWAS identification of high-priority genes for variation in maize root traits.
7、Figure legends of Supplementary Figures
点击此处下载

附表

Table S1. The number of significant SNPs and candidate genes associated with eight root traits.
Table S2. SNPs significantly associated with eight root traits and the candidate genes within 50 kb up- and downstream of each unique significant association SNPs.
Table S3. The number of significant SNPs and candidate genes associated with eight aboveground traits.
Table S4. SNPs significantly associated with eight aboveground traits and the candidate genes within 50 kb up- and downstream of each unique significant association SNPs.
Table S5. List of high-priority candidate genes generated from co-expression network analysis.
Table S6. Information from the maize lines in the panel, including the pedigree and subpopulation.
Table S7. The phenotypic data of eight root traits.
Table S8. Description of eight aboveground traits.
Table S9. The phenotypic data of aboveground traits used in this study.
点击此处下载
18个杂交种信息

联系方式

Email :wubin_rush@163.com
Wechat:w1279868039