石榴属于石榴科石榴属,是一种常见的落叶灌木或小乔木,具有观赏、绿化、食用、药用等多种价值,近年来对石榴籽粒性状形成的分子机制研究已成为热点,研究表明石榴籽粒硬度、色泽的形成与木质素、花青素含量相关,而R2R3-MYB转录因子具有广泛的生物学功能,在木质素和花青素的合成途径中具有重要的调控作用。
我们从石榴全基因组中鉴定 R2R3-MYB 转录因子家族成员,筛选调控木质素和花青素合成相关PgMYB,对石榴不同品种和不同发育时期的籽粒进行转录组测序,对测序数据进行评估和分析,探讨其在木质素和花青素合成途径中的表达调控,为进一步研究石榴籽粒性状形成机理提供理论依据。

石榴中R2R3-MYB基因结构分析
对石榴 R2R3-MYB 家族成员进行结构分析结果显示,同一亚组 PgMYB基因序列具有相似的外显子和内含子结构,总体结果表明PgMY内含子和外显子的数量存在差异,外显子的数量为1~11个,其中PgMYBI7、PgMYBI8和PgMYBI9的外显子数为11个,PgMYB21和PgMYB138的外显子数为8个,PgMYB22、PgMYB23、PgMYB74、PgMYBI48,PgMYBI89和PgMYBI50的外显子数为7个,其余147个石榴 R2R3-MYB 基因序列有3个外显子,剩下28个序列外显子范围为2~4个不等,PgMYB内含子的数量为2~11个,其中 PgMBI7和PgMYBI9包含11 个内含子,PMYBI8包含10个内含子,PMYB21、PMYB23、PMYB74、PMYBI38,PgMYBI40和 PgMYBI48 包含7 个内含子。

分析186条石榴R2R3-MYB 基因在石榴8条染色体上的位置分布,发现大部分基因均匀分布在染色体的上下臂,基因在6号和7号上分布较少,主要集中在1号、2号、3号、5号和8号染色体上,PgMYB的重复模式分析结果表明,在石榴 R2R3-MYB 家族*共中**发生了 45 各片段复制事件,涉及 78个 PgMYB 基因,复制事件存在于所有的染色体上,这表明在石榴基因组的进化过程中,R2R3-MYB基因得到了广泛的扩展,大规模的节段性复制事件是该家族扩增的主要因素。
为了进一步研究石榴R2R3-MYB家族的潜在进化机制,构建石榴、拟南芥和巨桉种间共线性关系,结果显示石榴和拟南芥之间有 138 对同源基因,石榴和巨桉之间有173对同源基因。

为了研究石榴 R2R3-MYB 家族成员的潜在功能,我们分析了 PgMYB 基因家族成员 CDS 上游的2000bp序列,检测到大量的顺式作用元,这些元件被分为启动子元件、植物生长元件和环境反应元件,大部分PgMYB启动子序列发现了ABRE、TGACE-motif、CGTCA-motif元件,其参与了脱落酸和茉莉酮酸甲酯的反应,还发现了ARE、GC-motif、MBS 元件,其参与了低温诱导、厌氧诱导和干旱诱导。

R2R3-MYB基因对石榴蛋白理化的影响
通过序列比对分析,最终鉴定得到186个石榴 R2R3-MYB 转录因子家族成员,称为 PgMYBI-PgMYBI86,对186条序列进行蛋白理化性质分析,石榴MYB 基因家族的氨基酸长度为 94aa(PgMYB100)-1516aa(PgMYBI75);蛋白质的分子量为10.55KD-169.43KD;等电点范围为4.81pi(PgMYB96)-9.96pi(PgMYB20),其中100个蛋白为酸性。
拟南芥R2R3-MYB被分为25个亚群,利用石榴R2R3-MYB蛋白序列与拟南芥的R2R3-MYB 蛋白序列构建系统发育树并且进行分类,石榴PgMYB大部分与拟南芥聚类,但也有少数未被归入25个亚组,石榴R2R3-MYB 转录因子一共分为34个亚组,不同的亚组在图中用不同的颜色加以区分。

由于同源基因可能具有相似的功能,可以推测石榴与拟南芥对应的同源基因的功能,其中 S1组含有4个成员,可能参与生物与非生物胁迫过S13组有7个成员,推测其影响植物木质素沉积,粘液产生及气孔关闭:S18有10个成员,可能促进花药和花粉发育:S22组有6个成员,推测其可能参与调节生长素和植物应激反应。
为了进一步阐明石榴 R2R3-MYB 基因之间的进化关系,通过在线软件 MEME 对PgMYB 蛋白的保守基序进行预测,预测的 10 个Motif分别编码 11-50个氨基酸,通过在线软件 Pfam 对这 10个Motif的氨基酸序列进行在线预则发现,石榴 MYB 转录因子中的 Motif在每个基因中的位置相似的,这说明Motif出现具有一定的保守性,Logos图显示,Motif1、Motif2、Motif3、Motif4 和 Motif7都具有高度保守的色氨酸残基,除其之外,结构域中还具有一部分相对保守的氨基酸残基,即 R、N、L、S、K、D。

石榴 R2R3-MYB 转录因子中存在的 Motif 个数差异相对较大,如图 3-5 所示Motif数目在 2-9 个不等,182 个(97.3%)含有 Motifl,181个(96.8%)含有 Motif2有185 个(98.9%)含有 Motif3,146个(78.1%)含有Motif4,79 个(40.6%)含有Motif5,43 个(23%)含有 Moti6,10个(5.3%)含有 Motif7,8个(4.3%)含有Motif8,10个(5.3%)含有 Motif9,9 个(4.8%)含有 Motif10,其中最复杂的基因是PgMYB2I,PgMYB22,PgMYB23均含有9个Motif,而最简单的基因是 PgMYB96,只含有2个 Motif。进化树中同一亚组的成员显示出相似的保守基序,例如 S19 亚组的成员都包括了 Motifl、Moti2、Motif3 和 Motif4,S25 亚组的成员都包含了 Motifl、Motif2、Motif3 和 Motif8。

本研究选择籽粒硬度、色泽不同的三个石榴品种,分别取其花后 40d、80d、120d籽粒,共计 27 个样品,进行转录组测序,经过质控去除接头和低质量数据后得到120002万条 Clean reads,优质数据占原始数据 99.45%,筛选转录组数据中的 DEGS,在苯丙烷生物合成和类黄酮生物合成通路中的差异基因数量较多,与石榴籽粒转录组KEGG通路分析结果相似。
研究还得到'红玉’和'白玉DEGs 共富集到 30 条KEGG通路,在中Ko01110 和代谢途径(Ko01100)中的差异基因数量较多,对花后 40d、80d、120d 不同时期 DEGS 分析得出共富集在 134 条 KEGG 通路上,其中在 Ko00940 和 Ko00941通路上均检测到 DEGS,石榴转录组数据以及对 DEGs 富集分析的研究将有利于功能基因的挖掘,为进步对功能基因的预测和分析提供数据资源。

结语
我们首先对石榴 R2R3-MYB 转录因子家族成员进行鉴定和生物信息学分析,筛选木质素、花青素合成途径相关 PgMYB 基因。然后,选择籽粒硬度、色泽不同的3 个石榴品种,分别采取花后 40d、80d、120d 籽粒进行转录组测序,对转录组数据进行评估和分析,基于转录组数据对分析相关PgMYB表达模式,我们为探讨石榴籽粒硬度、色泽的形成机理提供数据支持,为培育石榴优良品种莫定了理论基础。
分别采取硬度、色泽不同3个石榴品种花后 40d、80d、120d 籽粒,生物学三次重复,进行转录组测序,共得到原始序列 120660 万条,其中优质数据占原始数据99.45%,样品 GC 含量49.13%-50.56%,020>96%,030>91%,说明此次转录组数据可靠,可以支撑后续数据分析。

'突尼斯软籽’、'红玉’、'白玉’转录本中均存在数量不等的DEGS,对差异基因功能富集分析。'突尼斯软籽’与'红玉’DEGs 共富集到53条GO 通路和106条KEGG 通路,'红玉’和'白玉’DEGs 共富集到34条GO通路和 30 条 KEGG 通路,'突尼斯软籽’花后 40d 与 80d DEGs 共富集在64条GO通路和 133 条 KEGG 通路,80d与 120d DEGs 共富集在 62 条 GO 通路和 125条KEGG 通路,通过对DEGS富集通路分析,可以进一步确定功能基因,为后续相关分子机理研究提供依据和思路。

相关 PgMYB 在不同发育时期表达模式分析:木质素合成相关基因 PgMYBI73呈现先增长后下降的趋势,在花后 80d 表达量最高,PgMYB2、PgMYB79、PgMYBI15、等8个PgMYBs表达趋势相似,在花后40d的表达量最高,随着发育进程表达量逐渐下降,与实时定量荧光 PCR 结果一致。花青素合成相关基因 PgMYB145、PgMYBs65、PgMYBs99 和 PgMYBII8 表达量均随着时间梯度而减少,在花后 40d 含量最多,PgMYB70、PgMYBsI04、PgMYBsI05、PgMYBsI37 在三个品种中得含量随着时间梯度而增加,均在 120d得表达量最高。