

文丨初八没烦恼
编辑丨初八没烦恼

青钱柳,又名青钱李、甜茶树、摇钱树等 ,是我国胡桃科特有的单属种植物,广泛分布于江西、浙江、江苏等海拔420~1100m或2500m的山区、溪谷或石灰岩山地。
青钱柳集药用、材用和观赏功能于一体,其叶中富含黄酮、三萜、多糖、酚酸等生物活性物质,具有降血糖、降血脂、抗氧化、抗菌、抗癌等功效。

由于青钱柳具有显著的药用价值,因此广受学者们的关注,目前青钱柳的开发利用主要源于天然林资源,而天然资源存在显著的地域特点且资源有限,其药用品质难以保证,严重制约了青钱柳的产业化发展。
研究还发现,来自青钱柳不同种源、家系和个体内主要的生物活性物质含量差异显著,为药用优良种植材料的筛选提供了条件,但仅依据表型选择的单株,其药用品质并不十分稳定。

基于此,有必要开展分子辅助选择, 将有效的分子标记结合表型进行选择,提高选择效率。
并且,利用分子标记还可对青钱柳天然资源进行遗传多样性分析、种质资源鉴定和评价、构建优良品系的指纹图谱等,可为进一步的开发利用提供技术支撑。

全基因组测序
随着分子标记技术的发展,分子标记已成为种质资源鉴定和保护、遗传多样性分析等的有效手段,其中,由于SSR标记技术具有快速、共显性、特异性和重复性好的特点,广泛应用于种质资源评价、遗传多样性分析及品种鉴定等方面的研究。
随着高通量测序技术的发展,许多生物都已完成了全基因组测序,为SSR位点的开发和应用提供了条件。

如中国马褂木、黄檀、茶树等木本植物基于全基因组序列进行了SSR标记的开发和应用,本研究基于青钱柳全基因组测序结果, 分析了基因组水平上的SSR位点数量、SSR重复基序类型和重复次数、序列长度等。
在此基础上设计引物并按一定比例随机合成,筛选出多态性SSR引物,构建19个优良药用无性系的DNA分子身份证,为后续无性系的推广栽培和多态性引物构建身份识别系统提供技术支撑和方法初探。

青钱柳SSR多态性位点的开发可为进一步的核心种质资源库的构建、种质资源的遗传多样性评价和鉴定提供了有效的研究手段和方法。
DNA提取采用改良CTAB法提取植物基因组DNA,1%的琼脂糖凝胶电泳检测DNA质量,微量紫外分光光度计检测DNA浓度和吸收峰。

将电泳条带明亮清晰、OD260/OD280值在1.8~2.0之间的DNA样品浓度稀释到50ng/L,-20℃保存备用。
通过Single-MoleculeReal-Time技术对青钱柳二倍体植株进行了全基因组测序和组装, 获得35221条序列,总基因组大小为553.87Mb。

利用软件MISA搜索全基因组序列中的SSR位点,为保证较高的位点检出率和引物设计成功率,具体查找标准为:单、二、三、四、五、六核苷酸的最低重复次数为10、6、5、5、5、5次,SSR侧翼序列长度≥50bp。
当相邻SSR之间的间隔区域长度小于100bp时,两个微卫星组成一个微卫星,也称复合型微卫星。

根据MISA查找SSR位点两端的保守序列,利用Primer3.0进行引物设计,各项参数设置为默认值。
PCR扩增及SSR检测PCR反应体系10L :250UTaq酶0.1L,上下游引物各0.6L,2.5mmol/LMg2+0.8L,2.5mmol/LdNTPs2L,10×buffer1L,50ng/L的模板DNA1L,剩余用3.9LddH2O补足。

普通引物和毛细管电泳检测的荧光引物均由南京擎科生物技术有限公司合成,PCR反应程序:95℃预变性2min,39个循环包括:94℃变性45s,55~62℃退火,复性45s,72℃延伸30s,72℃延伸10min。
扩增产物用8%的变性聚丙烯酰胺凝胶电泳检测,进行引物初筛,对多态性SSR位点,用荧光引物进行避光扩增,扩增产物在+ABI-3730XL基因分析仪上进行毛细管电泳检测。

统计毛细管电泳检测位点,有效位点采用数字和英文字母编码 ,将每对引物的扩增条带按分子量由大到小排序,编码为A-F,构建数字与字母结合的字符串形式的DNA分子身份证。
将每个无性系的来源、种质类型、特性和唯一的DNA分子身份证编码信息导入二维码生成软件,生成可供扫描的二维码DNA分子身份证。

MISA搜索基因组35221条序列发现,其中有21863条序列含有共89741个SSR位点,SSR的发生频率为62.07%。
其中包含1个以上SSR位点的序列有16234条,占发生SSR位点序列的74.25%,5629条序列包含1个SSR位点,占包含SSR位点序列的25.75%。

SSR重复类型
分析发现,青钱柳基因组SSR核苷酸重复基元种类丰富,共存在354种类型,重复基序的碱基变化为1~6,单核苷酸重复基元有A/T和C/G两种类型,其中以A/T为主,共有50610个位点,占单核苷酸重复基序的89.99%。
二核苷酸重复基元有AC/GT、AT/AT、CG/CG和AG/CT四种重复类型 ,其中以AC/GT为主,有13779个,占二核苷酸重复基元的50.49%,AT/AT重复基元最少,仅有108个,占二核苷酸重复基元的0.003%。

三核苷酸重复基元共有59种类型,其中以AAT/ATT为主要重复基元,其位点数为1697个,占三核苷酸重复基元的33.85%。
其次为AAG/CTT,有1479个,占三核苷酸重复基元的29.50%,ACG/CGT重复基元最少,仅有65个,占三核苷酸重复基元的1.30%。

四核苷酸、五核苷酸和六核苷酸重复类型较多, 分别有101种、90种和88种重复类型 ,但数目较少,仅占总SSR位点的1.33%。
从核苷酸重复次数来看,核苷酸基元重复次数主要集中在5~18次,其中以重复10次最为常见,有19843个位点,占总数的22.11%。

重复5、6、7、8、9、11、12次的SSR位点分别有3377个、7485个、4767个、3654个、3040个、11636个、8338个,其他重复频率较少。
单核苷酸重复次数主要集中在10~15次,以重复10次最为常见,有17485个位点,占单核苷酸总数的31.09%,重复11、12、13、14次的SSR位点分别有9861个、6978个、5155个、4433个。

二核苷酸重复次数主要集中在6~11次,以重复6次最为常见,有6070个位点,占二核苷酸总数的22.24%;重复7、8、9、10、11次的SSR位点分别有4123个、3351个、2857个、2270个、1729个。
三核苷酸重复基元主要集中在5~9次, 以重复5次最为常见,有2491个位点 ,占三核苷酸总数的49.48%,重复6、7、8、9次的SSR位点分别有1201个、593个、279个、171个。

2.1.4SSR序列长度及变异分析分析发现,SSR序列长度分布于10~476bp,平均长度为15.29bp,不同重复单元类型的SSR序列长度具有多态性。
随着SSR序列长度的增加,其出现的频次整体呈逐渐下降的趋势,单核苷酸重复基序最丰富,共有56242个,占总数的62.67%。

平均长度为12.61bp,其中n序列的平均长度为14.84bp,n平均长度为12.36bp,其次为双核苷酸重复,有27291个,占总数的30.41%,平均长度为19.78bp,其中n序列的平均长度最大,为21.04bp,n平均长度最小,仅13.33bp。
三核苷酸重复的位点共5014个,占总数的5.59% ,平均长度为18.68bp,其他重复类型较少,分别为四核苷酸重复712个,五核苷酸重复351个,六核苷酸重复131个,平均长度分别为21.67bp、26.62bp、33.02bp。

SSR引物设计和验证
应用Primer3.0对筛选获得的89741个SSR位点进行引物设计,共设计78285对SSR引物,引物长度为18~25bp。
其中,从78296个P型SSR位点*共中**设计出68109对引物,设计成功率为86.99%,占总引物数的87.00%。

从11445个C型SSR位点共设计出10176对引物,设计成功率为88.91%,占总数的13.00%,预测扩增产物长度为100~280bp。
在78285对SSR引物中,预期扩增产物的核心序列为单核苷酸、二核苷酸和三核苷酸重复的SSR引物数分别为44242对、19100对和3843对。

将设计的引物按核心序列的碱基重复类型分组,每组随机进行选取,由于单碱基重复基序引物占比较大,每组随机选择60对。
其他基序重复类型每组随机选择10对, 则单碱基和双碱基重复共选取引物246对 ,从19个青钱柳无性系样本提取的DNA中随机选择两个对引物的有效性进行验证。

经变性聚丙烯酰胺凝胶电泳检测,其中161对引物能扩增出清晰、重复性好且在预期片段长度范围内的产物,有效扩增率为65.45%。
其余85对引物的扩增结果为非目的条带、无扩增产物或条带模糊,三碱基重复类型共选出131对SSR引物,用以上方法筛选后结果显示,其中119对引物的扩增条带为清晰、重复性好的目的产物,有效扩增率为90.84%。

其余12对引物的扩增结果为非目的条带、 无扩增产物或条带模糊 ,总体有效扩增率为74.27%,多态性比例为19.89%。
SSR引物的有效性和多态性经变性聚丙烯酰胺凝胶电泳复筛,以19个优良无性系DNA为样本,161对引物中有18对SSR引物的扩增结果具有多态性。

从单碱基重复类型的多态性引物中选取5对条带清晰、多态性高、稳定好的引物进行毛细管电泳检测。
5对SSR引物的扩增产物长度均与预计产物长度吻合,以CpSSR-10在19个无性系中的毛细管电泳扩增结果为例。

5对引物共扩增出20条条带,其中14条具有多态性,多态性比率为67%,引物扩增条带数为3~5条,平均每对引物扩增出4条条带,实际扩增片段大小在118~296bp。
无性系DNA分子身份证构建5对多态性SSR引物对19个无性系的扩增产物进行毛细管电泳的统计分析, 分别检测到5、5、6、4、2种特征带型。

为保证SSR标记位点的稳定性和可靠性,研究中一般选择预计扩增产物大小在150~250bp的完全重复型SSR引物。
本研究发现1~3核苷酸重复的P型引物总多态性比率为19.89%,其中,三核苷酸SSRs的多态性比例远高于单核苷酸和二核苷酸SSRs。

可能因为是单/二核苷酸的等位基因差异小, 易产生误读或混淆,因此多态性比例较低 ,这与在核心基序重复数量和多态性比例间相关性的研究结果一致。
在青钱柳基因组中三核苷酸以上重复的SSR位点占总SSR的6.92%,占比虽小,但相较但核苷酸和双核苷酸重复基序的位点,更具潜在的开发利用价值。

本研究通过对青钱柳全基因组的扫描,对大量具有潜在应用价值的SSR位点进行查找,利用筛选出的5对多态性SSR引物初步尝试了对19个青钱柳药用无性系的DNA分子身份证构建。
此方法不仅可使各个无性系被唯一识别,还可以充分了解其起源和无性系特点。

在后续更多多态性引物得到开发的基础上, 可针对不断发掘的优良无性系 ,建立二维码识别系统。
通过更多的SSR特异性位点加以识别,形成动态和可准确识别的无性系库,为青钱柳无性系的规模化推广和应用提供技术保障。
