辣椒,12条染色体,基因组大小约3.48Gb,属茄科,该科被测序的还有番茄和马铃薯。文章通过对辣椒基因组的测序、组装和注释,以及对中国野生品种的测序组装,对另外两个品种的重测序,给我们展示了小辣椒基因组的概况。通过与番茄基因组的比较分析,揭示了重复序列导致的基因组扩张;CS等基因的表达、复制导致的辣椒素的合成等。这里学习下感兴趣的内容,不做全面解读。
测序、组装和遗传变异
作者测序并denovo组装了小辣椒的基因组(CM334);同时又denovo组装了一个中国的野生品种(C.chinense),做了两个品种的重测序(Perennial和Dempsey)。
CM334构建了180bp到20kb不同长度插入片段的文库,使用SOAPdenovo和SSPACE软件进行组装。组装结果使用27个BAC序列进行评价。同时使用包含120个个体的RIL群体构建了遗传图谱,将scaffold挂载到染色体上。
通过将C.chinense、Perennial和Dempsey的reads 比对到CM334的基因组上,得到基因组的概况。包括个体之间的分歧度、SNP在染色体上的分布信息等。重复序列注释发现重复序列含量高达75%以上,主要是LTR/Gypsy。
基因注释和RNA测序
基因注释共鉴定到34903条基因。为了得到更为精确的结果,作者使用了手工注释:手动添加了335个基因、重新将86个基因归类为假基因、将1789个基因的结果进行了矫正。文章还对进行了samll RNA 进行了注释。通过双向blast的方法坚定了辣椒与番茄之间的直系同源基因,并分析这些基因在多个样本中的表达模式,在此没给从明确的结论,不再介绍细节。
基因组扩张
小辣椒与番茄都有12条染色体,都属于茄科,而且有很好的共线性,而辣椒基因组确实番茄的4倍。这种情况通常都是基因组复制、重复序列爆发导致的。之前的分析已经发现辣椒重复序列含量达到75%以上,所以推测重复序列导致基因组增大是自然的。
小辣椒与番茄有很好的共线性
一段共线性区域内,小辣椒基因组中的重复序列明显高于番茄
Gypsy含量远高于番茄;Copia差别不大;Caulimoviridae也高很多
Gypsy的子类Del含量最多。说明主要是该类转座子的扩张导致。
推断转座子的插入时间
Caulimovirus类转座子在番茄中只有一类,在辣椒中有3类
辣椒素合成通路研究
辣椒素合成途径已经有过报道,这种分析通常有两种思路:一种是通过大量转录组、小RNA等数据,挖掘共表达、调控关系,试图发现新的与该通路有关的基因;另一种思路是研究已知基因的基因结构差异、拷贝数、表达差异,结合实际情况进行解释。这里选择了后者。
作者先通过共线性找到与辣椒素合成相关的,辣椒和番茄中的直系同源基因,比较其表达量,发现CS等几个基因在关键时期在辣椒中表达而在番茄中几乎不表达,同时这些基因在没有辣味的辣椒中也几乎不表达。推测应该是这些基因的表达差异导致。除了表达,作者还对CS等基因附近的基因的串联复制进行了研究。
已知的辣椒素合成通路
BCAT、KS、CS等基因在CM334中关键组织中表达量很高,而在番茄盅几乎不表达;CS在不含辣椒素的辣椒中几乎不表达。推测这些基因的表达影响辣椒素合成。
文章还对CS基因附近的基因进行了串联复制分析,发现相比番茄,这些基因经历了更多次的串联复制。也可能与辣椒素合成有关。
评论