国内科研机构联合公布二倍体棉花基因组图

近日来自中国农业科学院、华大基因研究院和北京大学生命科学学院的研究人员联合公布了二倍体棉花雷蒙德氏棉(Gossypium raimondii)的草图基因组,来自中国农业科学院的喻树迅(Shuxun Yu)研究员、华大基因研究院的王俊(Jun Wang)博士和北京大学的朱玉贤(Yu-Xian Zhu)教授为该篇论文的共同通讯作者。

棉花是全球最重要的经济作物之一。它的纤维,俗称皮棉,是纺织工业主要的天然资源。大约3300万公顷(约占世界5%的耕地)用于棉花种植。2011年全球纺织工厂年度市场价值大约为6306亿美元。除了它的经济价值,棉花也是一种研究多倍体化、细胞伸长和细胞壁生物合成的极好的模式系统。

在这篇文章中,研究人员测序和组装了雷蒙德氏棉的草图基因组,雷蒙德氏棉的祖先被公认为是生成皮棉的经济上重要的棉花种类陆地棉(G.hirsutum)和海岛棉(G. barbadense)D亚基因组的供体。超过73%的组装序列被锚定在13条雷蒙德氏棉染色体上。

基因组包括了40,976个蛋白质编码基因,92.2%得到了转录数据的进一步证实。研究人员获得了在双子叶植物中有可能共享了paleohexaploidization事件以及在1300-2000万年前棉花全基因组复制(WGD)事件的证据。在雷蒙德氏棉基因组中确定了总共2,355个保守块,大约有40%的平行基因存在于超过1个保守块中,表明在进化过程中基因组经历了重要的染色体重排。近57%的基因组由转座元件(transposable elements ,Tes)构成,其中大部分可能来自长末端重复序列(long terminal repeat,LTRs)扩增。研究人员在对陆地棉(G.hirsutum)和海岛棉(G. barbadense)种对纤维形成起关键作用的基因间观察到了定性差异。

通过系统进化分析揭示棉花以及可可(T. cacao)有可能是唯一具有棉酚生物合成CDN1基因家族的植物物种。研究人员从雷蒙德氏棉胚珠和叶组织cDNA文库中获得了约10GB的Illumina高通量读段(reads),并以单碱基对分辨率进行了全基因组绘图。

跨越9个真核生物物种比较基因组学揭示了在雷蒙德氏棉与拟南芥之间保守的选择性剪接(AS)事件,但在双子叶植物、单子叶植物和其他物种间各不相同。KNOX基因家族由同源结构域转录因子构成,从前报道与叶形态发育相关。AS事件导致了雷蒙德氏棉中转录因子生物化学功能所必需的同源结构域丢失。在棉花叶发育过程中伴随着显著不同的表达水平,新研究数据揭示了AS在植物的形态发生中有可能具有的新的潜在的调控机制。