澳门金莎娱乐手机版-集团app网站官网

生物信息学和天然产物代谢研究组

研究组长:李轩,研究员

主要研究方向及内容:
生物信息学和天然产物代谢组围绕生命科学重大问题,利用分子生物学、功能基因组/功能转录组实验技术和大数据计算,开展两个主要方向的研究:(1)天然产物/药用植物小分子的代谢组/表征组和细胞功能网络建模;(2)合成表观生物学:RNA表观遗传机制的系统进化和RNA表观组人工修饰机器构建。

研究队伍:
工作人员:朱艳、吴雪婷、荆新云、王翠亭
研究生:陈萍、陈龙现、解冰冉、李雪童、秦航、周辉、李佳、张牛冰(河南大学)、陈敏洁(河南大学)、洪香娜(河南大学)

年度研究进展:

(1)完成CRISPR-Cas13a介导的精确定点RNA编辑的人工机器
我们报导了一个利用新发现CRISPR家族中的Cas13蛋白(VI 型)、及其指导RNA(guide RNA)靶向结合特异序列单链RNA的能力,通过设计改造并与人源的RNA脱氨酶催化结构域(hADAR2d)结合,实现了精确定点RNA(A→I)编辑的人工机器。与近年来利用CRISPR家族蛋白(例如Cas9)对DNA编辑来修改基因/调控基因表达不同,Cas13体系不涉及编码基因DNA的改变,而是通过对基因转录产物(mRNA)进行编辑,为改变基因功能和调控表达提供了新的方法和思路。
为了实现精确定点RNA编辑的人工机器,我们与杨晟研究员、中科院上海巴斯德研究所郝沛研究员、及美国密歇根大学王红兵教授合作,对新发现CRISPR家族中具有结合特异序列单链RNA能力的Cas13a,首先在模式生物裂殖酵母(S pombe)中实现了其靶向内源RNA和降解靶标RNA的功能。进一步,设计利用Cas13a的改造产物dCas13a(丧失RNA切割活性的突变),将dCas13a与人源的RNA腺嘌呤脱氨酶催化结构域(hADAR2d)融合,引入到裂殖酵母中;再通过设计RNA编辑机器的靶向“零件”-指导RNA,实现了对内源RNA的精确定点编辑。为了对RNA定点编辑机器的设计和参数(编辑碱基位置、距离、指导RNA结构和长度等)进行优化,研究人员构建了一系列不同的设计,并利用一个双荧光报告(reporter)系统来测试不同设置的编辑效率,从而获得了精准RNA编辑机器的最优参数。优化后的编辑机器对内源靶标RNA的编辑效率达到了59%。最后,本研究实现的精准RNA编辑机器的功能,进一步体现在对裂殖酵母反转录转座子Tf1突变株的修复和操作的实验中。Tf1与动物细胞的逆转录病毒类似,其跳跃和扩增需要经过中间体RNA的逆转录步骤。研究人员利用精准RNA编辑,恢复了Tf1突变株的转座能力,这个应用对逆转录病毒干预和操作提供了一个有潜力的工具。

(2)BioNano光学图谱分子建模及图谱组装模拟研究
近年来,BioNano基因组光学图谱绘制技术因其在评估和指导基因组序列组装,解析重复序列结构,揭示单倍型,检测结构变异等方面的优势,被越来越广泛的应用于基因组学研究中。基因组测序技术,如二代测序数据存在碱基错误、GC偏好性等数据偏差,这些数据偏差会对下游应用研究产生重要影响。BioNano光学图谱实验由于受到系统内部和外部来源的变化和干扰,图谱实验系统输出的数据也存在偏差,这些数据偏差势必会对下游应用研究产生深远影响。例如,BioNano光学图谱中的DNA分子上的标记错误可能导致错误的结构变异解析;不均匀的分子覆盖深度分布可能阻碍低覆盖深度区域的单体型分辨。因此,有必要对BioNano的数据特性展开分析研究。然而目前,还没有对BioNano分子数据的性质、偏差、误差分布以及影响它们的可能因素的系统调查研究。为此,我们基于真实的图谱数据,系统研究了BioNano的基本数据特性,包括分子长度,假标记信号,光学分辨率的变化和覆盖分布偏差等,以及由于诸如嵌合分子、脆性断裂位点和DNA分子延伸等因素引起的BioNano数据变化。进一步,我们研究分析了这些数据特征的数学模型,开发出一个名为BMSIM的数据模拟器,它捕获了BioNano数据的主要特征。BMSIM不仅可用于图谱组装程序的评估,还可用于光学图谱的实验设计。我们利用BMSIM模拟器开展计算模拟,首次系统评估了五类主要图谱实验可变因子对基因组光学图谱拼装结果的影响,揭示了光学图谱的组装规律。


Figure. Coverage distribution bias and fragile sites of BioNano molecules.

(3)转录组和代谢流分析揭示水稻籽粒发育过程中的代谢模式的变化
水稻(Oryza sativa)是最重要的粮食作物之一,几乎可作为世界人口的一半食物来源。水稻发育过程的研究以及相关的生产策略取得了重大进展。然而,利用转录组学和代谢通量水平来对不同水稻组织在不同阶段上的发育过程的综合研究仍然缺乏。我们对于水稻中华11号进行了RNA-Seq测序并表征了分化组织的表达谱,包括孕穗期的叶,鞘,雄蕊,雌蕊,外稃和內稃,成熟籽粒期的胚,胚乳,外稃和內稃。通过将不同水稻组织的不同阶段的转录组数据与基因组规模的水稻代谢模型相整合,我们生成组织特异性模型并研究了代谢模式的转变,以及转录组学和代谢水平上的差异。我们发现虽然通量模式与基因表达模式不太相似,但是孕穗期和成熟籽粒期的组织可以通过初级代谢分别聚集在一起。而次级代谢的基因表达和通量分布在组织和阶段中更加多样化。本研究中还确定了关键的限速反应和途径。另外,我们比较了不同阶段的相同组织的模式和相同阶段的不同组织的模式。和代谢水平相比,基因表达水平上有更多改变的途径,这表明代谢能更鲁棒的反映表型,并且可能主要是复杂的转录后修饰的缘故。


Figure. Materials of Oryza.sativa collected in the study. Leaves, sheath, stamen, pistil, lemma and palea of booting stage, embryo, endosperm, lemma and palea of mature stage.

(4)水稻基因组拼装和序列结构解析
作为重要的农业作物,水稻参考基因组的完善对水稻功能基因组学研究至关重要。由于技术缺陷,基于克隆连克隆、全基因组鸟枪法等拼装策略组装的水稻基因组并不完善,仍然存在较多缺口及拼装错误,并且基因组上的高重复序列等复杂序列结构缺乏解析。新兴的BioNano物理图谱构建技术可辅助解析基因组复杂结构信息、完善基因组序列。我们尝试运用BioNano图谱对现有水稻两亚种基因组做序列完善和复杂结构解析。研究人员成功构建了两张水稻BioNano酶切图谱,其中粳稻Nipponbare图谱总长377.4M,contigN50为1.077M;籼稻93-11图谱总长393.5M,contigN50为1.374M。通过图谱与参考序列比对,研究人员发现粳稻Nipponbare参考序列较好,不存在大片段错误,但仍然存在262处(约8.78M)问题区域。相比粳稻Nipponbare,籼稻93-11参考序列存在更多问题,研究结果显示93-11参考序列存在3419处(约105.2M)问题区域,并且基因组上存在大的片段(几百kb至几M)缺失、倒置和插入。通过与先前版本参考序列比较,研究人员还发现最新版的参考序列引进了一些新的错误。利用图谱,研究人员还解析了水稻基因组复杂序列结构(许多为原参考序列gap区域),发现了许多新的片段串联重复。他们完善了一条原来被遗漏的位于Nipponbare参考序列11号染色体的BAC序列,该BAC序列实际全长211292bp,包含4个约44kb的大片段重复序列,由于该特殊重复结构,原来的序列拼装方法无法对该BAC序列准确组装。此外,研究人员还开发了基于图谱的序列校正生物信息学分析方法(BASCGF:BioNano Assisted Sequence Correction and Gap Filling)。利用该方法,研究人员重建了一个新版本的93-11参考基因组,校正了原93-11参考基因组28788个区域(约13M),完全(或部分)填补了6158个gap。


Figure. 在水稻Nipponbare 和 9311中发现的基因组结构变异

年度代表性论文:

  1. Jing XY#, Xie BR#, Chen LX, Zhang NB, Jiang YY, Qin H, Wang HB, Hao P, Yang S, Li X* (2018). Implementation of the CRISPR-Cas13a system in fission yeast and its repurposing for precise RNA editing. Nucleic Acids Research, 46(15):e90.
  2. Chen P, Jing XY, Ren J, Cao H, Hao P, Li X* (2018). Modelling BioNano optical data and simulation study of genome map assembly. Bioinformatics, 34(23):3966-3974.
  3. Shen FZ#, Wu XT#, Shi LX, Zhang H, Chen YM, Qi XQ, Wang Z*, Li X* (2018). Transcriptomic and metabolic flux analyses reveal shift of metabolic patterns during rice grain development. BMC Systems Biology, 12(Suppl 4):47.
  4. Huang Y, Cao Y, Li J, Liu Y, Zhong W, Li X*, Chen C*, Hao P* (2018). A survey on cellular RNA editing activity in response to Candida albicans infections. BMC Genomics, 19(Suppl 1):43.
  5. Cao Y, Cao R, Huang Y, Zhou H, Liu Y, Li X*, Zhong W*, Hao P* (2018). A comprehensive study on cellular RNA editing activity in response to infections with different subtypes of influenza A viruses. BMC Genomics, 19(Suppl 1):925.
  6. Huang W, Zhu Y, Wu W, Li X, Zhang D, Yin P, Huang J (2018). The Pentatricopeptide Repeat Protein SOT5/EMB2279 is Required for Plastid rpl2 and trnK Intron Splicing. Plant Physiol, 177(2):684-697.
  7. Tang G, Li Q, Xing S, Li N, Tang Z, Yu L, Yan J, Li X, Luo L (2018). The LsrB protein is required for Agrobacterium tumefaciens interaction with host plants. Mol Plant Microbe Interact, 31(9):951-961.
XML 地图 | Sitemap 地图