当前植物可变剪接(AS)研究面临重大挑战:传统基于短读长RNA测序的方法无法有效捕捉植物中复杂独特的AS模式,且植物基因剪接特征显著不同于动物,缺乏专门针对植物优化的算法工具。这限制了全长测序数据的广泛应用,阻碍了对植物AS事件的深入探索和理解。
我们开发了iFLAS工具包,结合正负样本半监督学习(PU学习)技术,专为植物可变剪接研究设计。iFLAS提供一站式解决方案,集成差异可变剪接分析、多聚腺苷酸尾分析以及等位基因特异性剪接研究等多种功能。通过深入分析多个玉米数据集,iFLAS成功揭示了植物中常见的AS事件及其与转录本功能分化的关系,为全面探索植物AS事件及其调控作用提供了有力支持。
iFLAS工具包在准确性、稳健性方面表现优异,成功扩展至水稻、拟南芥等其他植物,展现出广泛的适用性。其独特的算法设计针对植物优化,有效克服了现有方法的局限性。iFLAS不仅为复杂转录组过程的研究提供了新视角,还为理解植物适应性机制、促进分子育种创新开辟了新途径,具有显著的原始创新性和行业领先地位。
20250123
农、林、牧、渔业
该成果已形成相应的算法和软件工具。
该成果属于算法工具类创新,对合作方无特殊要求。
仅限国内转让
该成果算法的提出填补了植物领域全长转录组研究的关键技术空白,推动了数据驱动的转录组学研究方法体系化,为剪接调控机制研究提供了多维度的解析工具,推动了植物功能基因组学的发展。该成果用于精准育种和分子设计育种,助力农业可持续发展,保障粮食安全。
北京市自然科学基金面上项目
北京市科学技术委员会;中关村科技园区管理委员会
全长转录组测序技术的兴起极大地推动了新型可变剪接(AS)转录本的发现,但现有方法多基于短读长RNA测序或人类与动物研究,无法有效捕捉植物中复杂而独特的AS模式。植物基因的剪接特征显著不同于动物,内含子滞留(IR)在植物中更为普遍,且与转录本功能分化密切相关。然而,高错误率和高成本限制了全长测序数据的广泛应用,同时缺乏专门针对植物优化的算法工具。因此,我们开发了iFLAS工具包,结合正负样本半监督学习(PU学习)技术,克服现有方法的局限性,提供一站式解决方案。iFLAS集成了多种功能,包括差异可变剪接分析、多聚腺苷酸尾分析以及等位基因特异性剪接研究。通过分析多个玉米数据集,我们发现IR是最常见的AS事件,通常引入早期终止密码子,导致转录本表达水平降低。我们的研究还揭示了poly(A)尾长度与3'非翻译区(UTR)长度之间的相关性,强调了它们在转录本稳定性和功能中的关键作用。此外,组织特异性剪接模式与功能分化以及环境响应密切相关,而等位基因特异性剪接分析则揭示了特定单倍型剪接模式在杂种优势育种中的潜在作用。iFLAS在与现有工具的对比中表现出更高的准确性和稳健性,并成功扩展至水稻和拟南芥等其他植物,为全面探索植物AS事件及其调控作用提供了重要支持。这一工具的开发为研究复杂转录组过程、理解植物适应性机制以及促进分子育种创新开辟了新的可能性。
