
马利娜,在中国科学院北京基因组研究所(国家生物信息中心)担任研究员,主要研究方向为生物信息学,具体涉及基因组学数据分析、生物大数据挖掘、生物信息算法开发等领域,致力于通过生物信息学手段解析生物数据的奥秘,为生命科学的研究提供技术支持和理论依据。
LGC软件旨在解决长非编码RNA(lncRNA)鉴定中的准确性和跨物种应用难题。在生物学研究中,准确区分lncRNA与蛋白质编码RNA对于理解基因功能、疾病机制及生物进化至关重要。传统方法往往依赖于物种特异性训练集,限制了其在多物种研究中的应用,且鉴定准确度和效率有待提升。
LGC软件采用基于序列特征关系的技术方案,核心在于利用开放阅读框(ORF)长度和GC含量之间的独特关系来鉴定lncRNA。该技术原理不依赖于物种特异性数据,实现了跨物种的通用性。LGC的技术架构简洁高效,通过先进的算法模型,能够准确区分lncRNA与蛋白质编码RNA,准确度超过90%,同时保持了良好的灵敏度和特异性平衡。用户只需提供fasta格式的序列文件作为输入,即可快速获得鉴定结果。
LGC软件在lncRNA鉴定领域展现出显著的竞争优势。首先,其跨物种鉴定的能力极大地拓宽了应用范围,适用于从植物到哺乳动物等多种生物体的研究。其次,LGC在保证高准确度的同时,计算速度更快,显著提升了研究效率。此外,软件使用简便,降低了操作门槛,使得非专业用户也能轻松上手。作为原始性创新成果,LGC在技术上具有前瞻性和创新性,为lncRNA研究提供了强有力的工具支持。
20211230
科学研究和技术服务业
应用技术
新技术
不转让
部门计划
独立研究
LGC基于ORF(开放阅读框)长度和GC含量之间的关系来鉴定lncRNA。 LGC能够以跨物种方式准确地区分lncRNA与蛋白质编码RNA,不依赖物种特异性训练集。基于已有数据集的验证,LGC可以实现在从植物到哺乳动物的lncRNA与蛋白质编码RNA的准确鉴定(准确度>90%),同时具有较为平衡的灵敏度与特异性。相比于同类型软件,LGC计算速度更快,使用简单,输入文件只需要一个fasta格式的序列文件。
