当前空间转录组学技术在分辨率、测序深度和细胞通量方面存在局限性,无法实现高精度的单细胞空间定位与基因表达重建,限制了对组织结构和功能的深入解析。
本成果提出了一种名为‘SPADE’的算法,其核心在于构建一个多目标优化模型,将单细胞RNA测序数据精确映射到空间转录组数据上。该模型融合了两个关键生物学约束:基因表达相似性约束和细胞通讯空间约束。技术流程包括深度学习特征提取、优化问题求解及下游分析模块,通过编码器提取单细胞数据的低维嵌入特征,在优化框架下同时最小化重构损失和细胞类型判别损失,并加入细胞通讯与距离一致性打分,最终利用GPU加速求解,输出每个单细胞最可能的空间坐标、增强后的空间基因表达谱以及每个空间单元的细胞通讯强度。
SPADE算法在映射准确性、鲁棒性、生物学发现能力和平台通用性方面展现出显著优势。在模拟数据集上,其均方根误差等指标显著低于现有主流方法;在单细胞数据与空间数据不完全匹配的情况下,仍能保持较高的映射准确性;在多个生物学场景中,能清晰重构组织形态,发现空间高变基因,并识别细胞通讯热点;算法成功应用于多种技术平台产生的数据,展示了广泛的兼容性。这些优势使得SPADE算法成为一项前沿的生物信息学工具,具有广阔的应用前景。
20251127
科学研究和技术服务业
一、 技术成熟度评估 目前系统/子系统模型或原型已在相关环境中完成演示验证。具体表现为: 算法原型完善:已完成完整的算法模型构建和软件工具开发,包括R语言编写的细胞相互作用计算模块和Python语言编写的优化求解模块。 多场景验证充分:在模拟数据集和多个真实数据集(包括小鼠脑皮层、人脑皮层、乳腺癌、结直肠癌肝转移等)上进行了系统验证,证明了算法的鲁棒性和准确性。 性能指标量化:在模拟数据测试中,该算法的RMSE(均方根误差)显著低于现有主流方法;在脑皮层数据重构中,与真实值的差异最小,分层结构重建准确;在乳腺癌数据中,空间高变基因发现数量提升,空间自相关性显著提高; 二、 技术优势指标 精度指标:在40个数据集和5个真实数据集的综合模拟研究中,算法准确性优于其他反卷积方法 兼容性指标:支持从55μm(10X Visium)到亚细胞级别(Slide-seq2)的不同分辨率平台 功能拓展性:具备下游细胞通讯量化模块,可识别空间互作热点区域 三、性能参数情况 深度学习特征提取:采用嵌入模块提取最具信息量的细胞类型识别特征 多约束优化模型:同时优化转录组相似性和细胞通讯空间约束 单位空间通讯量化:首次实现单个空间位置(spot)水平的细胞互作强度计算 四、科技成果所处转化阶段 (一)当前转化阶段:技术推广与初步应用阶段 (二)具体转化进展 知识产权保护:已申请专利1项,正在实质审查阶段 软件工具开发:已完成算法软件包封装,具备商业化基础 学术认可度:相关论文正在高水平期刊投稿过程中 初步应用验证:在肿瘤免疫微环境解析、脑科学研究等领域显示出应用潜力
可国(境)内外转让
一、预期经济效益 (一)直接经济收益 软件授权收入:预计首年可实现:科研机构授权收入200-500万元 技术服务收入:数据分析服务:年收入100-300万元 (二)间接经济价值 促进相关产业发展:推动单细胞测序技术服务市场规模增长,带动空间转录组技术应用普及 降低研发成本:为药物研发提供更精准的靶点识别工具 二、预期社会效益 (一)医疗健康领域 肿瘤精准医疗突破:为肿瘤免疫治疗提供新的生物标志物,识别THBS-CD47等新的免疫治疗靶点 疾病机制解析:深化对疾病的理解,促进罕见病发病机制研究 (二)科研创新推动 方法学革新:为全球科研界提供更精准的空间多组学分析工具,细胞通讯研究的新范式 跨学科融合:推动计算生物学与临床医学的深度融合,多组学数据整合分析标准建立
北京市自然科学基金本科生“启研”计划
北京市科学技术委员会;中关村科技园区管理委员会
一、 科技成果来源 本科技成果来源于北京市自然科学基金本科生“启研”计划项目(项目编号:QY23058),由北京大学承担完成。项目核心目标是解决当前空间转录组学技术在分辨率、测序深度和细胞通量方面的局限性,通过创新算法整合单细胞转录组数据与空间转录组数据,实现高精度的单细胞空间定位与基因表达重建,为解析组织结构和功能提供新工具。 二、 技术原理 本成果的核心技术“SPADE”算法,其基本原理在于构建一个多目标优化模型,将单细胞RNA测序数据精确映射到空间转录组数据上。该模型创新性地融合了两个关键生物学约束:
