面向大规模医学影像疾病筛查的异常检测算法研究

联系合作
医药健康
新一代信息技术
成果单位: 北京理工大学
合作方式: 技术许可
所处阶段: 概念
关键词: 大规模公共卫生筛查临床智能辅助诊断眼底病筛查肺病筛查医学影像分析图像质量增强高灵敏度检测任务驱动降质感知异构重构异常信号放大局部对比学习跨域鲁棒统一检测双路径融合异构设计信号放大双向约束
总得分 (满分100)
0
资本强度 (满分0)
该成果得分:0

核心问题

医学影像数据指数级增长与专业医生短缺之间的矛盾,导致传统人工阅片效率低下且易漏诊。同时,主流监督学习AI依赖大规模专家标注数据,难以识别未知的罕见病变。

解决方案

本项目构建了从“图像质量增强”到“高灵敏度检测”的完整闭环技术体系,包含四个递进阶段:

  1. 任务驱动的降质感知图像增强网络:针对临床影像模糊、噪声及光照不均问题,提出自适应增强模型,通过退化感知、双路径融合和闭环优化,提供高质量输入。
  2. 基于异构重构的异常信号放大框架 (Hetero-AE):采用非对称结构,结合CNN和混合CNN-Transformer架构,通过多尺度稀疏注意力机制,放大病变区域的重构误差,精准捕捉微小病灶。
  3. 基于局部对比学习的可解释性特征空间 (patchCL-AE):引入块级对比学习范式,构建紧凑的正常样本流形,生成高精度像素级热力图,提供可解释的诊断依据。
  4. 跨域鲁棒的统一检测框架 (ReContrast):提出编解码双向对比约束框架,平衡全局语义保持与局部异常放大,确保在不同模态数据间的高效迁移与适配。

竞争优势

本成果在Messidor、APTOS、OCT2017等权威医学数据集及MVTec AD工业数据集上验证,核心指标达到国际领先水平。在图像增强性能上,PSNR和SSIM显著优于主流方法,下游诊断AUC值接近高质量原图水平。在异常检测精度上,AUC、灵敏度和特异性均极高,极大降低漏诊风险并有效控制误报率。泛化能力强,在脑部MRI、胸部X射线筛查及工业质检中均表现出色,证明了算法的跨领域通用性。本成果理论创新性强,技术成熟度高,能够显著提升医疗诊断效率与覆盖面,具有广阔的应用前景。

成果公开日期

20251127

所属产业领域

卫生和社会工作

转化现有基础

一、技术研发成熟度 本项目《面向大规模医学影像疾病筛查的异常检测算法研究》已完成核心算法的理论构建、模型设计与代码实现。技术体系架构完整,逻辑闭环,已具备进行工程化移植和二次开发的坚实基础。

  1. 算法模型体系已固化 项目组成功研发并验证了具有独立知识产权的四大核心技术模块,形成了从“图像预处理”到“精准诊断”的全链路技术闭环: 降质感知图像增强模块: 已实现针对医学影像模糊、噪声、光照不均等问题的自适应修复,代码可自动识别退化类型并完成高质量重建,解决了临床数据质量参差不齐的工程难题。 异构重构检测模块(Hetero-AE): 成功构建了非对称的“CNN编码器+混合Transformer解码器”架构,从底层逻辑上解决了传统模型对微小病灶不敏感的问题,模型结构稳定。 可解释性特征模块(patchCL-AE): 完成了基于块级对比学习的特征空间构建,具备输出像素级异常热力图(Heatmap)的能力,为开发可视化的医生辅助工作站提供了核心技术支撑。 跨域统一框架(ReContrast): 实现了端到端的双向对比约束训练框架。该框架具备极强的泛化能力,一套代码即可适配眼底、脑部、胸部等多种模态,大幅降低了跨病种应用开发的边际成本。
  2. 验证环境与算力适配 所有核心算法均基于 PyTorch 深度学习框架完成开发,代码模块化程度高。算法已在标准 Linux 环境及消费级显卡(如 RTX 3090)上完成推理测试,证明了该技术不依赖昂贵的超算集群,具备在基层医院常用高性能 PC 工作站上部署的可行性。 二、关键性能指标验证 本成果在 Messidor、APTOS、OCT2017、MVTec AD 等多个国际权威公开数据集上进行了严格的定量测试。各项核心指标均达到或超越了当前学术界的最高水平(State-of-the-Art, SOTA),为技术转化提供了强有力的数据背书。
  3. 图像增强性能(数据质量保障) 在 Messidor 眼底数据集上的测试表明,本技术能显著提升图像质量并辅助后续诊断: 峰值信噪比 (PSNR): 增强后图像均值达到 28.243 dB,显著优于主流生成对抗网络(CycleGAN为20.42dB),有效保留了原始病理信号。 结构相似性 (SSIM): 达到 0.8968,证明增强过程未引入虚假纹理或病灶。 下游诊断增益: 使用增强后图像进行病变分级,其 AUC 值从低质量原图的 0.6898 提升至 0.8918,直接证明了技术对临床诊断流程的优化作用。
  4. 异常检测核心指标(高灵敏度筛查) 在最具代表性的眼底 OCT 视网膜病变筛查任务中,算法展现了极高的可靠性: 检测准确性 (AUC): 统一框架 ReContrast 取得了 99.60% 的 AUC 值,显著优于国际基线算法。 筛查灵敏度 (Sensitivity): 达到 99.66%,意味着在测试集中几乎没有漏掉任何一个病变样本,极大降低了漏诊风险。 特异性 (Specificity): 达到 94.81%,有效控制了假阳性误报,减少了医生复核工作量。
  5. 多模态泛化指标 为证明技术的通用性,算法在非眼科数据及工业数据上均表现优异: 脑部 MRI 检测: 实现了 99.20% 的 AUC 和 98.16% 的分类准确率。 胸部 X 射线筛查: 在纹理复杂的胸片中,AUC 达到 91.12%,远超传统重建方法(约85%)。 工业级标准: 在 MVTec AD 数据集上,图像级 I-AUROC 达到 99.45%,证明算法核心引擎已达到精密检测标准。 三、科技成果所处阶段:实验室验证阶段 根据技术就绪度评估,本成果目前处于技术验证与算法原型阶段。具体界定如下:
  6. 验证场景说明 目前的性能指标主要基于国际公认的标准公开数据集(Public Datasets)获得。这些数据集经过清洗和标注,具有高度的权威性,验证了算法在理论层面的先进性和鲁棒性。然而,算法尚未在真实、复杂、多中心的临床环境(Real-world Clinical Settings)中进行大规模前瞻性验证。
  7. 产品化程度 成果目前主要以“算法模型、源代码、预训练权重及实验数据”的形式存在。尚未封装成可供医生直接操作的图形化软件产品(GUI),也未集成到医疗器械硬件中。
  8. 合规性进程 本成果属于核心技术研发阶段,尚未启动二类或三类医疗器械的注册检验、质量体系考核及临床评价流程。 总结: 本项目已完成了“从0到1”的核心技术突破,拥有成熟的理论架构和SOTA级别的性能指标。现有的实验室验证基础扎实可靠,已具备向“工程化开发与中试阶段”跃升的条件,适合通过产学研合作,开展后续的产品化封装与临床注册申报工作。

转化合作需求

科技成果转化合作要求 本科技成果已完成核心算法的理论构建与实验室验证,具备优秀的性能指标。为将该技术从“实验室代码”转化为“临床级医疗产品”,并最终获得医疗器械注册证实现上市销售,对合作方提出以下转化资源要求: 一、资金投入要求 鉴于医疗人工智能产品研发周期长、注册门槛高,合作方需提供充足的资金保障,以支撑从原型优化到产品获证的全过程。 研发与工程化资金: 能够支持算法从Python实验代码向工程化代码(如C++ SDK封装、DICOM标准对接、图形化界面开发)转化的开发成本。 临床试验与注册专项资金: 这是资金投入的重点。 合作方需承担医疗器械注册检验(型式检验)、质量体系(GMP)建立、以及多中心临床试验(涉及伦理审查、数据采集、医院合作费用及CRO服务费)的高额费用。 资金规模预期: 建议合作方具备300万-500万元人民币以上的初期专项投入预算(根据申报二类或三类医疗器械不同而异),并具备后续持续投入的能力,以保障项目在1.5-2年周期内顺利获证。 二、场地与环境要求 为了满足医疗器械软件生产质量管理规范(GMP)及数据安全合规要求,合作方需提供以下场地支持: 合规的研发与生产场地: 提供符合医疗器械软件生产要求的办公场地,具备独立的软件开发区、测试区和服务器机房。场地需满足物理隔离或逻辑隔离要求,以通过后续的体系考核。 数据安全环境: 鉴于医学影像数据的敏感性,必须提供符合国家数据安全法及HIPAA标准的数据处理环境。包括具备内网隔离条件的标注室、部署了防火墙及行为审计系统的私有云或本地服务器机房,确保患者隐私数据的绝对安全。 三、设备与硬件支持要求 本成果属于深度学习应用,对算力和影像采集设备有特定要求,合作方需配备以下硬件资源: 高性能计算集群: 训练端: 提供高性能GPU服务器集群(如NVIDIA A100/H800或RTX 4090集群),用于大规模数据的增量训练、模型微调及超参数优化。 存储端: 配备PB级的安全存储系统(NAS/SAN),支持海量医学影像数据的高速读写与备份。 医学影像集成测试设备: 为了实现算法与医疗硬件的“软硬结合”,合作方最好拥有或能协调获取眼底相机、OCT设备、DR设备或MRI工作站。 用于测试算法嵌入设备端的兼容性、实时推理速度以及与医院PACS系统(影像归档和通信系统)的接口连通性。 四、人员与团队能力要求 本成果仅提供核心算法团队,合作方需要补齐工程化、法规注册及临床医学方面的团队短板: 工程化开发团队: 拥有资深的软件架构师和全栈工程师,能够将PyTorch模型转换为高性能推理引擎(如TensorRT, ONNX Runtime),并开发符合医生操作习惯的前端交互界面(GUI)。 具备DICOM医学影像协议处理经验的工程师。 注册法规(RA/QA)团队: 这是转化的关键。 必须拥有熟悉《医疗器械软件注册审查指导原则》及人工智能医疗器械审评要求的专业人员,负责撰写注册申报资料、建立质量管理体系,并与药监局(NMPA)进行沟通。 临床医学专家资源: 能够链接三甲医院的眼科、放射科专家资源。一方面用于对算法结果进行“金标准”标注和验证;另一方面作为临床试验的牵头单位(PI),确保临床验证方案的科学性。 市场渠道团队: 具备成熟的医疗器械销售渠道,能够将最终产品推广至基层医疗机构、体检中心或等级医院。

转化意向范围

仅限国内转让

转化预期效益

成果转化的社会效益 本项目的科技成果“面向大规模医学影像疾病筛查的异常检测算法”若能成功实现产业化转化并推广应用,将产生显著且深远的社会效益,主要体现在提升公共卫生服务效率、优化医疗资源配置、保障国民健康水平以及推动医学科研创新四个维度:

  1. 破解“阅片难”瓶颈,显著提升大规模疾病筛查的效率与覆盖面 当前,医学影像数据呈爆炸式增长,而专业放射科与眼科医生的人力缺口巨大,导致人工阅片效率难以满足老龄化社会日益增长的健康筛查需求。本成果转化的AI系统能够充当“数字全科医生”,具备7×24小时不间断工作的能力。在社区卫生服务中心、体检中心等基层场景中,该系统可对眼底彩照、胸部X光等海量影像进行毫秒级的自动化初筛,快速过滤掉90%以上的健康样本,精准锁定可疑病变。这将极大地释放医生精力,使大规模、普惠性的国民健康筛查(如糖尿病视网膜病变筛查、肺结节筛查)成为可能,显著提升公共卫生服务的效率与覆盖人群。
  2. 推动优质医疗资源下沉,赋能基层医疗与分级诊疗体系 我国医疗资源分布不均,三甲医院人满为患,而基层医疗机构缺乏经验丰富的影像诊断专家,容易造成漏诊。本成果基于无监督学习技术,不依赖昂贵的专家标注数据,易于部署在算力有限的基层设备中。转化后的产品可作为“专家辅助系统”赋能基层医生,为其提供达到三甲医院水平的诊断参考(如生成像素级病变热力图)。这有助于将优质医疗能力“下沉”至县乡一级,提升基层对常见病及隐匿性病变的识别能力,真正推动“基层首诊、双向转诊、急慢分治、上下联动”的分级诊疗制度落地,促进社会医疗公平。
  3. 实现疾病“早筛早治”,降低致残致死率,减轻社会疾病负担 本成果的核心优势在于高灵敏度的异常检测能力,能够捕捉到肉眼难以察觉的微小早期病变。在临床应用中,这直接转化为对糖尿病视网膜病变、青光眼、早期肺癌、脑部肿瘤等重大疾病的“早发现、早诊断、早治疗”。通过在不可逆病变发生前进行干预,能有效降低致盲率、致残率和死亡率,显著提高患者的生存质量。从卫生经济学角度看,疾病关口前移将大幅减少中晚期重症治疗的高昂费用,从而减轻患者家庭的经济负担和国家医保基金的支付压力。
  4. 解决罕见病与未知病变识别难题,提升医疗安全与应急能力 传统的监督学习AI模型无法识别训练集中未包含的疾病,存在极大的安全隐患。而本成果采用“异构重构”与“对比学习”的无监督范式,对任何偏离正常生理结构的形态均保持高度敏感。这意味着转化后的系统不仅能识别常见病,更能敏锐捕捉罕见病、非典型病变甚至未知的新发传染病征兆(如未知病毒引起的肺部影像异常)。这一特性将构建起一道坚实的医疗安全防线,有效降低漏诊率,并为应对突发公共卫生事件提供强大的技术预警支撑。

项目名称

北京市自然科学基金外籍学者“汇智”项目

项目课题来源

北京市科学技术委员会;中关村科技园区管理委员会

摘要

一、科技成果来源

  1. 项目基本信息 本技术成果来源于北京市自然科学基金外籍学者项目,项目编号12100000400009127B-IS23112/01,项目名称**《面向大规模医学影像疾病筛查的异常检测算法研究》。项目依托单位为北京理工大学,负责人为李慧琦教授。
  2. 研发背景 面对医学影像数据呈指数级增长与专业医生短缺的矛盾,传统人工阅片效率低且易漏诊。同时,主流监督学习AI依赖昂贵的大规模专家标注数据,且难以识别未知的罕见病变。本项目聚焦于无监督/自监督异常检测技术,仅需使用“正常”样本训练即可识别异于健康分布的各类病变,是实现低成本、自动化大规模疾病筛查的关键技术路径。 二、技术原理 本成果构建了从“图像质量增强”到“高灵敏度检测”的完整闭环技术体系,通过四个递进的创新阶段解决医学影像分析的核心痛点: (一)任务驱动的降质感知图像增强网络 针对临床影像普遍存在的模糊、噪声及光照不均问题,提出了一种自适应增强模型,为检测提供高质量输入。 退化感知: 内置分类器自动识别图像的具体退化类型(如暗光、白内障模糊等)及程度,生成退化特征向量。 双路径融合: 结合“局部退化注意力”修复纹理细节,与基于FFT的“全局频谱卷积”纠正整体光照分布,实现互补增强。 闭环优化: 引入退化感知损失函数,确保增强图像在去除伪影的同时最大程度保留病理结构信息。 (二)基于异构重构的异常信号放大框架 (Hetero-AE) 针对传统自编码器易产生“恒等映射”导致无法检出异常的问题,提出异构自编码器架构。 异构设计: 采用非对称结构,编码器使用CNN提取局部特征,解码器采用混合CNN-Transformer架构建模长程依赖。 信号放大: 利用两种架构对正常样本拟合能力强、但对未知异常重构差异大的特性,通过多尺度稀疏注意力机制,显著放大病变区域的重构误差,从而精准捕捉微小病灶。 (三)基于局部对比学习的可解释性特征空间 (patchCL-AE) 为解决特征边界模糊及模型“黑盒”问题,引入块级对比学习范式。 块级约束: 强制模型拉近重构图像块与原始图像块在特征空间的距离,构建紧凑的正常样本流形。 可解释性: 任何病变区域因无法映射到该流形而产生巨大特征距离。算法据此生成高精度像素级热力图(Heatmap),直观标记病灶位置,为医生提供可解释的诊断依据。 (四)跨域鲁棒的统一检测框架 (ReContrast) 针对跨设备、跨模态导致的泛化难题,提出编解码双向对比约束框架。 双向约束: 在编码与解码两端同时施加一致性约束,平衡全局语义保持与局部异常放大。 抗崩溃机制: 引入“停止梯度”与难例挖掘策略,防止无监督训练中的模型坍塌,确保在眼底、脑部、胸部等不同模态数据间的高效迁移与适配。 三、关键性技术指标 本成果在Messidor、APTOS、OCT2017等权威医学数据集及MVTec AD工业数据集上进行了广泛验证,核心指标达到国际领先水平(SOTA)。
  3. 图像增强性能 在Messidor眼底数据集上: 峰值信噪比 (PSNR): 达到 28.243 dB,显著优于CycleGAN (20.42 dB) 等主流方法。 结构相似性 (SSIM): 达到 0.8968,保真度极高。 下游诊断提升: 辅助诊断AUC值从0.6898提升至 0.8918,接近高质量原图水平。
  4. 异常检测精度 在眼底OCT视网膜病变检测中: 曲线下面积 (AUC): ReContrast统一框架达到 99.60%,Hetero-AE达到98.94%。 灵敏度 (Sensitivity): 高达 99.66%,极大降低漏诊风险。 特异性 (Specificity): 达到 94.81%,有效控制误报率。
  5. 泛化能力 脑部MRI检测: AUC达到 99.20%,分类准确率 98.16%。 胸部X射线筛查: 在复杂背景下AUC达到 91.12%,远超传统重建方法。 工业质检: 在MVTec AD数据集上I-AUROC达到 99.45%,像素级分割精度 98.4%,证明了算法的跨领域通用性。 四、应用前景 本成果理论创新性强,技术成熟度高,能够显著提升医疗诊断效率与覆盖面,具有广阔的应用前景。
  6. 大规模公共卫生筛查 该技术不依赖特定病种标注,适合部署于社区卫生中心或体检车,对眼底病、肺病等进行“地毯式”初筛。系统能自动过滤绝大多数健康人群,精准锁定可疑病例并分流至专科医院,是缓解医疗资源分布不均。
  7. 临床智能辅助诊断 (CDSS) 算法生成的高精度热力图可作为医生的“第二诊疗意见”。它能直观勾勒病灶轮廓,帮助医生(尤其是基层医生)快速发现微小或隐蔽病变,防止视觉疲劳导致的漏诊。
试试对话AI技术经理人
WENXIAOGUO
问小果
该成果有哪些相似成果?
该成果可能有哪些需求方?
该成果的市场前景如何?
北京理工大学的相关成果还有哪些?