在儿童遗传罕见病领域,随着精准医疗和基因测序技术的快速发展,通过基因检测手段对罕见病进行早期诊断和治疗已成为可能。然而,当前罕见病数据库的建设面临诸多挑战,尤其是数据类型单一、数据质量参差不齐的问题尤为突出。现有的数据库大多仅包含单一的病历资料或生物组学数据,缺乏随访资料、影像文件等多模态数据的整合,这极大地限制了辅助决策系统的完整性与可靠性。因此,为了提升儿童罕见病的诊断准确性和治疗效率,急需研发一套能够整合多模态数据、确保数据安全并提供高效辅助决策支持的基因检测技术。该技术将广泛应用于儿童医院、遗传病诊断中心以及科研机构,为医生提供全面、准确的患者数据,助力精准医疗的实施。
在儿童遗传罕见病领域,研发中已经出现了多项难题和卡点,其中引起广泛关注的包括:所建设的罕见病数据库的数据类型比较单一,并未形成包括病历资料、随访资料、生物组学数据、影像文件在内的多模态数据中心,同时数据质量也有待提升,导致辅助决策结论的完整性与可靠性的不足。达到的关键指标进一步整合多模态数据,完善多模态数据库的底层数仓层级架构和安全性,实现脱敏,最大可能地防止数据泄露。开发算法将知识图谱和大语言模型进行融合,利用知识图谱的结构化知识、强决断性、强可解释性以及知识演进能力对大语言模型进行互补。
