多源生物信息库大数据平台应用场景
一、场景内容开滦医疗健康产业集团(开滦总医院)是一所集医疗、教学、科研、预防、康复于一体的国家首批大型三级甲等综合医院。本项目拟建立开滦生物信息库大数据平台,通过云计算、大数据、人工智能等先进技术,整合政府相关管理部门、各级医疗机构及患者个人的诊疗相关数据,对已有健康信息数据进行深度挖掘和分析,发现其中的潜在模式和规律,实现数据互联融合、开放共享,为医院科研分析、慢病管理、远程服务和管理决策等提供支撑。
二、基础条件开滦总医院现有数据库存有健康数据、诊疗数据、影像检查数据、基因测序数据、细胞学和组织学数据等超过5000万条数据记录,超100万份影像学图像,80万份生物样本,可为项目实施提供数据支撑。
技术需求
1.动态调配通用算力,支持TB级内存调用,支持PB级数据存储,秒级调用;
2.大模型支持:分布式计算、模型并行和数据并行、混合精度训练等;
3.数据隐私与安全性:建立数据隐私保护机制和安全的数据存储系统,防止数据泄露和非法使用。
面议