随着大数据平台建设的深入,行业内已具备处理海量数据的能力,但在轻量级数据规模场景下,尤其是以业务数据为主的场景,面临成本高、部署难、应变慢的问题。本项目旨在开发一个轻量级数据湖系统,专门针对特定业务数据资源进行特色化的分析、处理和维护,以解决轻量级场景下数据平台的效率和成本问题。该系统将服务于日常业务工作,通过高效整合数据资源,提供结构化、非结构化及业务数据的专项处理能力。
系统建成后,应能显著降低轻量级数据场景下的数据平台成本,简化部署流程,并提高对业务变化的响应速度。具体效果要求包括:
目前,行业内进行了多年的大数据平台建设,具备了海量数据的分析、处理、融合、应用能力,解决了行业内的通用数据分析应用问题。但针对以业务数据为主的轻量级数据规模场景下,存在成本高、部署难、应变慢等问题。本次研发的轻量级数据湖系统将针对特定业务数据资源进行特色化的分析、处理、维护等操作,形成具有针对性的业务工作能力,解决轻量级场景下数据平台成本高、部署难、应变慢的问题。本次轻量级数据湖系统针对以业务数据为主的轻量级图片11莫场景,提供处理、分析以及应用能力建设,高效整合所有的数据资源,具备针对结构化数据、非结构化数据及业务数据的专项处理能力,通过利用数据之间的关联关系,重点围绕“统一数据导入”、“统一资源管理”、“统一查询入口这三个贴合业务需求的核心应用能力开展系统建设工作,服务于日常业务工作。在数据导入方面,通过统一的数据上传入库,实现结构化、非结构化及业务数据原始资源的统一导入;在资源管理方面,通过可视化自定义模板配置能力,实现基于贴合业务应用的数据关联融合:在查询应用方面通过聚合式的检索入口,实现各类数据资源的一键检索,满足各类业务场景的高效支撑。
