1.一种基于深度学习的油井增产措施优选及效果预测方法,其特征在于,采用了LightGBM和CatBoost两种深度学习方法进行措施优选和效果预测,具体包括如下步骤:步骤1、收集待预测油井的历史措施数据;步骤2、采用Mini Batch K-Means聚类算法对历史措施数据进行聚类,筛选得到措施增产数据集;步骤3、对措施增产数据集进行相关性分析,选取特征参数;步骤4、对选取特征参数后的措施增产数据集进行一系列数据预处理,并将处理后的数据按比例划分测试集和验证集;所述步骤4的具体过程如下:步骤4.1、采用删除和填充相结合的方式进行缺失值处理;一条数据中,若缺失值超过5个,则直接删除整条数据;否则,采用随机森林算法预测缺失值,将预测值作为默认的正确值填充到此条数据中;步骤4.2、根据数据集维度情况,使用孤立森林算法或者DBScan聚类算法进行数据异常值处理;高维数据采用孤立森林算法进行数据异常值删除;低维数据采用DBScan聚类算法进行数据异常值删除;步骤4.3、使用LDA线性判别分析法对数据进行降维处理;步骤4.4、对数据进行定性特征二值化;步骤4.5、对数据进行定性特征编码,将表示类别的字符串信息编码后转化为可计入模型的数值信息;步骤4.6、对数据进行无量纲化处理,将所有不同格式数据转换到统一格式;步骤4.7、对数据添加增产措施效果标签,对措施数据添加类别标签;步骤4.8、将预处理后的增产措施数据集以8:2的比例划分为训练集和测试集;步骤5、分别构建基于LightGBM的措施预测模型和基于CatBoost的措施预测模型;对每个模型均进行训练及优化,得到训练完成的两个模型,并计算两个模型的准确率,将准确率高的模型作为最终的措施预测模型;所述步骤5中,两种措施预测模型的输入均为井况数据、地质参数以及措施数据,输出均为措施类型;数据输入模型前需要进行归一化处理,归一化方法为: (1);式中, 为归一化处理后的数值,取值范围在[-1,1]之间; 为预处理后的措施增产数据集中每个参数的最小值; 为预处理后的措施增产数据集中每个参数的最大值;两个模型均采用训练集进行模型训练,采用测试集验证模型;采用测试集进行测试时,将测试集输入训练完成的模型得到预测结果,与实际的措施进行比对,计算预测准确率,当准确率高于80%,输出预测模型;否则,调整模型参数后重新训练优化模型;选择准确率更高的模型进行措施预测;然后将训练好的模型先针对一部分急需进行措施优选的油井进行预测,将模型优选出的措施进行实施并记录效果预测效果,将实际的效果预测效果与模型预测的效果进行比对,将满足生产需求的油井数据与措施实施数据重新放入训练集中进行训练,继续优化模型;基于LightGBM的措施预测模型训练时,采用贝叶斯调参法进行模型调参,寻找进行措施优选分类预测结果的最优参数组合;基于CatBoost的措施预测模型训练时,无需调参,采用默认参数;两个措施预测模型的训练过程均基于python语言实现,导入相应的模型包后通过python语言自动训练完成,但定义的超参数不同;LightGBM定义的模型超参数包括学习率、弱学习器的类型、叶子个数、树的最大深度,CatBoost定义的模型超参数包括习率、树深、L2正则参数、特征包含不同值的最大数目;步骤6、分别构建基于LightGBM的回归模型和基于CatBoost的回归模型并进行训练评估;选择评估指标中拟合优度高的回归模型作为最终的效果预测模型;所述步骤6中,基于LightGBM的回归模型和基于CatBoost的回归模型的模型输入相较于措施预测模型多一个实施措施特征参数,其余相同;回归模型的输出为实施优选措施后的效果,效果具体为增油百分比或者增油量;模型评估时,选择拟合优度、均方误差、平均绝对误差、可解释方差值作为四个评估指标;当拟合优度达到80%时,输出预测模型;否则,调整模型参数后重新训练优化模型;选择拟合度更高的模型进行效果预测;其中,拟合优度的计算公式为: (7);其中, 为拟合优度计算结果, 表示残差平方和, 表示总离差平方和;步骤7、将当前待测油井的地质参数和井况数据同时输入到最终的措施预测模型,预测最优增产措施;再将待测井相关参数以及预测的措施输入最终的效果预测模型,预测实施优选措施后的效果。
2.根据权利要求1所述基于深度学习的油井增产措施优选及效果预测方法,其特征在于,所述步骤1中,收集的历史措施数据包括井况数据、地质参数、措施数据、增产措施实施效果及生产状态数据。
3.根据权利要求1所述基于深度学习的油井增产措施优选及效果预测方法,其特征在于,所述步骤2中,筛选得到措施增产数据集的具体过程为:步骤2.1、将措施增产作为筛选的唯一指标,首先抽取历史措施数据中的部分数据集,使用Mini Batch K-Means聚类算法构建出K个聚簇点的模型;步骤2.2、再次抽取历史措施数据中的部分数据集,并将其添加到模型中,分配给距离最近的聚簇中心点;步骤2.3、更新聚簇的中心点值,每次更新都只用抽取出来的部分数据集;步骤2.3、循环迭代步骤2.2和步骤2.3,直到中心点稳定或者达到迭代次数,停止循环,此时输出得到所需的措施增产井数据集。
4.根据权利要求1所述基于深度学习的油井增产措施优选及效果预测方法,其特征在于,所述步骤3中,采用斯皮尔曼相关性分析进行特征参数选取,针对措施增产数据集中的每种措施,均通过斯皮尔曼相关性分析,选取与对应措施相关性高的特征参数,删除完全不相关和相关性低的特征参数,将相关性高的特征参数作为预测模型的输入参数。