失效
一种基于多子空间划分的动态过程精细化监测方法
宋冰、谢佳敏、侍洪波、陶阳、谭帅
华东理工大学
宋
宋冰机构 暂无
技术领域 暂无
谢
谢佳敏机构 暂无
技术领域 暂无
侍
侍洪波机构 暂无
技术领域 暂无
陶
陶阳机构 暂无
技术领域 暂无
谭
谭帅机构 暂无
技术领域 暂无
摘要
本发明公开一种基于多子空间划分的动态过程精细化监测方法,旨在考虑数据时序相关性差异以及过程变量服从不同分布的问题,并在此基础上实施基于高斯非高斯以及时序非时序子空间划分的动态过程精细化监测。本发明方法的主要核心首先在于根据数据时间序列相关性和Kolmogorov‑Smirnov(KS)检验将原始空间划分为四个子空间;其次在于利用PCA方法和SFA方法分别提取不同子空间的特征进行子空间内监测,并采用移动窗口策略和互信息方法测量四个子空间间的相关关系;最后建立综合监测指标实施精细化监测。相比于传统动态过程监测方法,本发明方法在动态过程的监测效果上取得了优越于动态PCA方法的效果。可以说,本发明方法是一种更为优选的动态过程精细化监测方法。
1.一种基于多子空间划分的动态过程精细化监测方法,其特征在于,包括以下步骤:离线建模阶段的实施过程如下所示:步骤(1):采集生产过程正常运行状态下的样本,组成训练数据集X=[x 1 ,x 2 ,...,x m ]∈R n×m ,其中x i ∈R n×1 (i=1,2,...,m),表示n个样本下不同类型的传感器变量,n为训练样本数,m为过程测量变量数,R为实数集,R n×m 表示n×m维的实数矩阵;步骤(2):不同类型x i ∈R n×1 (i=1,2,...,m)有着不同程度的时间序列相关性,采用自相关函数(ACF)度量x i (t)与x i (t+k)之间的相关性,从而将训练数据集X∈R n×m 划分为序列相关子空间 和序列不相关子空间 步骤(3):分别在序列相关子空间和序列不相关子空间中应用Kolmogorov-Smirnov(KS)方法来检验数据是否服从高斯分布,进一步将这两个子空间划分为四个子空间:高斯-序列相关子空间G c : 高斯-序列不相关子空间G u : 非高斯-序列相关子空间H c : 和非高斯-序列不相关子空间H u : ;其中,n t +n k =m c ,m t +m k =m u ;步骤(4):对四个子空间的数据集进行预处理和归一化,使得每个子空间的各个过程变量均值为零,方差为1,从而得到新的子空间为: 步骤(5):在标准化后的高斯-序列不相关子空间和非高斯-序列不相关子空间中,分别对空间 和 构建PCA模型,进行数据降维,从而得到模型的主成分矩阵T Gu ,T Hu 与残差矩阵E Gu ,E Hu ,然后,在特征空间和残差空间中依据公式 和 分别构建T Gu 2 ,T Hu 2 和SPE Gu ,SPE Hu 统计量进行子空间内监测;步骤(6):在标准化后的高斯-序列相关子空间和非高斯-序列相关子空间中,使用SFA方法提取 和 的时间序列相关慢特征信息,然后根据公式 和 分别构建T Gc 2 ,T Hc 2 和SPE Gc ,SPE Hc 统计量进行子空间内监测;步骤(7):采用移动窗口策略和互信息方法测量四个子空间之间的关系变化,假设 中的第t个样本分别表示为 将移动窗口的长度设置为2L,则每个子空间内移动窗可分别构造为 根据如下公式计算子空间间的互信息:然后,在构造的移动窗口的基础上,根据下式构造统计量,计算四个子空间之间的关系变化:步骤(8):结合子空间内监测统计量和子空间间监测统计量,利用局部离群因子(LOF)方法进行综合监测统计量LOF(y)的构建;设 则对于Y中的一个样本y,y的LOF可计算为:其中,LRD(y)表示y的局部可达密度;然后,采用核密度估计(KDE)方法确定综合监测统计量LOF(y t )的控制限LOF lim;在线过程监测的实施过程如下所示:步骤(9):收集新采样时刻的样本数据x t ,其中下标号t表示当前最新采样时刻;步骤(10):根据离线建模时得到的四个子空间划分标准对测试样本x t 进行划分,从而得到四个子空间中的样本数据:x′ Gc ,x′ Gu ,x′ Hc ,x′ Hu ;步骤(11):对四个子空间的测试样本分别利用步骤(4)中得到的均值及标准差进行处理,从而得到标准化后的测试样本数据: 步骤(12):对于 利用离线建模步骤(5)中得到的PCA模型进行特征提取分别构建T′ Gu 2 ,SPE′ Gu ,T′ Hu 2 和SPE′ Hu 统计量;步骤(13):对于 根据离线建模步骤(6)中得到的SFA模型进行慢特征提取分别构建T′ Gc 2 ,SPE′ Gc ,T′ Hc 2 和SPE′ Hc 统计量;步骤(14):对 实施步骤(7)中的移动窗口策略和互信息方法,进一步计算出: 步骤(15):结合测试子空间内监测统计量和子空间间统计量,利用步骤(8)中局部离群因子方法构建综合监测统计量LOF(y t );步骤(16)判断是否满足条件:LOF(y t )<LOF lim ;若是,则当前测试样本为正常工况采样,返回步骤(9)继续实施对下一个样本数据的监测;否则,当前采样数据来自故障工况。
2.根据权利要求1所述的一种基于多子空间划分的动态过程精细化监测方法,其特征在于,所述步骤(2)中根据自相关函数ACF将训练数据集划分为序列相关子空间和序列不相关子空间的具体实施过程如下所示:步骤(2.1):自相关函数(ACF)度量了x i (t)与x i (t+k)之间的相关性,其中k为滞后;对于x i ∈R n×1 (i=1,...,m),给出了滞后为k的自相关式为ACF(k)=S k /S 0 (9)步骤(2.2):当滞后k>0时,如果ACF在给定的控制范围内,则认为该变量没有时间序列相关性;否则,认为变量具有时间序列相关性;对于严格无时间序列相关的自变量,ACF=0;考虑统计学意义,将ACF的控制限设为0.05。根据ACF将训练数据集X∈R n×m 划分为序列相关子空间 和序列不相关子空间 其中X,X C 和X U 之间的关系如下: 。
3.根据权利要求1所述的一种基于多子空间划分的动态过程精细化监测方法,其特征在于,所述步骤(3)中根据Kolmogorov-Smirnov(KS)方法将序列相关子空间以及序列不相关子空间进一步划分为高斯-序列相关空间子空间、非高斯-序列相关空间子空间、高斯-序列不相关子空间、非高斯-序列不相关子空间的具体实施过程如下所示:步骤(3.1):对于序列相关子空间中的变量x ci , 表示由样本得到的经验累积分布函数,F c 表示理论累积分布函数;取 在变量上的最大值作为KS检验的统计量,是否接受高斯分布的概率值为其中,m c 为变量总数;步骤(3.2):根据KS检验临界表可知P 0 (m i ,α),其中α为置信度水平,取0.05;原假设H 0 为两个数据分布一致或者数据符合理论分布,也就是说H 0 表示测试结果,P 0 为是否接受高斯分布的概值;原假设H 0 是两组数据符合理论分布或者分布一致,那么对于变量x ci ,若H 0 =0且P在5%置信水平上,则随机变量x ci 服从高斯分布;反之,若H 0 =1且P在5%置信水平下,则随机变量x ci 服从非高斯分布;进而将序列相关子空间分为高斯-序列相关空间子空间G c : 和非高斯-序列相关空间子空间H c : 从而有效地提取数据变量的高斯和非高斯特征;步骤(3.3):同样地,对于序列不相关子空间中的变量x ui 也经过上述两个步骤,从而得到高斯-序列不相关子空间G u : 和非高斯-序列不相关子空间H u :
4.根据权利要求1所述的一种基于多子空间划分的动态过程精细化监测方法,其特征在于,所述步骤(5)中建立相应的PCA模型的具体实施过程如下所示:步骤(5.1):在标准化后的高斯-序列不相关子空间中,计算 的协方差矩阵 步骤(5.2):求解∑所有特征值 所对应的特征向量 步骤(5.3):设置保留的主成分个数k Gu 为满足如下所示条件的最小值,并将对应的k Gu 个特征向量组成载荷矩阵 步骤(5.4):根据公式 分别计算主成分矩阵T Gu 与模型残差矩阵E Gu ,那么相应的标准化后的高斯-序列不相关子空间中PCA模型为: 步骤(5.5):同样地,在标准化后的非高斯-序列不相关子空间中,按照上述步骤(5.1)至步骤(5.4)进行,从而得到相应的PCA模型: 。
5.根据权利要求1所述的一种基于多子空间划分的动态过程精细化监测方法,其特征在于,所述步骤(6)中建立相应的SFA模型提取慢时间序列相关特征的具体实施过程如下所示:步骤(6.1):在标准化后的高斯-序列相关子空间中,使用SFA方法提取 的慢时间序列相关特征 其目标是最小化 ;从 到S Gc (k)的映射简写为: 其中, 为系数矩阵,其优化问题通过两步奇异值分解(SVD)来解决,首先第一步SVD:对原始输入的协方差矩阵 依据下式进行SVD分解步骤(6.2):原始输入 根据公式 进行白化;步骤(6.3):接下来,对z Gc 的一阶导数的协方差根据公式 进行二次SVD,其中 步骤(6.4):系数矩阵W Gc 可根据公式 计算;步骤(6.5):慢特征计算为 步骤(6.6):同样地,在标准化后的非高斯-序列相关子空间中,按照上述步骤(6.1)至步骤(6.5)进行,从而得到相应的慢特征: 。
6.根据权利要求1所述的一种基于多子空间划分的动态过程精细化监测方法,其特征在于,所述步骤(8)中利用局部离群因子方法构建综合监测统计量LOF(y)的具体实施过程如下所示:步骤(8.1):设 y为Y中的一个样本,它的局部邻域N(y)是通过欧氏距离确定的knn个最近邻来建立的,设(y) f 是其第f个邻居,D(y,(y) f )是y和(y) f 之间的欧氏距离;步骤(8.2):y与其最远邻居(y) knn 之间的欧氏距离表示为D(y,(y) knn ),令F_distance(y)=D(y,(y) knn );步骤(8.3):同样地,令(y) f 与它的最远邻居((y) f ) knn 之间的欧氏距离表示为F_distance((y) f )=D((y) f ,((y) f ) knn );步骤(8.4):比较D(y,(y) f )与F_distance((y) f )之间的距离,定义D(y,(y) f )与F_distance((y) f )之间的最大距离为y和(y) f 可达距离reach_D(y,(y) f );步骤(8.5):根据如下公式计算y的局部可达密度(LRD):步骤(8.6):最后,根据如下公式计算y的LOF; 。



