欢迎光临小豌豆知识网!
当前位置:首页 > 机械技术 > > 基于聚类的往复式压缩机自适应故障监测方法独创技术14837字

基于聚类的往复式压缩机自适应故障监测方法

2020-11-19 15:54:15

基于聚类的往复式压缩机自适应故障监测方法

  技术领域

  本发明涉及在线机械故障监控领域,具体地说,特别涉及一种基于聚类的往复式压缩机自适应故障监测方法。

  背景技术

  往复式压缩机是石油化工工业领域内不可或缺的关键机组,主要应用于炼油、采油、运送气体等用途。由于往复机械其结构复杂,运行状态中各部件信号互相激励干扰,某特定部位故障信号往往淹没于噪声中。此外,往复机械在运行中发生故障的原因多种多样,主要有气阀类故障、填料类故障、活塞故障以及传送系统故障,分别在不同物理量中有不同的体现,难以用单一的物理量去评价全部类型的故障程度。由于往复机的故障特性相对复杂,当前国内往复机检测标准仅有针对整机振动速度信号的烈度评价指标[GB/T 12779-91],尚未对全机的异源信号进行综合考虑,针对某一故障特征没有具体的统一标准。此外,采用单一的硬性指标忽视了往复机械个体之间的差异性。报警阈值限过高,则会导致系统反应迟钝,滞后性大,小型故障被忽略;反之阈值限过低,系统过于敏感,误报频发,造成资源、时间上的浪费。因此,根据往复机运作时工况的故障程度划分逐级的智能阈值报警限是必要的,且可以明显提高在线监测报警的准确率。

  发明内容

  为了解决现有技术的问题,本发明实施例提供了一种基于聚类的往复式压缩机自适应故障监测方法。所述技术方案如下:

  一方面,提供了一种基于聚类的往复式压缩机自适应故障监测方法,包括:包括离线建模与在线监测;

  所述离线建模包括以下步骤:

  步骤1:通过往复机械上不同位点的多源传感器进行数据采集,导入现场服务器,传至中间件;

  步骤2:通过TCP/IP协议从中间件取数,包括缸体振动信号、活塞杆位移信号、过程量信号,主要分析对象为振动信号;

  步骤3:数据初始化,初步小波去噪;

  步骤4:对振动信号数据求取特征,取标准差、均方根、峭度、偏度、峰值、峰峰值6种时域特征,5种时域因子,重心频率、方差频率、均方频率、功率谱能量、功率谱峰值5种频域特征,近似熵、样本熵、模糊熵、Teager算子能量、Teager算子峰值、LZ复杂度6种混沌特征;

  步骤5:分别对时域、频域和混沌特征集进行归一化,再进行PCA得到降维后振动信号的特征矩阵,作为训练样本,记录对应的参数;

  步骤6:采用DaviesBouldin和CalinskiHarabasz指标计算聚类的最优簇数量;采用K-means聚类方式,将训练样本聚为若干类,并在类内进行第二次归一化,并记录归一化参数;

  步骤7:对每个聚类的边缘进行提取,采用LOF对每个簇的类内数据进行划分,将其分为安全数据,危险数据和边缘数据;

  步骤8:单独取边缘样本集进行OCSVM的建模,将步骤5、6得到的参数和SVM模型存入现场服务器中;

  所述在线监控包括以下步骤:

  步骤a:通过多源传感器进行数据采集,将数据导入现场服务器;

  步骤b:数据初始化,初步小波去噪;

  步骤c:与离线建模阶段的步骤4相同,对实时数据求取三种特征组;

  步骤d:采用离线建模阶段的步骤5得到的参数对特征组进行归一化和降维;

  步骤e:再次用离线建模阶段步骤6中类内归一化参数进行归一化,随后采用KNN方法对实时数据点求取近邻,若该点为安全点,则输出该点属于的簇;若该点为危险点或边缘点,则对该点近邻点求取LOF值;额外的,若该点为边缘点,则调用该点所属簇的边缘的SVM模型对该点进行单分类,得到明确的离群判断结果;

  步骤f:根据离群点的LOF值和当前簇的LOF阈值划分限,进行实时检测点的离群程度归类,并记录对应的报警结果;

  步骤g:报警处理程序在数据报警结果触发报警机制后,将最终结果反馈至现场人员端。

  进一步的,所述归一化的方式为Zscore,其中分别为x的均值和标准差。记录参数具体为归一化的均值Mean1、标准差Std1以及Pca得分矩阵Coeff。

  进一步的,所述归一化方式为Zscore或者通过Mad(绝对中位差)的Zscore,Zscore-Mad归一化的公式为x'=(x-Median)/Mad,其中Median为x中位数,Mad为x的绝对中位差。在簇中数据差别很大时,采取Zscore-Mad的归一化方式。

  进一步的,所述LOF算法的具体过程为:

  1.定义K距离

  数据对象q的k距离定义为数据集中到数据对象q距离最近第k个点到q的距离,记作k-distance(q),这里指欧式距离;

  2.K距离邻域

  数据集中与数据对象q之间距离不大于k距离的数据点组成的集合,即Nk–distance(q)(p)={p∈D{q}|d(p,q)≤k-distance(q)}。d(p,q)指p与q之间的欧式距离;

  3.可达距离

  p,q为数据集中任意两点,p到q的可达距离定义为:reach-distk(p,q)=max{d(p,q),k-distance(q)};

  4.局部可达密度

  q的局部可达密度指q到邻域内所有点的平均可达距离的倒数,其计算方式如下:

  

  其中,|Nk(q)|为q的k邻域内点的个数。若lrdk(q)越大,表明q的密度越大,q点越正常;

  5.局部离群因子

  

  若LOF>>1,表明q点密度与整体数据密度差距较大,即离群点;LOF接近于1,则q点较为正常;

  6.边缘提取

  设定p0,p1二个离群比例控制限,其中有0<p0<p1<1。

  通过对LOF无量纲值大小的排序,得到当前数据点的由小到大的LOF序列。

  取th0=n*p0,th1=n*p1,其中n为序列的长度,即数据点个数;

  序列中排列顺序中低于th0的数据点属于安全集,此部分应该包括在LOF值在1上下浮动;序列中排列顺序高于th0的数据点属于非安全集,其中低于th1部分的数据已经接近于数据的边界,被称为危险集,表现了数据点从安全走向离群的过渡,高于th1部分的数据已经处于全数据集合的边界,被称为边缘集。

  额外的,若数据中成分复杂,边缘集中个别点离群系数较高,则应在边缘集中进行划分,将噪声点和离群点分离出来。

  进一步的,所述降维的方法为先对特征组进行零均值化后,再乘以PCA得分矩阵Coeff。

  进一步的,硬件报警策略为对时间窗内的报警数据点进行累积,每个报警点1分,若连续出现报警点,则后一个报警点为前一个报警点的2倍,在若时间窗内报警累积得分超过报警限,则触发报警并记录;报警后一段时间内不再报警,但记录当前的报警得分。

  本发明实施例提供的技术方案带来的有益效果是:

  本发明提供的一种基于聚类的往复式压缩机自适应故障监测方法,对往复工况过程进行分类,对所有工况设立智能预警限,在疑似故障发生时及时提醒操作人员进行后续处理,避免或减轻经济损失。同时,在能进行多类型故障检测的同时能满足实时性和准确性的需求。其关键点在于将数据通过自适应聚类分成不同工况下的簇,通过簇数据点之间关系得到。

  附图说明

  为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

  图1是本发明实施例的基于聚类的往复式压缩机自适应故障监测方法的离线建模流程图;

  图2是本发明实施例的基于聚类的往复式压缩机自适应故障监测方法的在线监测流程图。

  具体实施方式

  为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步的详细描述。

  本发明提供了提供了一种基于聚类的往复式压缩机自适应故障监测方法,参见图1-2,包括:离线建模阶段与在线监测阶段;

  本实施例中,所涉及硬件部件有:多源传感器(位移、加速度、速度)、现场服务器。

  离线建模阶段,参见图1:

  步骤1:通过往复机械上不同位点的多源传感器进行数据采集,导入现场服务器,传至中间件。

  步骤2:通过TCP/IP协议从中间件取数,包括缸体振动信号、活塞杆位移信号、过程量信号,主要分析对象为振动信号。

  步骤3:数据初始化,初步小波去噪。

  步骤4:对振动信号数据求取特征,取标准差、均方根、峭度、偏度、峰值、峰峰值6种时域特征,5种时域因子,重心频率、方差频率、均方频率等5种频域特征,近似熵、样本熵、模糊熵、LZ复杂度等6种混沌特征。

  步骤5:分别对时域、频域和混沌特征集进行归一化,再进行PCA得到降维后振动信号的特征矩阵,作为训练样本,记录对应的参数。

  进一步的,归一化的方式为Zscore,其中分别为x的均值和标准差。记录参数具体为归一化的均值Mean1、标准差Std1以及Pca得分矩阵Coeff。

  步骤6:采用DaviesBouldin和CalinskiHarabasz指标计算聚类的最优簇数量。采用K-means聚类方式,将训练样本聚为若干类,并在类内进行第二次归一化,并记录归一化参数。

  进一步的,归一化方式为Zscore或者通过Mad(绝对中位差)的Zscore,Zscore-Mad归一化的公式为x'=(x-Median)/Mad,其中Median为x中位数,Mad为x的绝对中位差。在簇中数据差别很大时,采取Zscore-Mad的归一化方式。

  步骤7:对每个聚类的边缘进行提取,采用LOF(局部离群因子法)对每个簇的类内数据进行划分,将其分为安全数据,危险数据和边缘数据。

  进一步的,LOF算法的具体过程为:

  1.定义K距离

  数据对象q的k距离定义为数据集中到数据对象q距离最近第k个点到q的距离,记作k-distance(q),这里指欧式距离。

  2.K距离邻域

  数据集中与数据对象q之间距离不大于k距离的数据点组成的集合,即Nk–distance(q)(p)={p∈D{q}|d(p,q)≤k-distance(q)}。d(p,q)指p与q之间的欧式距离。

  3.可达距离

  p,q为数据集中任意两点,p到q的可达距离定义为:reach-distk(p,q)=max{d(p,q),k-distance(q)}。

  4.局部可达密度

  q的局部可达密度指q到邻域内所有点的平均可达距离的倒数,其计算方式如下:

  

  其中,|Nk(q)|为q的k邻域内点的个数。若lrdk(q)越大,表明q的密度越大,q点越正常。

  5.局部离群因子

  

  若LOF>>1,表明q点密度与整体数据密度差距较大,即离群点。LOF接近于1,则q点较为正常。

  6.边缘提取

  设定p0,p1二个离群比例控制限,其中有0<p0<p1<1。

  通过对LOF无量纲值大小的排序,得到当前数据点的由小到大的LOF序列。

  取th0=n*p0,th1=n*p1,其中n为序列的长度,即数据点个数。

  序列中排列顺序中低于th0的数据点属于安全集,此部分应该包括在LOF值在1上下浮动;序列中排列顺序高于th0的数据点属于非安全集,其中低于th1部分的数据已经接近于数据的边界,被称为危险集,表现了数据点从安全走向离群的过渡,高于th1部分的数据已经处于全数据集合的边界,被称为边缘集。

  额外的,若数据中成分复杂,边缘集中个别点离群系数较高,则应在边缘集中进行划分,将噪声点和离群点分离出来。

  步骤8:单独取边缘样本集进行OCSVM的建模,将步骤5、6得到的参数和SVM模型存入现场服务器中。

  在线检测阶段,参见图2:

  步骤1:通过多源传感器进行数据采集,将数据导入现场服务器。

  步骤2:数据初始化,初步小波去噪。

  步骤3:与离线阶段步骤4相同,对实时数据求取三种特征组。

  步骤4:采用离线步骤5得到的参数对特征组进行归一化和降维。

  进一步的,降维的方法为先对特征组进行零均值化后,再乘以PCA得分矩阵Coeff。

  步骤5:再次用离线步骤6中类内归一化参数进行归一化,随后采用KNN方法对实时数据点求取近邻,若该点为安全点,则输出该点属于的簇;若该点为危险点或边缘点,则对该点近邻点求取LOF值。额外的,若该点为边缘点,则调用该点所属簇的边缘的SVM模型对该点进行单分类,得到明确的离群判断结果。

  步骤6:根据离群点的LOF值和当前簇的LOF阈值划分限,进行实时检测点的离群程度归类,并记录对应的报警结果。

  步骤7:报警处理程序在数据报警结果触发报警机制后,将最终结果反馈至现场人员端。

  进一步的,硬件报警策略为对时间窗内的报警数据点进行累积,每个报警点1分,若连续出现报警点,则后一个报警点为前一个报警点的2倍,在若时间窗内报警累积得分超过报警限,则触发报警并记录。报警后一段时间内不再报警,但记录当前的报警得分。

  本发明实施例提供的技术方案带来的有益效果是:

  本发明提供的一种基于聚类的往复式压缩机自适应故障监测方法,对往复工况过程进行分类,对所有工况设立智能预警限,在疑似故障发生时及时提醒操作人员进行后续处理,避免或减轻经济损失。同时,在能进行多类型故障检测的同时能满足实时性和准确性的需求。其关键点在于将数据通过自适应聚类分成不同工况下的簇,通过簇数据点之间关系得到。

  以上仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

《基于聚类的往复式压缩机自适应故障监测方法.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式(或pdf格式)