当前位置：首页 > 建筑技术 > 土层钻进> 一种综合地质钻孔测井岩性识别方法独创技术18529字

一种综合地质钻孔测井岩性识别方法

2021-02-28 04:18:58

一种综合地质钻孔测井岩性识别方法

　　技术领域

　　本发明涉及一种综合地质钻孔测井岩性识别方法，特别是一种基于t-SNE与PSO对BP神经网络进行改进的综合钻孔测井岩性识别方法。

　　背景技术

　　快速发展的经济使得人们对资源和能源的需求不断增加，对地质勘探提出了更高的要求。岩石的成分、结构以及物理化学特性等一切能够反映岩石特征的属性就是岩石的岩性。由于岩性控制着岩石物理性质(如孔隙度和渗透率)的分布，因此，对岩性空间变化的了解对于地下矿层的勘探具有重要意义。

　　岩性识别主要通过分析钻井岩芯以及测井资料数据可得，但是钻井取心由于部分岩层岩性采取率不高又很难做到对钻遇地层的完整描述。随着不断发展的测井技术给地质工作者带来了丰富的测井信息，对这些测井信息进行分析运用识别岩性信息，相对于分析钻井岩芯来讲更快速，效果更准确。由于复杂的地质条件和沉积环境，储层非均质性与测井响应特征之间的非线性关系表明，采用线性测井响应方程和经验统计公式不能有效地刻画储层特征，不能满足实际生产需要。

　　传统的岩性鉴别方法与工作人员多年来不断存储积累的经验有很大关联的，得到的答案并不是唯一确定的。20世纪80年代后期，人工神经网络技术因为能在解决问题的时候不受其他因素干扰的能力和对不是线性数据的映射能力的优势在世界范围迅速发展起来，为测井解释的变革工作提出了新的想法可进行研究。与传统测井分析方法相比，该方法在避免人为因素造成误差的同时还可以提高岩性识别的效率以及识别率。在岩性识别方面使用到的机器学习算法多种多样，不同的算法识别效果不同，从目前的一些识别数据来看，在岩性识别方面识别准确率并没有达到一个令人满意的程度，找到合适的方法提高识别的准确率具有很大的意义。

　　为了提高识别率、加快识别速率，且避免人工分析测井曲线识别岩性方法中人为因素造成的误差，已有使用BP神经网络技术来对测井数据进行岩性识别，但BP神经网络在训练分布不均匀且具有模糊性的测井参数时，会对测井识别的速度有较为严重的影响，很容易出现陷入局部最小，而且BP神经网络一般是先根据经验设置最开始的各种网络所需要的参数，再根据实验结果误差率的反馈对参数进行调整，在调参阶段反复迭代、工作量大且不一定能找到最优的权值和阈值，因此就目前在岩性识别方面使用的BP神经网络学习算法获得的识别数据来看，在岩性识别方面识别准确率较低。

　　发明内容

　　本发明的目的在于解决上述现有技术的不足，并提供一种综合地质钻孔测井岩性识别方法，该方法是基于t-SNE与PSO对BP神经网络进行改进的综合钻孔测井岩性识别方法，具有识别准确率高、识别速率快的优点。

　　实现本发明目的的技术方案为：一种综合地质钻孔测井岩性识别方法，该方法至少包括以下步骤：

　　1.获取钻孔测井数据；

　　2.对钻孔测井数据进行精化处理，得到精化数据集，精化处理步骤如下；

　　2.1判断钻孔测井数据数据特征类型列表是否存在空缺，若出现空缺，则选用均值填补、中值填补、众数填补、任意值填补任一方式填补数据至该空缺部分；

　　2.2根据钻孔测井数据中各个岩性类别下的数据量与标准钻孔测井数据中各个岩性类别下的数据量进行比对，若岩性分类的数据量不相等，则存在数据不均衡情况，利用SMOTE过采样算法对钻孔测井数据集进行均衡处理；

　　2.3采用线性函数法对钻孔测井数据进行归一化处理，得到精化数据集；

　　3.根据t-SNE算法对精化数据集进行降维处理，降维处理步骤如下：

　　3.1设定好降至的维数；

　　3.2为体现数据相似度，采用条件概率表达选出的数据样本在空间中的投射距离，其中高维空间数据样本用高斯分布来表达样本在空间中的投射距离，低维数据用t分布来表达特性相近样本在空间中的投射距离，其中高维空间数据样本的条件概率Pij通过如下公式获得：

　　式中，xi和xj为数据样本中表示同一岩性的数据在高维空间的数据点，σi为以xi为中心点的高斯分布方差；xk和xl为数据集中的数据映射在高维空间中的数据点，其中低维空间数据样本的条件概率qij通过如下公式获得：

　　式中，yi和yj分别为高维数据点xi和xj映射于低维的数据点；yk和yl为高维空间数据点xk和xl映射与低维空间的数据点；

　　其中离群点X’i的条件概率p’ij通过如下公式获得：

　　式中，Pj|i为以xi为中心的xj与xi之间的条件概率，Pi|j为以xj为中心的xi与xj之间的条件概率)

　　3.3将转换后的低维数据用Kullback-Leibler散度进行表达，具体的代价函数如下：

　　式中,Pij为高维空间数据样本的条件概率，qij为低维空间数据样本的条件概率，C和KL(P||Q)为条件概率Pij与条件概率qij的信息熵的差值；对代价函数进行梯度求解的公式如下：

　　式中,C为条件概率Pij与条件概率qij的信息熵的差值，yi和yi分别为高维数据点xi和xj映射于低维的数据点，Pij为高维空间数据样本的条件概率，qij为低维空间数据样本的条件概率；

　　4.根据PSO算法对BP神经网络进行改进、优化，得到网络最优初始化权值和阈值，建立网络模型，具体步骤如下；

　　4.1设定最小误差值和迭代次数阈值；

　　4.2设定BP神经网络的初始值参数，再进行迭代运算，具体为：利用适应度函数进行计算粒子适应度值，再根据个体极值和全局极值将粒子的速度以及种群的位置不断进行更新，判断当前粒子新适应度值是否低于最小误差值，若低于则输出目前适应度值，若高于则进一步判断迭代次数的数值是否符合迭代次数阈值，若符合则输出目前适应度值，若不符合则继续进行迭代运算，且迭代次数数值加1，当迭代的次数达到迭代次数阈值则停止迭代运算；

　　4.3根据输出的多个适应度值确定个体极值，其中个体极值为当前适应度值所对应粒子的目标函数值，再选取所有粒子的个体极值中最大目标函数值为群体极值，将输出当前群体极值所对应的粒子的速度以及向量作为BP神经网络初始权值与阈值，建立网络模型；

　　5.利用建立的网络模型对降维数据集进行训练学习得到最终的岩性识别率。

　　对上述技术方案的进一步改进为，步骤2.3中线性函数法对钻孔测井数据进行归一化处理，得到精化数据集，由如下公式获得；

　　式1中，X(i)为钻孔测井数据，为所有钻孔测井数据的平均值，N为钻孔测井数据的数据数量，式2中，A为算法中的调节因子，为所有钻孔测井数据的平均值，X为初始钻孔测井数据；

　　对上述技术方案的进一步改进为，步骤2.3中线性函数法对钻孔测井数据进行归一化处理，得到精化数据集，由如下公式获得；

　　式中，Xmin为钻孔测井数据的最小值，Xmax为钻孔测井数据的最大值，X为初始钻孔测井数据。

　　对上述技术方案的进一步改进为，步骤2.3中线性函数法对钻孔测井数据进行归一化处理，得到精化数据集，由如下公式获得；

　　式3中，Xmin为钻孔测井数据的最小值，Xmax为钻孔测井数据的最大值，Xmid为钻孔测井数据的中间值，X为初始钻孔测井数据；式4中，Xmin为钻孔测井数据的最小值，Xmax为钻孔测井数据的最大值，Xmid为钻孔测井数据的中间值。

　　由上述技术方案可知，本发明申请提供的综合地质钻孔测井岩性识别方法首先对钻孔测井数据进行了精化处理，即使用均值填补、中值填补、众数填补、任意值填补中任一方法对缺失数据进行填补，使用SMOTE过采样算法使数据均衡，使用线性函数法对数据进行归一化处理，解决了获取的钻孔测井数据缺失、数据集不均衡、训练数据不在统一量纲范围而造成最终识别率过低的问题。

　　然后根据t-SNE算法对钻孔测井数据集进行降维处理，从而简化数据，同时保证数据的主要信息不流失，解决了全部数据集作为样本输入会使得训练时间过与冗长，网络性能降低的问题。

　　而且本发明使用PSO算法对现有技术中的常用BP神经网络进行优化，通过粒子的不断运动，迭代更新粒子的速度以及位置，不断向期望值靠近，找到粒子的最佳适应度，进而优化神经网络的权值和阈值，达到提升神经网络的训练精度和预测能力的目标，解决BP神经网络因训练参数选择不适合而导致网络收敛速度慢甚至容易陷入局部最小的问题。

　　附图说明

　　图1是本发明提供的一种综合地质钻孔测井岩性识别方法的流程图；

　　图2是本发明中t-SNE算法对钻孔测井数据集进行降维的流程图；

　　图3是本发明中PSO算法对BP神经网络初始化参数的流程图；

　　具体实施方式

　　下面结合附图和实施例对本发明进行详细说明。

　　如图1所示，本发明提供了一种综合地质钻孔测井岩性识别方法，该方法包括以下步骤：

　　1.获取钻孔测井数据集；其中钻孔测井数据至少包括声波传播时间、自然电位、自然伽玛和/或电阻率中任意数据；

　　2.对钻孔测井数据集进行精化处理，得到实验数据集，精化处理步骤如下；

　　2.1判断钻孔测井数据中数据特征类型列表是否存在空缺，若出现空缺，则选用均值填补、中值填补、众数填补、任意值填补中任一方式进行填补数据至该空缺部分；具体步骤为：将全部数据的平均值、中值、众数依次与空缺数据处两侧数据值进行比对，若该平均值、中值、众数中任一数据值在两侧数据值的数值范围内，则将该数据值填入空缺处，反正，若该平均值、中值、众数中任一数据值不在两侧数据值的数值范围内，则在空缺处填入符合数值范围的任意值；对测井数据集的数据缺失处理解决了将带有缺失值的数据集不经处理放入网络训练，训练的结果会与数据集实际要表达的信息有偏差，最终导致输出信息内容不可依赖的问题；

　　2.2根据钻孔测井数据中各个岩性类别下的数据量与标准钻孔测井数据中各个岩性类别下的数据量进行比对，若岩性分类的数据量不相等，则存在数据不均衡情况，利用SMOTE过采样算法对钻孔测井数据集进行均衡处理，具体均衡处理步骤为：选取不均衡数据，在不均衡数据最近邻中随机选5个均衡数据，然后在不均衡数据与均衡数据之间的连线上随机选一点作为新钻孔测井数据；

　　2.3采用线性函数法对钻孔测井数据进行归一化处理，得到完整可靠的精化数据集，精化数据集X*通过如下公式获得；

　　本实施例中，还可以通过如下公式获得精化数据集X*：

　　式中，Xmin为钻孔测井数据的最小值，Xmax为钻孔测井数据的最大值，X为初始钻孔测井数据。

　　本实施例中，还可以通过如下公式获得精化数据集X*：

　　采用线性函数法归一化后的优点有：(1)在算法进行梯度下降求解阶段，进行了归一化处理的数据可以提升求解速度，从而更快找到最符合的解；(2)除了提升速度，还有机会提高识别的精确程度，因为经过归一化处理的数据无论之前处在什么维度，具有什么特征，都进行了同一化，在数值上可以进行比较。

　　3.根据t-SNE算法对精化数据集进行降维处理，降维处理步骤如下：

　　3.1设定好降至的维数；

　　式中，yi和yj分别为高维数据点xi和xj映射于低维的数据点；yk和yl为高维空间数据点xk和xl映射与低维空间的数据点；由于数据集中数据映射在空间中以点展示时，同一岩性的数据具有相似的属性，所以在映射时，会簇拥在一起点与点之间距离较近，且离群点为与种群集距离较远的点，该离群点由如下公式判断：

　　式中s为标准偏差，XOUT为离群点的数据值，为数据点的平均数据值；当所要检测的数据点满足上述公式时，判定该点为离群点；离群点X’i的条件概率p’ij通过如下公式获得：

　　式中，Pj|i为以xi为中心的xj与xi之间的条件概率，Pi|j为以xj为中心的xi与xj之间的条件概率；

　　3.3将转换后的低维数据用Kullback-Leibler散度进行表达，具体的代价函数如下：

　　式中,C为条件概率Pij与条件概率qij的信息熵的差值，yi和yj分别为高维数据点xi和xj映射于低维的数据点，Pij为高维空间数据样本的条件概率，qij为低维空间数据样本的条件概率；

　　3.4经历以上步骤完成了t-SNE算法的构建，在实验数据输入网络进行训练之前，利用t-SNE算法对输入数据集进行降维，设定好降至的维数，把原先的高维数据通过该算法简化至低维；

　　由于复杂的实验数据集具有相似性，全部作为样本输入会使得训练时间过与冗长，通过利用t-SNE算法对测井数据进行降维，从而简化数据结构，提高网络性能。

　　4.根据PSO算法对BP神经网络进行改进、优化，得到网络最优初始化权值和阈值，建立网络模型；其中PSO对BP神经网络的优化原理为：先需要确定粒子群的参数的初始值，先利用算法中的优化函数找到一个适应度值，适应度值在算法在有很大的作用，粒子搜索能力的好坏就可以用适应度的值来表现，只有找到最佳适应度值的粒子，才能由这个粒子去引导种群的搜索方向。再由适应度值确定此时对应的个体极值和群体极值，经过不断迭代后，得到最佳适应度值，并更新个体极值群体极值，输出的最优粒子位置向量中的数值便可以作为BP神经网络的初始值参数，如图3所示，具体包括以下步骤：

　　4.1设定最小误差值和迭代次数阈值；

　　个体极值根据f(Pi)的值按照以下规则更新：