第33卷第3期2021年6月
岩性油气藏
LITHOLOGIC RESERVOIRS
V ol.33No.3Jun.2021
收稿日期:2020-07-22;修回日期:2020-09-06;网络发表日期:2020-11-03基金项目:国家科技重大专项“鄂尔多斯盆地大型岩性地层油气藏勘探开发示范工程”(编号:2016ZX05050)资助
作者简介:武中原(1996—),男,中国地质大学(北京)在读硕士研究生,研究方向为统计学习、机器学习。地址:(100083)北京市海淀区学
院路29号。Email :****************。
文章编号:1673-8926(2021)03-0120-09
DOI :10.12108/yxyqc.20210312
引用:武中原,张欣,张春雷,等.基于LSTM 循环神经网络的岩性识别方法.岩性油气藏,2021,33
(3):120-128.
Cite :WU Z Y ,ZHAGN X ,ZHANG C L ,et al.Lithology identification based on LSTM recurrent neural network.Lithologic Reser ‐
voirs ,2021,33(3):120-128.
基于LSTM 循环神经网络的岩性识别方法
武中原1,张
欣2,张春雷3,王海英1
(1.中国地质大学(北京)数理学院,北京100083;2.北京师范大学统计学院,北京100875;
3.北京中地润德石油科技有限公司,北京100083)
摘要:针对复杂碳酸盐岩储层岩石组分复杂、岩性多样,常规测井岩性识别方法受限等问题,提出利用长短期记忆神经网络(LSTM )提高岩性识别效果的方法,并结合实际数据进行验证和应用效果分析。考虑到常规机器学习方法在岩性识别中无法充分利用沉积岩石在深度域序列上的潜在信息,从而
基于LSTM 方法构建了能够提取和学习岩性沉积序列特征的岩性识别手段。以苏里格气田苏东地区下古生界碳酸盐岩储层为例,通过敏感性分析选取自然伽马、光电吸收截面指数、密度、声波时差、补偿中子和电阻率等6种测井参数,构建了基于LSTM 的岩性识别模型。结果表明,与朴素贝叶斯,KNN ,决策树,SVM 和HMM 等传统方法相比,LSTM 的岩性识别准确率提升幅度介于1.40%~12.25%。高精度的LSTM 岩性识别模型为复杂碳酸盐岩储层的表征和评价提供了数据基础。关键词:长短期记忆神经网络;岩性识别;碳酸盐岩储层;机器学习中图分类号:P618.13文献标志码:A
Lithology identification based on LSTM recurrent neural network
WU Zhongyuan 1,ZHANG Xin 2,ZHANG Chunlei 3,WANG Haiying 1
(1.School of Science ,China University of Geosciences (Beijing ),Beijing 100083,China ;2.School of
Statistics ,Beijing Normal University ,Beijing 100875,China ;3.Beijing Zhongdirunde Petroleum
Technology Co.,Ltd.,Beijing 100083,China )
Abstract :A lithology recognition method by long-short-term memory neural network (LSTM )was proposed for
complex carbonate reservoirs with complex composition and diverse lithology ,to overcome obstacles troubling traditional identification ,and effective results were showed with a case from gas field.Due to the inadequate abi -lity of general machine learning methods in extracting the characteristics of sedimentary sequence ,the LSTM method was introduced into the improvement for lithology identification.Taking the Lower Paleozoic carbonate reservoir in eastern block of Sulige gas field as an example ,six sensitive parameters were selected to construct a lithology identification model based on LSTM ,such as GR ,P e ,DEN ,R LLD ,AC and CNL .The results show that lithology identification accuracy based on LSTM increases by 1.40%-12.25%above traditional models (Naive Bayes ,KNN ,Decision Tree ,SVM and HMM ),and can provide more reliable support for the characterization and evaluation of complex carbonate reservoirs.Key words :long-short-term memory neural network ;lithology identification ;carbonate reservoir ;machine learning
2021年武中原等:基于LSTM 循环神经网络的岩性识别方法121
0引言
岩性的准确识别是复杂碳酸盐岩储层精细表征和综合评价的基础和前提。地层岩性信息获取的方式主
要有钻井取心、岩屑录井及井壁取心等手段,钻井取心成本的高昂和岩屑录井的不精确,使得测井岩性识别方法的研究备受关注[1-3]。测井岩性识别主要是通过建立测井参数与岩石类型之间的映射关系,并利用该映射去识别未取样井段的岩石类型。随着模式识别、统计学习和机器学习等方法的发展,越来越多的数学理论和计算机算法被应用到岩性识别模型的建立过程中,如主成分分析[4]、
决策树[5-6]、支持向量机(SVM )[7]
、朴素贝叶斯[8],
SOM 模糊识别[9]和神经网络[10]等方法。这些方法假定岩性及其与测井参数之间的关系在深度上是彼此独立的,忽略了岩石在沉积和成岩过程中存在的空间上的序列相关性问题。其识别结果常出现深度序列上无法精确表征岩石地质特征的情况或出现地层中不存在的岩石序列组合等现象。
对岩石序列特征的早期表征是由Elfeki [11]等以马尔科夫链理论为基础,采用不同岩石类型之间的转移概率矩阵形式进行表达。后来袁照威等[8]在综合岩石类型与测井参数之间的关系时,结合了混合高斯模型和最大期望算法进行了参数的学习。其中,隐马尔科夫(HMM )
[1,12]
较为常用,可以融合岩
性在深度上的序列相关性及其与测井参数之间的关系,但是在岩石类型转移阶次的确定、不同阶次序列相关性的精确学习等方面依然存在不足。深度学习中的循环神经网络(RNN )模型可以通过自循环结构的学习,使序列相关信息得到很好地保留。该方法应用到岩性识别过程中能够充分表征岩性内在的沉积模式以及不同测井参数对岩性测量和表征方面的承载尺度问题。长短期记忆神经网络(LSTM )是常用的循环神经网络之一,解决了RNN 梯度爆炸和梯度消失的问题[13]。通过在自循
环单元中引入门结构,使测井参数信息能够在LSTM 中长期传递下去,从而使得LSTM 在综合考虑数据的邻域信息和历史信息后,有效提取到数据的序列变化信息。
1方法原理
1.1RNN 原理
人工神经网络通过构建分层结构,自动提取出输入输出之间的非线性函数关系。BP 神经网络是最常见的人工神经网络,具有典型的分层结构,通常包括输入层、隐含层和输出层(图1)。BP 神经网络中的基本单元是神经元,每一层的每一个神经元只与相邻层的所有神经元相连接,而同层的神经元则互不连接。隐含层的每个神经元对上一层的所有神经元输出进行线性求和,然后经过激活函数输出到下一层的每个神经元,作为下一层的输入。随着
BP 神经网络不断进行正向传递和反向传播,网络权重也不断进行调整,最终达到较优的预测效果。
图1BP 神经网络结构示意图
Fig.1
Structure diagram of BP neural network
传统的BP 神经网络隐含层神经元互不相连,且使用固定数量的计算步骤产生固定大小的输出,在处理可变大小的序列数据上限制较大。RNN 通过递归连接的每一层网络的内部节点,使得数据在时间维度上传递,实现了数据序列性的有效学习
(图2)[14-17]。
图2RNN 及其展开示意图
Fig.2RNN and its development diagram
h t
x t
展开
h t
x t
h 0
h 1
h 2
h 2
h 1
h t -1
x 1
x 2
输入输入
输入
输入层
隐含层
输出层
输出
输入
输入
输出
神经元激活函数
线性求和
∑f
122岩性油气藏第33卷第3期
由RNN 中循环单元的计算式[式(1)]可知,RNN 在所有时间维度上实现参数共享,使得网络模型得到简化,同时能够学习任意长度的序列数据。h t =tanh ()
w ih x t +b ih +w hh h t -1+b hh (1)
式(1)中:x t 是t 时刻的输入;h t 为t 时刻的隐状态;w ih ,b ih 是输入层与隐状态间的权重和偏置;w hh ,b hh
是隐状态与隐状态之间的权重和偏置。1.2LSTM 基本原理
常规的RNN 容易发生梯度爆炸和梯度消失[18],
导致网络预测效果不佳。为此,Hochreiter 等[13]提出LSTM ,并由Graves 等[19]对其进行了改良。相较
于RNN 较为简单的循环单元,LSTM 通过添加3个门层来控制不同时序对后续信息的影响,同时使用隐状态和细胞状态传递信息,使得LSTM 能够综合局部信息和序列信息。图3是常见的LSTM 网络重复单元,主要包含3个门层:遗忘门、输入门、输出门。在LSTM 神经元的每个时刻,神经元的输入包括
前一时刻的细胞状态和隐状态以及当前时刻的输入。首先是当前时刻输入和前一时刻隐状态,依次通过遗忘门和输入门,完成细胞状态的更新,然后根据更新后的细胞状态和输出门,完成隐状态的更新。
图3LSTM 重复单元结构
Fig.3LSTM recurrent unit structure
遗忘门:根据当前时刻的输入和前一时刻的隐状态决定细胞状态中要忘记的信息
f t =σ[]
W f ()h t -1,x t +b f
(2)
输入门:根据当前时刻的输入和前一时刻的隐状态决定哪些新信息要添加到细胞状态
i t =σ[]
W i ()h t -1,x t +b i
(3)
根据遗忘门和输入门的输出,对细胞状态进行更新
C t =f t C t -1+i t C t (4)
输出门:根据当前时刻输入信息和前一时刻隐状态的合并以及更新后的细胞状态,对隐状态进行更新
O t =σ[]
W o ()h t -1,x t +b o tanh C t
(5)
式中:f t 是t 时刻遗忘门的输出;O t 是t 时刻输入门的输出;C t
是t 时刻tanh 层的输出;C t
为t 时刻的细胞状态;
i t 是t 时刻输入门的输出;W f ,b f 是遗忘门的权重和偏置;
W i ,b i 是输入门的权重和偏置;W o ,b o 是输出门的权重和偏置。
1.3基于LSTM 岩性识别模型的构建
在LSTM 中,由于序列维度的存在,使得网络
结构本身比较复杂,因此不需要过分堆叠循环层。如图4所示,首先通过对测井资料的分析选择出对岩性敏感的测井参数,并对其进行均值方差标准化预处理,去除量纲的影响,同时使用One-Hot 编码将岩性数据数字化,然后构建包含LSTM 层和全连接层的岩性识别模型。
图4岩性识别模型
Fig.4Lithology identification model
遗忘门
输出门
输入门与tanh
C t -1
h t -1
x t
h t
C t
h t
f t
tanhC t
i t C t
测井数据收集
测井参数分析
数据标准化LSTM 层Dense 层模型预测
岩性预测结果
预测岩性
实际岩性
损失计算
Adam 优化训练过程
2021年武中原等:基于LSTM 循环神经网络的岩性识别方法123
由于岩性识别是多分类问题,网络使用交叉熵作为损失函数对网络学习进行评估。同时使用Adam 优化器进行网络学习,不同于常用的随机梯度下降,Adam 优化器能够在迭代过程中自适应调整学习率从而显著提升网络学习速度。为防止网络发生过拟合,使用dropout 学习策略提升其泛化能力。
2应用实例分析
本次研究数据为苏里格气田东部地区奥陶系马沟组马五段复杂碳酸盐岩储层,属于海相沉积地层,因受沉积和成岩等因素的影响,岩石类型复杂多样。钻井取心和岩屑录井显示,主要岩石类型有石灰岩
、白云质灰岩、泥质灰岩、白云岩、灰质白云岩和泥质白云岩等6种,其中灰质白云岩和白云质灰岩是主要的含气储层。2.1测井参数敏感性分析
通过对岩性和测井资料的分析[20-21],选取对岩性较为敏感的声波时差、自然伽马、光电吸收截面指数、密度、深侧向电阻率和补偿中子等6种测井
参数。以55-010井为例,对石灰岩、白云质灰岩、泥质灰岩、白云岩、灰质白云岩和泥质白云岩等6种岩性的箱形图进行分析。由图5可知,不同测井属性对岩性的响应特征存在明显差异。总体来说,泥质岩性的自然伽马较高[图5(a )],而非泥质岩性的自然伽马较低且重合在一起,因此通过自然伽马可以有效划分出含泥质较多的泥质灰岩和泥质白云岩。同时泥质灰岩的声波时差[图5(b )]和光电吸收截面指数[图5(c )]均较高,则可以进一步通过声波时差和光电吸收截面指数来划分泥质灰岩和泥质白云岩,而光电吸收截面指数对于白云岩和灰质岩的区分则更为明显。白云岩的光电吸收截面指数基本小于3.2b /e ,而灰质岩则相反。从图5可以看出,由于数据中一些噪声点的影响,导致个别岩性测井参数取值区间较大,甚至超出正常值,该情况主要影响了箱形图的极值情况,对中位数及上下四分位数影响均较小,因此为进一步统计有实际意义的测井参数响应特征,将第90百分位数及第10百分位数作为实际岩性响应范围的上下限(表1)。
图5苏里格气田苏东地区55-010井岩性及其测井参数箱形图
Fig.5Box diagram of lithology and logging parameters of well 55-010in eastern block of Sulige gas field
1251007550250
自然伽马/A P I
石灰岩白云质灰岩泥质灰岩
白云岩
灰质白云岩泥质白云岩
195
180
165
150
135
声波时差/(m s ·m -1)
5.55.04.54.03.53.02.5
光电吸收截面指数/(b ·e -1)
5
4
3
2
1
深测向电阻率对数值/(Ω·m )
3.0
2.9
2.8
2.7
2.6
密度/(g ·c m -3)
2016
12
840
-4
补偿中子/%
石灰岩白云质灰岩泥质灰岩白云岩灰质白云岩泥质白云岩
石灰岩白云质灰岩泥质灰岩白云岩灰质白云岩泥质白云岩
石灰岩白云质灰岩泥质灰岩白云岩灰质白云岩泥质白云岩
石灰岩白云质灰岩泥质灰岩
白云岩
灰质白云岩泥质白云岩
石灰岩白云质灰岩泥质灰岩
白云岩
灰质白云岩泥质白云岩
(a )自然伽马
(b )声波时差
(c )光电吸收截面指数
(d )深侧向电阻率对数
(e )密度(f )补偿中子
124岩性油气藏第33卷第3期表1苏里格气田苏东地区不同岩性测井参数响应特征(10%~90%)Table1Response characteristics of different lithology logging parameters in eastern block of Sulige gas field
综合测井参数箱线图(图5)、岩性测井参数统计表(表1)和岩性间高区分度敏感参数统计表(表2),得出以下结论:①不同岩性的各测井参数响应特征虽各不相同,但存在一定程度的重叠,即测井参数对不同岩性响应的敏感性差异较大。②各测井参数对石灰岩响应特征的变化范围较小,其光电吸收截面指数较高,补偿中子和自然伽马则较小;白云质灰岩和泥质灰岩的光电吸收截面指数取值范围差异较大,其他参数变化范围则相近;泥质灰岩和泥质白云岩的自然伽马值均高于25API,且声波时差的变化范围较大;各岩性的深侧向电阻率变化范围较为接近;白云岩的光电吸收截面指数较低,且密度取值较高。③由表2可知,不同岩性对应着不同的高敏感性参数,单一的测井参数只能粗略实现部分特定岩性的划分,只有综合考虑岩性对所有测井参数的响应特征,才能实现所有岩性的有效识别。
表2苏里格气田苏东地区不同岩性之间高区分度敏感参数
Table2High-sensitivity parameters between lithologies in eastern block of Sulige gas field
2.2网络模型参数分析
本次研究网络模型运行平台如下:Windows10 64位操作系统,Intel Core i7-8700CPU@3.2GHz,16GB内存,Nvidia GeForce GTX1050显卡,运行环境为python3.6,keras(tensorflow后台)框架。在LSTM网络模型建立过程中,对岩性识别效果影响较大的网络参数主要有迭代次数(epoch)、批样本个数(batch)和时间步长(time-step)等。为此,在建模过程中先分析这3个网络参数的影响。
epoch是网络使用全部训练集训练所用的次数,其对网络的最终训练结果有很大影响。训练次数过少,网络就不能完全提取出数据的特征信息,即网络欠拟合,从而导致网络的预测结果较差。epoch过多,则网络可记住训练集中个别样本的特征,即网络过拟合,从而导致网络在训练集中预测效果较好而在测试集上预测效果较差,即网络的泛化性较差。通过控制其他变量不变而改变训练次数,并通过交叉熵损失函数评估网络。可以看出:随着epoch增加,网络模型的损失值迅速下降,表明网络在快速学习,当epoch达到1000时,损失曲线已基本稳定,表明网络已经充分学习。
batch是指每次进行网络训练时所传入的训练集样本个数。由于深度学习中的数据量较大,一般要采取小批量处理的方法。由于每次传入数据后都会更新网络权重,所以相较一次传入全部数据,小批量训练网络的速度更快。但是,过小的batch 则会使网络学习变得过于随机,过大的batch则需要更多的epoch。本次在固定其他参数的前提下,调节batch,并通过岩性识别准确率评估batch对网络训练的影响效果,可以看出,当batch小于32时,准确率较高,而随着batch的进一步增大,准确率迅速下降,因此选择batch为32。
岩性
石灰岩白云质灰岩泥质灰岩白云岩灰质白云岩泥质白云岩
AC/(µs·m-1)
154.09~157.69
151.38~161.57
156.82~185.22
145.43~155.15
147.42~158.52
149.05~173.17
GR/API
9.01~17.73
8.34~21.63
27.08~94.57
9.15~21.88
9.07~22.82
27.67~82.20
P e/(b·e-1)
4.77~
5.16
3.65~
4.63
3.36~
4.47
2.68~
3.19
3.06~3.76
3.05~3.62
CNL/%
-0.36~1.17
-0.04~6.65
2.29~12.32
2.73~7.79
2.30~8.08
3.15~10.72
DEN/(g·cm-1)
2.71~2.76
2.72~2.80
2.71~2.77
2.79~2.84
2.75~2.82
2.77~2.84
R
LLD
/对数值
3.42~
4.01
2.42~
3.92
2.05~
3.40
2.22~
3.85
2.17~
3.33
2.24~
3.58
岩性
石灰岩白云质灰岩泥质灰岩白云岩灰质白云岩泥质白云岩
石灰岩
—
P e,CNL
GR,R
LLD
P e,DEN,CNL
P e,DEN
P e,GR,DEN
白云质灰岩
P e,CNL
—
GR,AC
P e,DEN
P e,R
LLD
GR,CNL
泥质灰岩
GR,R
LLD
GR,AC
—
P e,GR
GR,AC
P e,DEN
白云岩
P e,DEN,CNL
P e,DEN
P e,GR
—
P e,DEN
GR,AC
灰质白云岩
P e,DEN
P e,R
LLD
GR,AC
P e,DEN
—
未识别的网络GR
泥质白云岩
P e,GR,DEN
GR,CNL
P e,DEN
GR,AC
GR
—
发布评论