算法研究现状
2020-01-16 · 技术研发知识服务融合发展。
Farmer以及Deutsch和Journel虽然在1992年就提出了多点地质统计学方法,但其主要是通过在模拟退火中加入多点统计目标函数,然后对模拟图像进行反复迭代达到与输入统计参数匹配。该算法受到数据样板大小、模拟类型值多少的影响,此外迭代收敛也是一个不可避免的问题。受计算机性能以及算法的双重影响,模拟速度极其缓慢。因此对该方法的应用报道很少。1993年,Guardiano et al.提出了一种非迭代算法。它并不通过变差函数及克里金建立条件概率分布,而是直接利用数据样板扫描训练图像,并根据数据样板扫描获得的不同数据事件出现频率,代替数据事件的多点统计概率。即对于每一个未取样点,通过局部条件数据构成的数据事件,扫描训练图像推断局部数据事件联合未知点的条件概率(cpdf)。该方法属于序贯模拟的范畴,但由于每次条件概率的推断都需要重复扫描训练图像,对计算机性能要求相当高,因而该方法也一直停留在实验室阶段。
多点地质统计学得到快速发展,是源于搜索树概念的提出,即一种存储数据事件概率的数据结构。Strebelle(2000)对Guardiano et al.的算法进行了改进,提出将扫描训练图像获得的多点概率保存在“搜索树”里,随后的模拟采用序贯模拟的思路。在每模拟一个未知节点时,条件概率直接从“搜索树”里读取,大大缩短了运算机时,使得多点统计学储层建模真正意义上的推广成为可能。Strebelle将此算法命名为Snesim(Singlenormal equation simulation)。Snesim算法推出后,立刻受到建模界的关注,成为近几年储层建模热点。通过实际研究区建模,有些学者指出Snesim尚存在一些缺陷,表现在以下几个方面:
1)训练图像的平稳性问题。如何将实际储层中的大量非平稳信息表现为训练图像并能应用多点统计方法进行建模;
2)集成软数据(如地震)及评估训练图像或软数据的权重问题,尤其是它们在某种程度上不一致时;
3)储层形态合理再现问题。在现有算法中,当数据事件稀少时,往往通过去除最远条件节点方法来获得可靠的数据事件,而这种处理方法往往会导致储层构型再现失败;此外,训练图像过小将导致目标不连续,影响建模真实性;而训练图像过大则导致运行机时大,Snesim的实施存在困难;
4)多重网格搜索问题。两点统计学的多重网格搜索方法,不能改变粗网格模拟值,而条件数据重新分配具有相当大的误差,导致实际地质结构特征再现效果较差;
5)由于多点地质统计学仍然是基于像元的算法,所以只能在一定程度上重现目标的形状,对于更复杂的如尖角或者U型目标的应用则效果较差。
对于Snesim存在的问题,不同学者通过研究提出了各自的解决方案或建议。如非平稳性问题,Caers(2002)就采取类似于变差函数套合方式,通过伸缩和旋转变换,将非平稳的地质模式变化为平稳的地质模式,随后采用Snesim进行建模。再如数据样板再现,Liu(2003)就通过赋予不同节点不同权重,在数据事件稀少时,舍弃权重最小数据点以获得可靠的数据事件,而不是Snesim中去除最远条件节点的方式;Stien(2007)则允许删除条件数据点的值,而不是把它从条件数据集中移去。当所有节点被模拟后,再对那些被删掉值的点重新模拟。Suzuki(2007)提出了一种新的方法,即实时后处理方法(PRTT),其主要思想是在某一点上如果条件化失败,不是去掉一些条件数据缩小数据模板,而是返回到上一步,对前面模拟的数据进行修改,以达到数据事件合理化。在储层属性及数据事件多时,Arpat(2003)、Zhang(2003)等提出聚类的思想对相似数据事件进行归类,从而减少运行机时及不合理数据事件的出现概率。
储层建模是对地下沉积储层地质模式的再现。考虑到储层建模过程,实质上是对地下储层特征沉积模式的重建过程。如果将各种地质模式看成是一幅图像的构成单元,对储层预测也就是图像的重建过程。基于此思想,在2003年Stanford油藏预测中心举行的会议上,Arpat提出了Simpat(Simulation with pattenrs)多点地质统计学随机建模方法,即通过识别不同的地质模式,采用相似性判断方法,在建模时再现这些地质模式。Simpat模拟流程采用的也是序贯模拟的思路。由于是对地质模式处理,而地质模式是通过空间多个点构成的数据事件反映的,因此,在模拟实现时以整个数据事件赋值或者数据事件的子集取代了单个模拟网格节点的赋值。也就是说,在模拟过程中,在对某个未知值的预测过程中,除了模拟节点处赋值外,用来预测节点处值的条件数据的值也会有变化。Arpat通过这种数据事件整体赋值,实现储层地质模式再现。在数据事件选择上,Arpat摈弃了传统的概率推断、蒙特卡罗抽样的随机建模方法,而是借鉴计算机视觉及数字图像重建领域的知识,利用数据事件的相似性对数据事件进行选择。Arpat对此方法进行了较详细的论证,表明此方法能够较好再现储层结构特征。在此基础上,基于距离相似度的多点地质统计学(distance-based multiple point geostatistics)开始得到研究和发展(Suzuki et al.,2008;Scheidt et al.,2008;Honarkhah et al.,2010)。与传统基于统计抽样的模拟不同,基于距离相似度的方法直接计算数据事件的相似性,并用最相似的数据进行整体替换。
基于统计抽样以及储层模式分类的考虑,Zhang(2006)提出了Fitlersim(Filter-Based simulation)方法。他认为在训练图像中众多储层模式可以由几个滤波函数进行描述,由滤波函数获得储层模式的统计得分,在此基础上,进行储层模式的聚类,达到降低储层维数、提高运算效率的目的。此外,在聚类过程中考虑相似的储层模式出现的频率,使得储层预测具有统计学的意义。Yin(2009)则从目标骨架提取出发,约束多点统计模式选择,提出了基于储层骨架的多点地质统计学方法。