多点地质统计学Filtersim方法原理
2020-01-17 · 技术研发知识服务融合发展。
Filtersim方法在2006年提出(Zhang,2006)。其模拟分为两步:第一步对训练图像中的数据事件进行分类,这一环节只执行一次(和传统变差函数模型原理一样)。第二步是利用分类后的数据模式进行多点统计模拟。
在第一步中,利用固定尺寸的数据样板扫描训练图像。然后,通过过滤器对任一数据事件进行权值计算。假设在二维(2n+1)*(2n+1)数据样板下,6个方向过滤器函数f1,…,f6分别为
多点地质统计学原理、方法及应用
以上六种过滤器是用来扫描任何二维训练图像,获得二维训练图像任一点任一方向的过滤器函数值,构成任一点处的任一方向上的权值。图6-1是一个数据样板内6个方向权值的示意图。
图6-11 5*15数据样板6个方向上节点过滤值(权值)
在每个像元(i,j)处,可以通过过滤器函数获得此像元在六个方向上的加权得分。其计算公式为:
多点地质统计学原理、方法及应用
图6-2是一个南北方向数据样板中心点均值。
图6-2 一个数据事件的中心点均值示意图
通过标定像元(i,j)处在六个方向上的得分,就得到了六个新的训练图像。例如,对于一个采用三重数据搜索网格的训练图像(图6-3),在每一重网格上都将获得六个新的训练图像(图6-4~图6-6)。每一类三种模块的节点数是15×15,而训练图像节点为250×250。
图6-3 采用15×15数据样板、三重搜索网格的训练图像第一个得分图像;第二个得分图像
图6-4 第三重网络(粗)下训练图像第六个方向上的得分图像
图6-5 第二重网格(中等)下河道的训练图像Ti在六个方向上的得分图像
图6-6 第一重网格(细)下河道的训练图像Ti在六个方向上的得分图像
从不同方向上训练图像节点得分可以看出,前两个方向均值图像s1和s2通过225个模块中均值来赋权,它描述的是河道中线位置。s3则反映的是N—S方向河道边界,而s4给出了E—W方向的河道边界,反映了偏离主河道东西方向的位置。s5和s6指出了该区域的最大方向弯曲度。
在对训练图像进行六个方向得分处理后,下一步就是根据对六个方向的训练图像进行聚类处理。在zhang最早的算法中,采用简单的均值处理方法进行聚类。
首先,六个方向的训练图像被五等分分割,根据它们各自的分值门限,这样在六个方向的训练图像联合最多产生56=15625个数据事件。而在实际中,由于部分门槛值的缺失,所产生的数据事件要小于15625个。
这样,通过得分变换处理,相似的数据事件被归到同一个类中。图6-7是在最粗网格下扫描训练图像(图6-2)得到的56种河道数据事件。通过得分变换后它们属于同一个类。将这56个类求取均值,获得聚类后的第一个数据事件,称为原型模型,此原型模型将作为后续随机建模相似性判断的基础。图6-8给出了粗网格中最常出现的20个原型模型。
原型模型获得后,就可以进行第二步多点地质统计模拟了。在这里,通过相似性函数来进行原型模型的选择和对待估点模拟的更新。最常用的相似性函数是欧几里德距离函数。
图6-7 56种河道数据事件及其构成的原型模型
多点地质统计学原理、方法及应用
式中:k=1,代表原始条件数据;k=2,当前网格中早期模拟值;k=3,在早期的粗网格中模拟得到模式的匹配值;ω(k)是不同类型条件数据的权重。
一旦一个与数据事件最相近的原型模块被识别出来,那么,就可以在此原型模型中抽样一个特定数据事件完成对待估点的赋值。但为了达到给定的某种条件分布,则可以根据条件分布概率选择合理的数据事件,使达到所有的模拟平均值逐渐接近目标平均值。由于采取了整体替换或部分替换网格节点的方式,模拟效率得到显著提高。
图6-9是Fitlersim建模的一个详细流程图。
图6-8 粗网格训练图像中获得的20个最常见的原型模型
图6-9 Filtersim建模流程图
以上是二维训练图像的算法过程。对于三维训练图像,则需要再增加三个过滤器。但其数据事件处理和聚类将更为复杂和困难。一种常用的方法是进行K均值聚类处理。但在这种情况下的K均值聚类有一些问题,不少学者采用不同的聚类方法对Filtersin进行改进。这也直接导致了一个新的基于距离多点地质统计学产生,将在下一章进行介绍。