第七章空间数据的统计分析3本_第1页
第七章空间数据的统计分析3本_第2页
第七章空间数据的统计分析3本_第3页
第七章空间数据的统计分析3本_第4页
第七章空间数据的统计分析3本_第5页
已阅读5页,还剩136页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第七章 空间数据的统计分析方法( 3)武汉大学遥感信息工程学院遥感科学与技术本科生教案 (2012)秦 昆2地统计分析概述空间变异函数克里金估计方法地统计分析研究展望ArcGIS的地统计分析工具主要内容3地统计分析概述420世 纪 50年代, 南非采 矿 工程 师 Daniel Krige总结 多年金 矿 勘探 经验 ,提出根据 样 品点的空 间 位置和 样品点之 间 空 间 相关程度的不同, 对 每个 样 品 观测值赋 予一定的 权 重, 进 行移 动 加 权 平均,估 计 被 样 品点包 围 的未知点 矿产储 量,形成了克里金估 计 方法(kriging)的 雏 形。20世 纪 60年代初期, 法国地 质 数学家 Georges Matheron提出数学形式的区域化 变 量, 严 格地 给 出了基本 变 异函数 (variogram)的定 义 和一般克里金估 计 方法。通 过对变 异函数、克里金估 计 以及随机模 拟 方法的深入 扩 展, 地 统计 学 (Geostatistics)已 经 成 为 空 间统计 学 的核心内容,其理 论 体系的深度和方法 扩 展 宽 度是其它空 间统计 方法无法比 拟 的。地统计分析概述 (Geostatistics)5国内的地 统计 工作主要集中于 地 质 勘探建模 和 地理 (环 境 )空 间 数据分析 应 用方面。国 际 上,地 统计 不 仅 是地 质领 域数学地 质 的主要分支,同 时 也逐 渐 成 为 数学 领 域 应 用 统计 的一个新分支。地 统计 学 (Geostatistics) ,也称 为 地 质统计 学 ,是一门 以区域化 变 量理 论为 基 础 ,以 变 异函数 为 主要工具,研究那些分布于空 间 上 既有随机性又有 结 构性 的自然或社会 现 象的科学。主要包括 : 区域化 变 量的 变 异函数模型 、 克里金估 计和 随机模 拟 三个主要内容。相 对 于物理机制建模,地 统计 是一种分析空 间 位置 (空 间结 构 )相关地学信息的 经验 性方法 (赵鹏 大 , 2004)。地统计分析概述6地理信息是地理空间位置相关的信息。地理信息科学是一门研究地理信息获取、处理和利用中的基本规律的科学,与地统计学存在本质联系。地统计学和地理信息科学存在重叠的研究对象 ,即地理空间相关信息。地统计学遵从 相近相似规律 (空间位置相近的地学现象具有相似属性值 ),这与地理信息分析中的 地理学第一定律 (空间相近的地理现象比空间远离的地理现象具有更强的相关性 )完全一致。地统计学和地理学第一定律同在 20世纪 60年代被独立提出。地统计分析概述7尽管地理信息系统中还存在 空间自回归模型 (空间滞后模型和空间误差模型 )、 地理加权回归 和各种 空间结构(空间分布 )探索 等空间统计分析方法,但是地统计一直是理论基础最为完善且应用扩展最为广泛的主流空间统计方法,地统计学已经成为地理信息科学中地理信息处理和分析的重要理论,地统计分析功能被直接嵌入或平行连接到地理空间或遥感影像信息系统中。地统计分析概述8地统计具有不同于传统统计的两个显著特点:1)样本点的空间相关性 。传统统计中不同样本点仅具有随机性,样本点之间保持空间独立性。然而,地统计中样本点不仅具有随机性,同时样本点之间具有空间相关性。2)一次性样本采集。 传统统计分析同一空间位置处可以多次采样数据。实际地统计分析中,样本区域中每一个空间位置多为一次采样数据。根据传统统计学,一次采样数据中无法推断出总体规律。这 两个特点导致了地统计中描述空间相关性 (空间结构 )的变异函数和克服一次采样局限的平稳性假设的提出。有时候,区域化变量的空间相关 (不同空间位置变量的相关 )也称为空间自相关,区域化变量的协方差 (不同空间位置变量的相关 )也称为空间自协方差。地统计分析概述9空间变异函数10区域化变量的定义和平稳性假设当空间被赋予地学含义时,地学工作者习惯称其为区域。发现地表空间的区域差异正是地理学研究的基本任务。当一个专题变量分布于空间,呈现一定的结构性和随机性时,在地统计学上称之为 “区域化 ”,区域化变量 (regionalized variable)描述的现象为区域化现象。空间变异函数变异函数(区域化变量的定义和平稳性假设)定 义 : 设 Z(x)为 一随机 变 量,表示在空 间 位置 x处专题变 量取 值 是随机的,区域化 变 量是区域化随机 变 量的 简 称。Z(X)=Z(x), xX表示区域 X中所有空 间 位置 x处 随机 变 量Z(x)的集合 (簇 ),又称 为 随机场 ,随机场也可看作若干空间样本(空间函数)的集合。1112区域化变量即空间位置相关的随机变量。区域化变量为具有内在空间结构的随机变量,它是随机场的简化。随着抽象层次的提升或观察尺度的加大,一个复杂结构的空间单元逐步简化为一个简单的空间位置点。区域化变量理论重点研究区域化随机变量的各种空间结构和统计性质,变异函数是描述区域化随机变量空间结构的有效数学工具,克里金估计利用区域化变量结构性质进行估值应用。估计是数据处理的一种泛称。在时间域,服务于不同目的估计分别称为滤波 (除去噪音 )、平滑 (找出趋势 )和预测 (计算未来值 )。在空间域,估计可以分为内插 (计算研究区域内的未知值 )和外推 (计算研究区域外的未知值,又称为预测 )。克里金插值和克里金预测统称为克里金估计。揭示区域化变量空间结构和统计性质的理论,简称为区域化变量理论,构成了地统计学的基础。变异函数(区域化变量的定义和平稳性假设)n地 统计 中的数据多 为 区域中每个空 间 位置的一次采 样 数据。通常, 为 了 满 足 总 体 规 律推断中多个 样 本 (大 样 本 )的数据要求,地 统计 中使用平 稳 (second-order stationary)或内 蕴(intrinsic stationary)假 设 下多个空 间 位置采 样 数据 (每个位置依然是一次采 样 数据 )来替代 单 个位置上的多次采 样 数据 (传统统计 的采 样 数据 )。n机理上,相近相似 规 律的普适性、空 间结 构的 稳 定性、地学 现 象空 间结 构形成的 驱动 (动 力 )因素的不 变 性等表明了平稳 性假 设 的 现实 合理性。13变异函数(区域化变量的定义和平稳性假设)变异函数(区域化变量的定义和平稳性假设)存在 n个随机 变 量的 联 合分布 F(Z(x1), Z(x2), , Z(x n), 严格的平稳性 指随机变量联合分布的空间位移不变性,即:F(Z(x1), Z(x2), , Z(x n) = F(Z(x1+h), Z(x2+h), , Z(x n+h)实际应用中,满足这种位移不变的联合概率分布的区域化随机变量较少见,而且严格平稳性的验证非常困难。相比较,容易满足和验证的是分布参数 (矩 )的平稳性,即弱平稳性假设。常用的弱平稳性假设包括二阶平稳性和内蕴性假设。二阶平稳性是比内蕴性更严格的若 (弱 )平稳性假设。14变异函数(区域化变量的定义和平稳性假设)定 义 :如果区域化 变 量 Z(x)满 足下列两个条件, 则 称其 满 足二阶平稳性假设。( 1)在研究范围内,区域化变量 Z(x)的期望存在且为常数,即 EZ(x)=m( 2)在研究范围内,区域化变量 Z(x)的协方差函数存在且为空间滞后 h的函数,与空间位置 x无关,即CovZ(x), Z(x+h)=EZ(x+h)-mZ(x)-m= EZ(x+h) Z(x)-m2=C(h)当 h=0时,条件( 2)说明了方差函数存在且为常数,VarZ(x)=CovZ(x), Z(x)=EZ(x)-m2=C(0)15变异函数(区域化变量的定义和平稳性假设)二阶平稳性假设中要求区域化变量的期望、协方差和方差都存在,实际中区域化变量的先验期望可能不存在,但是变异函数存在。定义在区域化变量相对增量上的变异函数具有比定义在区域化变量绝对值上的协方差函数的条件更加宽松,变异函数的计算比协方差函数的计算更加容易。协方差函数和变异函数为空间结构的对偶描述方式。对于区域化变量,协方差函数从相似角度来描述空间结构,变异函数则从差异角度描述空间结构。16变异函数(区域化变量的定义和平稳性假设)定 义 :如果区域化 变 量 Z(x)满 足下列两个条件, 则 称其 满 足内蕴性假设。( 1)在研究范围内,区域化变量 Z(x)增量的期望为零,即EZ(x+h)-Z(x)=0( 2)在研究范围内,区域化变量 Z(x)增量的方差存在且为空间滞后 h的函数,与空间位置 x无关,即VarZ(x+h)-Z(x)=EZ(x+h)-Z(x)-EZ(x+h)-Z(x)2=EZ(x+h)-Z(x)2=2(h) 这里, (h)表示区域化变量的变异函数或半方差函数。有些文献也将 (h)称为半变异函数或半变差函数。可以看出,区域化变量增量的计算避免了期望的直接计算。变异函数对区域化变量的期望的存在没有直接要求。17变异函数的定义和非负定性条件定义:变异函数是区域化变量空间结构的一种形式化表达,数学表示为两个随机变量 Z(x)和 Z(x+h)之间增量的方差的一半,1819进一步表达式变换为:变异函数的定义和非负定性条件n以上协方差函数和变异函数关系式更加清晰地表明,协方差函数和变异函数为空间结构的对偶描述方式。n对于区域化变量,协方差函数从相似角度来描述空间结构,变异函数则从差异角度描述空间结构。n二阶平稳性假设下,协方差函数和变异函数存在相互转换关系。20变异函数的定义和非负定性条件n在 协方差函数和变异函数中,如果空间滞后 h以极坐标参考系中的矢量表示,则该滞后矢量有模和方向两个特征量 。n当 协方差函数和变异函数仅为模值 |h|的函数时,称其为各向同性协方差函数和变异函数 。n否则 ,当协方差函数和变异函数同时为模值 |h|和方向的函数时,称其为各向异性协方差函数和变异函数 。n各向同性 为各向异性的特例 。n协方差函数 和变异函数的各向异性可以分解为几何各向异性和带状各向异性 。n基 台相同,变程随方向不同的各向异性称为几何各向异性 。n不能 通过伸缩比例变换为各向同性的各向异性称为带状各向异性。21变异函数的定义和非负定性条件n通常,把 360度方向离散划分为几个大的方向组,在某一角度区间范围 (角度容许范围 )内不同方向的样本点 (对 )都用来计算该区间中心方向的变异函数值。n类似地,可以进行空间滞后距离分组,在某一距离区间范围 (距离容许范围 )内,不同距离的样本点 (对 )都用来计算该区间中心距离的变异函数值。22变异函数的定义和非负定性条件23变异函数的定义和非负定性条件变异函数模型拟合及其评价n理想上,变异函数值随着空间滞后 h的增大而单调增加。24一种典型变异函数曲线 (variography)图中的变异函数 (h)具有三个参数 a, C0, C0+C。a称为变程,是变异函数达到基台值时的空间滞后 h,反映了数据空间自相关的最大距离。C0称为块金值,是空间滞后为 0时的变异函数值,为测量误差和低于采样间距的随机变异的综合反映。当空间滞后 h超过变程 a时,变异函数 (h)在一个极限值 ()附近摆动,这个极限值称为基台值 C+C0。n通常,一个区域化 变 量的取 值 z由大尺度 趋势 、微尺度空间 相关 变 异 r和 纯 随机 变 异 三部分构成,即 z= + r + 。n期望 (或平均 值 ) 即是一种 趋势 表示。n微尺度空 间 相关 变 异 r为 去除 趋势 后具有内在空 间 (自 )相关性的残余 值n纯 随机 变 异 为 不存在空 间 (自 )相关性的独立噪声 (如 测 量 误差 )。n测 量 误 差和采 样间 距 (采 样 尺度 )以下的微尺度空 间 相关残余值 一起构成金 块值 C0。n采 样间 距 (采 样 尺度 )以上的微尺度空 间 相关残余 值 的 变 异函数 值为 C。25变异函数模型拟合及其评价n按照二阶平稳性或内蕴平稳性假设下的变异函数表达式 (h),计算 h=0时的变异函数值应该为 0,表示同一位置点的样本值没有差异,然而,这种 (0)=0的情形是在没有测量误差和采样间距 (采样尺度 )以下空间 (自 )相关变异的理想结果。n实际应用中,测量误差总是无法避免,采样间距总是掩盖了一些更小尺度的空间变异。n尽管带有块金值的变异函数模型失去了理想变异函数模型在原点处的连续性,但是该模型合理地模拟了实际变异 (测量误差和小于采样间距尺度下的空间变异 ),所以能更好地提高后续克里金估计的精度。26变异函数模型拟合及其评价n理论变异函数模型的构建是一项基础性研究,原则上满足条件非负定性 (或非负定性 )的函数都可以作为候选的有效变异函数 (有效协方差函数 )。n多年 的研究和实践中,人们发展了一些标准的理论变异函数模型 。n通过 计算样本数据中不同空间滞后 h上的变异函数值,对若干空间滞后 h及其相应的变异函数值 (经验变异函数模型 )进行选定理论变异函数模型的拟合,确定理论模型中的参数值,最终获取确定的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论