1、山东科技大学毕业设计(论文)山东科技大学摘 要 数字高程模型(DEM)是对地球表面地形地貌的一种离散的数字表达,是地理信息系统、遥感、虚拟现实、数字化战场等领域赖以进行三维空间数据处理与地形分析的核心数据、是国家地理信息的基础数据之一。在DEM的研究中,DEM精度关系到DEM的使用者与生产者,人们总是希望DEM能够完全准确、客观地反映地球表面的起伏变化。因此,DEM精度成为DEM研究的热点之一,具有十分重要的理论意义和应用价值。 DEM表面内插函数的选择直接影响DEM质量,是数字高程模型的核心问题,它贯穿于DEM生产、质量控制、精度评定和分析应用的各环节,所以数字高程模型内插方法的精度研究是非
2、常必要的。文章主要选择了两种常用的插值方法,分别在平原、丘陵、高山、湖泊和高原几种不同复杂程度的环境下对其插值的精度使用交叉验证方法进行评估。结果表明,同样的插值方法对不同复杂程度的地形效果是不一致的,两种插值方法中以克里金插值方法的插值适用性最强,精度最高。关键词:数字高程模型 插值 地理信息系统 Abstract Digital Elevation Model is a kind of discrete digital expression to the terrain relief of the earth surface. As the most important spatial i
3、nformation in geographical database, DEM plays a more and more important role in many area, such as GIS,RS,VR, digital battlefield and so on. In the research of DEM, its accuracy influences the users and producers,hence people always hope DEM can reflect the fluctuation of the earth surface exactly
4、and objectively. Therefore,the accuracy of DEM becomes one of the DEM research hot spot, and it is very important in theoretic and valuable in use. The DEM surface interpolate function influence the DEM quality directly,is the core problem of the DEM. It pierces through to the sector of DEM produce,
5、 quality control,accuracy evaluate and apply. This paper chose two kinds of interpolating methods applied in plain, hilly, mountain, lake and plateau region, and applied cross-validation method to evaluate the interpolating accuracy The result shows,the effectiveness of same interpolating methods ar
6、e different at different complex degree of terrain,the precision interpolation of Kriging interpolation method has strongest applicability and highest accuracy of the two interpolation methodsKey words: Digital Elevation Model (DEM) , interpolation, geographic information system目录摘 要1Abstract21 绪 论1
7、1.1 研究背景和意义11.2国内外研究现状21.3 本文的主要研究内容42 克里格插值法与TIN插值法的基本理论52.1 数字高程模型概述52.2 克里格插值法的基本理论102.3 TIN插值法理论113 克里格和TIN两种插值方法精度的交叉验证过程143.1 DEM模型及其插值方法精度143.2 DEM精度评估内容163.3 交叉验证方法的定义及分类173.4 交叉验证及其评定指标194 克里格和TIN两种插值方法精度的交叉验证结果204.1 简述克里格与TIN插值法精度的交叉验证204.2 两种插值方法下不同地形数据的等高线绘制结果及其精度215 结 语335.1 总结335.2 展望3
8、3参考文献36致 谢38附录1:英文原文39附录2:中文翻译471 绪 论1.1 研究背景和意义 DEM是GIS地理数据库中最为重要的空间信息资料,是GIS、RS、VR、数字化战场等领域赖以进行三维空间数据处理与地形分析的核心内容,是国家地理信息的基础内容之一。目前世界各主要发达国家都在建立覆盖全国的DEM数据库,我国也纷纷建立了各种不同比例尺的全国地形图DEM数据库。DEM已在测绘、资源环境、灾害防治等与地形分析有关的各个领域发挥着越来越大的作用,也在国防建设与国民生产中取得了重要和广泛的应用。例如,在民用和军用的工程项目中计算挖填土石方量,为武器精确制导进行地形匹配,为军事目的显示地形景观
9、,进行越野通视情况分析,道路设计的路线选择、地址选择,不同地形的比较和统计分析,绘制坡度图、晕渲图,计算坡度和坡向、侵蚀和径流,与专题数据进行组合分析,并且还可以由DEM派生出平面等高线图、立体等高线图、通视图、景观图、立体透视图等。数字高程模型(DEM) 是针对地形地貌的一种数字模拟,其精度一直是使用和研究人员特别关注和重要的研究议题。其主要误差分为离散点本身的观测误差和离散点数学模型逼近误差,离散点自身误差来源包含了采样点的分布、密度和采样点的观测误差,对于数学模型逼近方面与选择的函数、模型方法有关。多年来众多国内外学者在该方面开展了许多研究,先后使用了试验方法、傅里叶方法、区域变异理论等
10、统计学分析研究 DEM 模型精度,在数学模型逼近方面朱长青1等使用重构等高线的方法、任志峰2等使用 Strahler 积分方法对 DEM 模型精度进行评判。DEM 模型反映的是一定区域地表变化理论模型,自然地表是没有确定性规律的,而理论模型则有,因此同样的数学逼近模型不能完全适用于不同区域特点。从数学过程看 DEM 模型插值是对待插未知点高程的一种估算,从物性角度分析 DEM 模型插值是具备空间地理意义的,每种插值算法都直接或者间接地表达了地理目标之间的空间相关关系。而不同插值的方法对于不同的地表形态有着不同的精度和结果,本文拟用基于不规则格网(TIN)的建模方法和基于格网(Grid)的建模方
11、法中的克里格插值法对于山地,平原,丘陵,高原,湖泊等不同地形的高程数据进行研究。在研究过程中使用空间插值软件Sufer8.0通过两种方法对不同地形的数据生成相应的数字高程模型,然后随机抽取大约10%的点对其结果进行适当的分析,从而得出相应的结论,为以后的生产,研究做好准备。1.2国内外研究现状 在DEM的研究中,基于规则格网的DEM研究较多,在表面建模、内插模型、精度评估等方面取得了许多成果。例如,REES3通过实验数据研究了格网DEM的高阶插值。而DNER对线性到五次多项式插值进行了试验研究,指出高次插值比线性插值精度提高约15%。朱长青4等利用多进制小波对DEM数据的简化及其精度进行了研究
12、。李志林、朱庆2推证了根据规则格网数据建立的线性建模的精度理论模型并进行了试验。史文中、李清泉、朱长青5对DEM表面的高次多项式建模的传递误差进行了理论研究,指出三次多项式比线性插值在总体上具有更高的精度。值得注意的是,在这些DEM精度研究特别是理论研究中,基本上都是基于规则格网进行研究的,其原因可能是规则格网形式简单,计算方便。可是,在实际应用中,基于不规则三角网(TIN)的DEM比基于规则格网的DEM能更好地表示地形特征,信息冗余量小,在许多领域具有十分重要的应用。但是目前基于TIN的DEM建模方式和精度研究特别是理论研究还很薄弱。基于TIN的表面建模方式都是线性建模,局部以平面代替曲面,
13、整体表面不光滑,与实际地形差异较大。由于线性内插法属于平面拟合,此方法不适于丘陵地区和山区。此外,单一的线性表达不一定达到DEM的最高精度。在规则格网DEM中,表面表达方式有连续且光滑的各阶多项式及样条函数等,而且高阶建模的DEM具有更高的精度。对于这两种建模方法,在不同的地理环境和空间状态下那种方法能够取得更好的效果,则一直被广大学者所研究。基于规则格网的DEM模型中,克里格插值法一直扮演着重要的角色。克里格插值(Kriging)又称空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法,是地统计学的主要内容之一。南非矿产工程师D.R.Krige
14、(1951年)6在寻找金矿时首次运用这种方法,法国著名统计学家G.Matheron随后将该方法理论化、系统化,并命名为Kriging,即克里格方法。目前,克里格插值方法应用于很多方面和领域:例如国内地质统计学在固矿领域中应用的主要方法仍然是普通克里格储量估算方法,主要原因是普通克里格估值方法应用相对简单,结果的稳定性较好;除此之外,克里格插值法还可应用于水文,环境,气象,规划等各个方面,对于把握研究对象空间变化特征有着重要作用。而基于不规则三角格网的TIN模型中,如何在不规则三角网上插值整体光滑的曲面,长期以来一直是应用数学和地学建模领域所关心的问题。许多学者对此问题进行过研究,所提出的成果在
15、基础的数学理论或者实践方面存在一些缺陷,因此这个问题并没有完全解决。朱长青7等对基于TIN的DEM传递误差进行了研究,得到了一个误差公式,这里TIN表面模型依然是线性插值函数。经典的coons曲面插值和方速川提出的三角域上插值光滑曲面的方法,是以给定三条边界曲线为前提的。杨松林8提出一类三角域上插值样条,但是数据点是采用的一种特殊的剖分算法。崔汉国采用常用的Lagrange插值法得到了整体连续光滑的曲面,但是此过程还需要插值控制点的高程。王家耀9提出在两三角形附近一定区域内的磨光函数插值方法,以实现在TIN上的光滑连续插值。基于磨光函数的连续光滑表面插值虽然能得到光滑连续表面,但磨光宽度较难控
16、制,同时计算比较复杂。张梅华提出一种三角形格网插值算法分析,尽管在顶点处能实现一定的光滑性,但通过试验可以发现在三角片面间的连接处光滑性不好。朱长青、杨成松利用二元泰勒公式法插值,得到TIN上的连续光滑插值,但是其被加权曲面选择的是双线性函数,插值精度仍待提高。因此直接在不规则三角网上插值光滑曲面的研究仍然需要进行。针对目前基于TIN的DEM内插模型过于单一的现象,本文对基于TIN的DEM建模方式和精度理论进行了研究,提出了一种基于TIN的DEM上光滑插值表面模型,而且模型具有较好的精度。1.3 本文的主要研究内容 本文将简要介绍DEM模型的含义,模型分类,精度评估。并详细阐述三角网插值法(T
17、IN)和克里格插值法(KRIGING)两种空间插值方法的原理,具体的类型,和相应的应用方法。并且获取山地,平原,丘陵,高原,水面等不同地形的高程数据进行研究。利用Sufer8.0软件通过两种方法对不同的地形的数据获取相应的数字地面模型对结果进行相应的分析,得出不同地形下两种插值方法的精度评定,给出自己的结论,为以后的生产,学习做好准备。2 克里格插值法与TIN插值法的基本理论2.1 数字高程模型概述2.1.1 数字高程模型含义 数字地面模型(DTM: Digital Terrain Model)是美国科学家Miller10和LaFlamme在1955年提出的。数字地面模型是地形表面形态等多种信
18、息的一个数字表达,是带有空间位置特征和地形属性特征的数字描述,即使用采样数据来表达地形表面。DTM本质上是描述地球表面形态多种信息空间分布的有序数值阵列,它可以用二维函数系列取值的有序集合来表示: (k=l,2,3,m;p=l,2,3,n) (2-1)其中,为第p个地面点上的第k类地面特性信息的取值,为第p个地面点的二维坐标,m(m大于等于1)为地面特性信息类型的数目,n为地面点的个数。在DTM中,当m=1且关为对地面高程的映射时,式(2-1)表达的数字地面模型,即为所谓的数字高程模型 (DEM: Digital Elevation Model)。数字高程模型(DEM)是DTM中最基本的部分,
19、是地形表面的高程的数字化表示。从数学上看,DEM实际上是地形的一个数学模型,是表示区域D上的三维向量有限序列,用数学函数的形式表示为: ,)(i=l,2,3,n) (2-2)其中是平面坐标,是(,)对应的高程。当该序列中各平面向量的平面位置呈规则格网排列时,其平面坐标可以省略,此时DEM就简化为一维向量序列 ,n (2-3)2.1.2 数字高程模型表面建模 DEM是地形表面的一个数学(或数字)模型。DEM表面建模,就是根据DEM格网及其高程值,利用函数逼近方法,重建DEM表面。地形表面的重建实际上是DEM表面重建或DEM表面生成。DEM内插的概念与DEM表面重建的概念有一些细微的差别。前者包括
20、估计一个新点高程的整个过程,这个新点可能随后被用于表面重建。但是后者强调重建表面的实际过程,这个过程或许不包括内插的计算,也可以由重建的表面函数得到需内插点的高程。建立数字高程模型,要经过数据采集、数据处理、待定点高程内插等环节,根据不同的数据集方式,地形表面可以用一个或多个数学函数来表示。地形表面的建模有四种主要方法:基于点的建模方法、基于不规则三角网 (TIN: Triangulated Irregular Network)的建模方法、基于格网(Grid)的建模方法和将其中任意两种结合起来的建模方法。DEM表面可以根据原始数据直接建立,也就是数据为规则结构时使用基于格网的建模方法,而数据随
21、机分布的情况下使用三角形的建模方法。不规则三角网数字地面模型(TIN)作为地表(地貌和地物)的数字化表现手段和分析工具,和基于规则格网(Grid)的数字地面模型相比能较好的顾及地貌特征点、线,逼真地表示复杂地形起伏特征,并能克服地形平坦简单的地区容易产生数据的冗余的问题,是用来进行逼真地形表面表达经常采用的方法。2.1.3 数字高程模型精度评估的基本理论 作为GIS空间数据库中最重要的组成部分之一,DEM是通过对自然界中空间实体的各种直接或间接观测得到的。对确定性的客观实体,所获取的空间数据却往往无法确定,即含有误差。因此,任何所建立的DEM实际上只能是对地面实际形态的近似模拟,不可能真实模拟
22、实际地面,也就是说DEM数据中必然含有一些与实际地形特征不相符的地方。用统计学来描述DEM与实际地形之间的偏差或错误,就是DEM误差,表示给定值与真实值的差别。 DEM误差主要有两种:一种是对实际地形表面采样所引起的误差,即原始数据的误差。例如利用地形图上的等高线数字化获取DEM数据时,原始地形图本身的坐标转换误差、地图综合误差以及地形图数字化时的扫描误差和采点误差等;另一种是数据重采样引起的误差,即由DEM内插算法引起的误差,这是DEM误差的主要来源。DEM内插的误差一方面与内插时选用的数学模型有关,另一方面与已知高程点(地形图中等高线上的点和独立高程点)的密度和分布有关。 总体而言,可以将
23、误差分为三种,即系统误差、偶然误差(在图象处理中称为随机噪声,统计学中称为白点噪声)和粗差。系统误差的产生通常跟物理方面的因素有关,也既它们可能源于摄影胶片的温度变化或测量仪器本身,测量仪器在使用前缺乏必要的校正,测量者自身的限制等。按照经典误差理论,对同一目标的量测由于观测误差的存在,其测量值会有所不同,且不表现出任何规律,这种误差便称为随机误差或噪声。粗差实际上是一种错误。同随机误差和系统误差相比,它们在测量中出现的可能性一般较小。大量的实践表明,影响DEM精度的主要因素取决于原始数据的精度和是否顾及地形特征构建内插模型。数据重采样引起的误差,即由DEM内插算法引起的误差,这是DEM误差的
24、主要来源之一。DEM内插的误差一方面与内插时选用的数学模型有关,另一方面与已知高程点(地形图中等高线上的点和独立高程点)的密度和分布有关。己有的研究成果表明,任何一种DEM内插算法,都不能弥补由于数据采样带来的信息损失。所以本文拟研究不同地理形态下基于规则格网的克里格插值法和基于三角格网的三角线性插值法的精度高低情况。2.1.4 综述DEM各种插值方法插值算法是 GIS 领域中广泛应用的一种算法,也是 DEM 多尺度变换时的核心问题。DEM插值算法的分类标准较多,根据 DEM 表达的地形特征和数学特性,再结合 DEM 插值的实用性,提出 DEM 的插值特征分类系统,并对该分类体系中的算法进行阐
25、述。在分析这些插值算法的基础上,提出选取插值方法的先验模型,该先验模型在进行 DEM 重建时更具有针对性。Nigel. M. Waters 11对各种插值方法进行了系统的分类,根据其分类,插值方法可分为点的插值和面的插值、全局性插值与局部性插值、精确插值和近似插值、统计性插值和确定性插值、渐变插值和突变插值,这种插值分类系统标准多、概括性强、实用性差。根据 DEM 表达的地形特征和数学特性,再结合 DEM 插值的实用性,又可将 DEM 的插值方法组成一个 DEM 插值特征分类系统,其分类标准分别为 DEM 的数据分布特征、内插曲面与参考点关系、地形特征理解和内插函数性质。 数据分布特征插值算法
26、:数据分布特征插值算法包括不规则分布内插、规则分布内插和基于等高线的数据内插,在统筹高程值点分布特性时适用。高程值在各种地理数据中表现形式不一,且 DEM 尺度变换目标也不一样,因此数据分布特征插值算法是实用性最强的插值算法。不规则分布内插算法在插值时通常采用直接插值和间接插值两种方法,直接插值法是直接插求待定点高程,而间接插值法则是先建立TIN,然后进行高程插值。对规则分布内插法而言,不需要搜索内插点的邻域,只要判断内插点所处的格网,即可确定内插点周围的采样点。基于等高线的数据内插主要有等高线离散化法、等高线内插法和等高线构建 TIN 法,从实用的角度讲,等高线构建 TIN 无论在效率上还是
27、内插精度上都是最优的。 内插曲面与参考点关系插值算法:根据内插曲面与参考点关系,DEM 插值特征分类系统可分为纯二维内插和曲面拟合内插,在参考点一定的情况下,二者表现出不同的性质。纯二维内插方法是从局部出发,通过参考点建立逼真性较强的DEM 插值点,从而建立局部区域精度较高的DEM,但其光滑性大大下降。曲面拟合内插可以是整体的也可以是局部的,具有逼真性和光滑性高、保凸性差的特点。因此,就实用性而言,使用内插曲面与参考点关系插值算法时的首要任务是统筹DEM 的精确性和整体性的需要。DEM 接边是 DEM 生产中面临的经常性问题,在满足精度的前提下,应顾及接边区域的表达,因此在初次拼接后的可视化表
28、达中应首要选择纯二维内插方法,具体的内插函数可视具体情况而定。这种插值后的数据在检验整个 DEM 的保凸性和连续性时十分方便,因为纯二维内插的计算量较小、数学特征明显,便于进行 DEM 特性的判断。而在进行整体可视化表达时,宜采用曲面拟合内插法,具体的插值函数也是根据实际需要而定。 地形特征理解插值算法:地形特征理解插值算法包括克里金内插、多层曲面叠加内插、加权平均值内插、分形内插和傅立叶级数内插。克里金内插是高程在一定范围内随机变化为同质变化时而进行的一种插值方法,通过不同数据点之间半方差的计算,可以作出半方差随距离变化的半方差图,从而用来估计未采样点和采样点之间的相关系数,进而求取内插点的
29、高程。克里金内插精度较高,但计算量大,须建立先验模型,适用于建立整体性DEM,如各种中小比例尺 DEM。加权平均值内插适用于建立局部性质的 DEM,其核心任务是确定距离与权值的关系,适用于建立大尺度 DEM。分形内插是一种构造分形曲线的方法,其原理是对一组给定的插值点构造相应的 IFS,使 IFS 的吸引子为通过这组插值点的函数图。它使局部与整体保持了一定的相似性,为不同尺度下物体的形态变换提供了一种较为有效的途径。分形内插适用于地理区域地形比较复杂的插值,如沙漠与林地的分界、海洋与陆地的分界线等,在进行这些区域的DEM 插值时,可获得较高精度的插值数据。傅立叶级数内插适用于地表起伏有明显周期
30、性变化的地形区域,是一种整体性的插值,精度不高。多层曲面叠加内插是一种适用于地学分析的插值方法,是在叠加多种插值曲面基础上建立的,叠加的多层曲面可以是各种性质的曲面,如克里金内插曲面、加权平均值内插曲面等。在多层曲面叠加后,可进行各种统计分析或联合分析。在建立多层曲面叠加插值前,通常需要建立叠加权重模型,根据权重获取插值点数据,从而建立所需的 DEM。由于多层曲面叠加内插多是在内插基础上进行的插值,因此精度较低,但其统筹多种曲面的特性,特别适用于地学分析和目标决策。内插函数性质插值算法:内插函数性质插值方法是狭义的插值方法,更严格地说,应是求取插值点高程的数学模型或映射方式。它仅从数学角度出发
31、,常规的方法包括多项式内插、样条内插、有限元内插和最小二乘配置内插等。其中,多项式内插又包括最邻近插值、双线性插值和高次多项式插值,是该类插值算法中最常用的插值方法,在区域性 DEM 插值中几乎均是用这种方法。样条函数内插适用于表达非常平滑的表面,也适用于根据很密的点内插等值线,如从不规则三角网(TIN) 内插等值线。有限元内插是一种局部的高精度内插方法。最小二乘配置内插法也称趋势面分析法,是用一定的函数对空间现象的空间分布特征进行分析并用函数所代表的数学表面来逼近实际表面的一种插值方法,对一般的地形表都适用,能有效地删除噪声。2.2 克里格插值法的基本理论2.2.1 克里格插值法简介 克里格
32、插值(Kriging)又称空间局部插值法,是以变异函数理论和结构分析为基础,在有限区域内对区域化变量进行无偏最优估计的一种方法,是地统计学的主要内容之一。 南非矿产工程师D.R.Krige(1951)在寻找金矿时首次运用这种方法,法国著名统计学家G.Matheron随后将该方法理论化、系统化,命名为Kriging,即克里格方法。2.2.2 克里格插值法的原理 克里格法是根据待插值点与临近实测高程点的空间位置,对待插值点的高程值进行线性无偏最优估计, 通过生成一个关于高程的克里格插值图来表达研究区域的原始地形。总的公式是: (2-4)式中:表示未知样点的值;表示未知样点周围的已知样本点的值; N
33、为已知样本点的个数;为第i个样本点的权重。它的确定是通过半方差图分析获取的, 根据统计学上无偏和最优的要求,利用拉格朗日极小化原理,可推导出权重值和半方差之间的公式。克里格法,基本包括普通克里格方法(对点估计的点克里格法和对块估计的块段克里格法)、泛克里格法、协同克里格法、对数正态克里格法、指示克里格法、折取克里格法等等。随着克里格法与其它学科的渗透,形成了一些边缘学科,发展了一些新的克里金方法。如与分形的结合,发展了分形克里金法;与三角函数的结合,发展了三角克里金法;与模糊理论的结合,发展了模糊克里金法等等。 2.3 TIN插值法理论2.3.1 标准Delaunay三角网的生成算法 在数字地
34、形建模中,对于散乱无序的空间数据,首先要经过三角剖分得到不规则三角网(TIN)。在所有可能的三角网中,狄洛尼(Delaunay)12三角网在地形拟合方面表现最为出色,常常被用于TIN的生成。由于三维散乱数据之间拓扑关系的复杂性,对其直接剖分的理论和方法尚不完善。一般仍以投影平面域三角剖分为主,然后附上对应高程得到空间狄洛尼三角网。狄洛尼三角形外接圆内不包含其他点的特性被用作从一系列不重合的平面点建立狄洛尼三角网的基本法则,可称作空圆法则(狄洛尼法则)。对于散乱无序的空间数据,经过投影平面域后,可以按照三角网生长算法构造狄洛尼三角网。构造得到的狄洛尼三角网经过LawsonLOP13交换可以形成局
35、部几何形状最优的狄洛尼三角网。其主要步骤如下: 在数据中任取任意一点,查找距离此点最近的点,相连后作为初始基线 在初始基线右边应用狄洛尼法则搜寻第三点。 生成狄洛尼三角形,以三角形的两条新边(从基线起始点到第三点及第三点到基线终止点)作为新的基线。 重复步骤、直至所有基线处理完毕。 上述过程表明,三角形生长算法的基本思路是,首先找出点集中相距最短的两点连线成为一条Delaunay三角网的边,然后按照Delaunay三角网的判断法则找出包含此边的Delaunay三角网的另一端点,依次处理所有新生成的边,直至最终完成。各种不同的实现方法表现在搜寻“第三点的方法不同”。由Delaunay三角网的定义
36、和特性可以构造下列基本算法: (l)首三角形的确定任选一个点作为首三角形的第一顶点,找到距离该点最近点作为首三角形的第二顶点,再寻找相距一、二顶点连线中点最近且不与两顶点共线的点作为首三角形的第三顶点。 (2)三角形的扩展设定两个记数变量K和L,K记录已经扩展的三角形数,L记录已形成的三角形数。在第一个三角形形成后,分别置L=1和K=1。还需设置三个数组,用于存放所构成的每个三角形的顶点编号。首先从K号三角形的第一条边向外扩展,显然位于同侧的数据点应排除在外,可以利用直线方程的判别式判别正负区的原理来实现这一要求。2.3.2 基于TIN的连续不光滑的DEM表面平面插值法 散乱数据点经过三角剖分
37、后,在网格的每个三角形上构造插值于三顶点的曲面片,并按照要求满足一定的连续性。在不考虑光滑性而只考虑数据点高程需求的情况下,我们可以进行连续不光滑表面内插和建模。基于TIN的连续但不光滑的插值比较常用的方法是三角形上线性插值、三角网内按距离平方反比加权插值。本文主要拟对基于TIN的三角形线性插值法进行研究,该方法是基于对三维离散数据的定义域做三角剖分,然后在网格点所在的三角形上做线性插值。线性内插首先确定该插值点所在的一个三角形平面,继而求出内插的高程值。这时,设确定的三角形的平面方程为: 参数可以根据三个已知数据点,i=l,2,3计算求得。解算这三个参数可以根据下式进行严密计算: (2-5)
38、3 克里格和TIN两种插值方法精度的交叉验证过程3.1 DEM模型及其插值方法精度数字高程模型(DEM) 是针对地形地貌的一种数字模拟,其精度一直是使用和研究人员特别关注和重要的研究议题。其主要误差分为离散点本身的观测误差和离散点数学模型逼近误差,离散点自身误差来源包含了采样点的分布、密度和采样点的观测误差,对于数学模型逼近方面与选择的函数、模型方法有关。多年来众多国内外学者在该方面开展了许多研究,先后使用了试验方法、傅里叶方法、区域变异理论等统计学分析研究 DEM 模型精度,在数学模型逼近方面朱长青等使用重构等高线的方法、任志峰等使用 Strahler 积分方法对DEM模型精度进行评判。DE
39、M 模型反映的是一定区域地表变化理论模型,自然地表是没有确定性规律的,而理论模型则有,因此同样的数学逼近模型不能完全适用于不同区域特点。离散点还原趋势面的方法很多,DEM 模型常用的插值算法有加权平均法、移动拟合法、多面叠加法等几类,具体的常用方法如反距离加权插值法、自然邻点插值、局部多项式插值和克里金插值等。这些插值方法除在 DEM模型建立方面发挥重要作用,在诸多领域有着广泛的应用,如地震、气象、煤矿、水文、地质、大地测量等。本文主要使用交叉验证的方法对常用的两种插值方法进行精度评定,讨论对于不同区域特征该如何选择适合的插值模型。精度是评价模型好坏的重要指标,同时DEM精度也是数字地形建模、
40、数字地形分析和各种地学过程模拟最为关心的问题,进一步分析和研究数字高程模型精度及其对应用的影响在理论和实践上都是非常重要的。本章对DEM精度评估的基本理论做了进一步论述,然后通过数学曲面对本文中各类内插算法进行了插值精度评估。DEM的精度是指误差分布的密集或离散的程度,即DEM误差的统计分布特征。DEM精度受其空间分辨率和地形复杂度的影响。精度的高低可以由误差来衡量,误差比较大则精度较低,误差比较小则精度较高。DEM表面上点的误差是数字地面建模过程中所传播的各种误差的综合。影响DEM质量的因素是多种多样的,以下几个因素是影响DEM精度的关键因素: (l)地形表面特征:地形表面特征决定了地形表面
41、表达的难易程度,因而在影响最终DEM表面精度的各种因素中扮演了重要的角色。在地形表面的各种特征中,坡度被认为是最重要的描述因子。Thierry Toutin7通过试验验证坡度对DEM质量的影响,他指出DEM的精度随着地形坡度的增大而减小,最大的误差出现在最大的坡度处,并实验证明它们之间的关系是呈线性特征的。另外,立体像对的几何特征越强,DEM歧异值出现的可能性越大。(2)DEM原始数据的三个属性(精度,分布,密度):DEM原始数据的分布是影响DEM精度的另一个主要因素,数据的分布可以用位置、结构和方位来描述:DEM原始数据的密度可根据点的平均间距、单位面积点的数量及数据在空间变化上的截止频率等
42、形式来确定,它是影响DEM表面精度的最重要因素。 (3)DEM表面建模方法:DEM表面可通过两种方式来建立,一种直接以量测数据建立,另一种是以间接方式建立,即通过从随机点到格网点的内插处理过程,最终建立DEM模型。内插的处理过程肯定会带来地貌表达可信度的损失,原始数据的误差会通过建模过程传递到最终的DEM表面。(4)DEM表面自身的特性:最终DEM表面的特征代表了决定DEM表面与地形表面相互吻合程度的因素,因而也就决定了DEM表面的精度,对于DEM可视化表达的准确与否具有决定性的作用。3.2 DEM精度评估内容总地来说,DEM的精度检查主要包括以下内容:检查DEM原始的数学基础、检查DEM数据
43、起止点坐标的正确性、检查DEM原始数据的精度、检查DEM的高程值有效范围区是否正确、检查生成DEM的内插模型、检查生成的DEM产品的精度以及检查DEM的元数据文件是否正确等。上述内容中,对DEM原始数据的精度、生成DEM的内插模型以及生成的DEM产品的精度检查是比较困难,但是却比较关键,即DEM很大程度上依赖于数据源和插值技术。对DEM原始数据的精度检查的实质是检查数据中是否含有误差(例如系统误差、偶然误差和粗差)。对生成的DEM产品的精度检查主要是检查DEM产品是否含有误差、整体精度如何以及是否准确反映了地形等。而对DEM内插模型的检查则要复杂一些,从数学的角度而言,可从逼近程度、外推能力、
44、平滑效果、唯一性和计算时间等方面进行比较、检查和评价。本文只讨论由DEM的内插算法引起的误差。为了检查与评估DEM内插算法所引起的误差,假定内插的地形图数据为真值。DEM精度评估可通过两种不同的方式来进行,一种是平面精度和高程精度分开评定,另一种是两种精度同时评定。对前者,平面的精度结果可独立于垂直方向的精度结果而获得;但对后者,两种精度的获取必须同时进行。在实际应用中,一般只讨论DEM的高程精度评定问题。DEM的精度评定有三种途径:一是理论分析,二是试验检测,三是理论与试验相结合。理论分析和理论与试验相结合方法的共同特点都是试图寻求对地表起伏复杂变化的统一量度和各种内插数学模型的通用表达方式
45、,使评定方法、评定所得的精度和某些带规律性的结论有比较普遍的理论意义。所不同的是前者纯粹是理论研究,而后者要通过大量的实验来建立数学模型。应当指出,由于影响数字高程模型精度的因素是多种多样的,无论采用哪种途径都不能很好地解决所有问题。在实际应用中,常用的DEM精度评定模型有检查点法、剖面法及等高线回放法等。(l)检查点法:检查点法简单易行,即将检查点按照格网或者其他形式分布,对这些检查点的内插高程与实际高程进行一一比较,计算误差。(2)协方差法:协方差法将地表看成一个随机函数,然后用一个协方差函数来表示地表起伏的复杂程度。它假设各参考点之间相互关系仅取决于点间的水平距离,而与点位和方向无关。(
46、3)剖面法:剖面法是将一定的剖面量测计算高程点和实际高程点进行比较的精度计算方法。剖面可以是沿X方向、Y方向或者任意方向。可以用数学方法计算任意剖面的误差,也可以用实际剖面和内插剖面相比较的方法估算高程误差。(4)等高线回放法:等高线回放法是指由DEM内插生成的等高线与原始等高线相比较,由此估算高程误差的方法。DEM内插算法的评价方法:大量的实践表明,影响DEM精度的主要因素取决于原始数据的精度和是否顾及地形特征构建内插模型。数据重采样引起的误差,即由DEM内插算法引起的误差,这是DEM误差的主要来源之一。DEM内插的误差一方面与内插时选用的数学模型有关,另一方面与已知高程点(地形图中等高线上
47、的点和独立高程点)的密度和分布有关。己有的研究成果表明,任何一种DEM内插算法,都不能弥补由于数据采样带来的信息损失。3.3 交叉验证方法的定义及分类定义:交叉验证(Cross-validation)主要用于建模应用中,例如PCR 、PLS 回归建模中。在给定的建模样本中,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行预报,并求这小部分样本的预报误差,记录它们的平方加和。这个过程一直进行,直到所有的样本都被预报了一次而且仅被预报一次。把每个样本的预报误差平方加和,称PRESS(predicted Error Sum of Squares)。分类:交叉验证一般分为三类:double-fold CV即经常所说的2折交叉;10-fold交叉和LOO(leave one out)CV即留一法交叉。2折:将原始数据集DataSet均分为两份:一份作为训练trainingSet,一份作为测试集,即testingSet,然后用训练集去做训练,用测试集去验证;之后再将训练集作为测试集,测试集作为训练集进行迭代一次,将两次所得的误差经行处理作为总体数据的预测误差。(注:这里强调一点,就是数据集一定要均分为两份,理由是:作为训练集,数据量一定要不小于测试集,所以在迭代的过程中,使得数据不出现错误
版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如有侵权请立即联系:2622162128@qq.com ,我们立即下架或删除。
Copyright© 2022-2024 www.wodocx.com ,All Rights Reserved |陕ICP备19002583号-1
陕公网安备 61072602000132号 违法和不良信息举报:0916-4228922