gis
gis
管理员
管理员
  • 注册日期2003-07-16
  • 发帖数15945
  • QQ554730525
  • 铜币25337枚
  • 威望15352点
  • 贡献值0点
  • 银元0个
  • GIS帝国居民
  • 帝国沙发管家
  • GIS帝国明星
  • GIS帝国铁杆
阅读:2491回复:0

矢量GIS中属性数据的不确定性分析

楼主#
更多 发布于:2003-09-14 14:20

摘 要:本文从属性区域分类不确定性、边界定位误差和区域内部定量属性数据的抽样
误差出发,综合进行属性数据不确定性的度量和传播分析。针对由边界定位误差引起的
属性分类不确定性。在顾及区域面积与边界线数等因素下,提出了一种定量度量指标。
对于属性区域内部的定量属性抽样值,则建立了抽样值的相关函数表达式。针对GIS中常
见的两大类操作,即逻辑操作和算术操作,分别根据模糊集合论和概率统计理论建立了
相应的属性不确定性传播模型,并通过算例说明了这些模型在GIS中的实际应用。
关键词:属性数据;不确定性;误差传播
分类号:P208    文献标识码:A
文章编号:1001-1595(2000)01-0076-06
Analysis of Uncertainties of Attributes in Vector GIS
LIU Wen-bao DENG Min
(Department of Geosciences, Shandong University of Science and Technology,
Taian, Shandong, 271019)
LIU Wen-bao XIA Zong-guo
(Department of Earth & Geographic Sciences, University of Massachusetts at
Boston, Boston, MA 02125)
XIA Zong-guo
(Wuhan Technical University of Surveying and Mapping, Wuhan, Hubei, 430079)


Abstract:This paper discusses the measurement of uncertainties of attribute
data in vector GIS. The uncertainties considered include uncertainties in t
hematic classificatiion, positional errors of boundaries and sampling errors
of quantitative attributes. A quantitative index is proposed for describing
the uncertainties related to thematic classification, which includes the ef
fects of complexity of boundaries and areas of polygons. Correlation functio
ns between sample values in attribute data are used to measure data sampling
errors quantitatively. The second part of this paper focuses on modeling th
e propagation of attribute uncertainties in logical and arithmetical operati
ons in GIS analysis using fuzzy set and statistical techniques. Two examples
are provided to show how the models can be utilized in specific GIS applica
tions.
Keywords:attribute data; uncertainty;error propagation▲
1 引 言
  近年来GIS数据质量的研究集中在位置数据的误差上,而对属性数据不确定性的研究
较少[1]。在以属性数据分析为主的许多GIS应用领域中,例如土壤化学、环境科学和
农林科学,属性数据质量的重要性甚至远大于位置数据[2]。
  属性数据的不确定性主要来自数据源的不确定性、数据建模的不确定性和分析过程
中引入的不确定性等。其中数据源的不确定性又来源于数据采集过程中的测量、人为判
断和假设等。例如,在GIS中将现实空间分为具有渐变特征的连续空间区域和具有跳跃特
征的离散空间区域[3];对于后者,通常假定区域内部属性是均匀且同质的,其重要特
征的变化发生在边界上,像土壤类型分布图。由于区域边界是经过人为判断和边界定位
确定的,因此,区域多边形中属性数据的不确定性将主要取决于属性分类不确定性、边
界定位误差和属性测量误差。这里,误差是指观测值与其真值间的差异[3],是一种具
有统计意义的概念;而不确定性则是指被测量对象知识缺乏的程度,它表现为随机性和
模糊性[4], 而且受尺度、分辨率、抽样等许多因素影响[5]。
  在矢量专题图的GIS应用分析中,属性数据的不确定性问题主要是属性不确定性的度
量和在GIS分析过程中的传播。为此,本文探讨这类问题。
2 属性不确定性的度量
2.1 区域边界的属性不确定性
  如上所述,由于属性区域边界存在定位误差,进而导致边界附近区域属性的分类不
确定性。在矢量专题图上,多边形是由若干边界线要素围成的封闭区域,其边界位置误
差可由误差环表达[6]。下面在假定属性区域边界线段为“e-带”的情况下[4],探
讨由属性区域边界定位误差引起的属性不确定性。
2.1.1 由边界定位误差引起的属性不确定性
  如图1,除了传统的属性分类误差本身外[7],由于属性区域边界存在定位误差,
也将导致难以判断属性区域单元P的属性值是否为A。若将P视为一个不含定位误差的点元
,根据模糊数学原理,经分析可选用下述隶属函数[8]
图1 不确定的属性关系判定
Fig.1 The determination of uncertain at-tribute relations
  (1)
表示单元P的属性值为A的隶属度。其中,d为P到属性区域边界线段P1P2的垂直距离;d≥
0表示P在属性区域内部或边界线上,d<0表示P在属性区域外部;Pt为P向边界线P1P2作垂
线的交点,σ为点Pt的点位标准差。
  根据式(1)可对任意位置的属性区域点元计算其属性值为A的隶属度。例如μ(d)=
0.90表明点元P属性值为A的可能性为0.90。若将隶属度相同的点连接起来,则可得一系
列等隶属度区域,如图2。其中,A(α)(0≤α<1)表示任意位置的点元属性值为A的可能
性大于等于α的一个区域。
图2 三种不同隶属度区域示意图
Fig.2 Graphic illustration of three regions with different memberships
2.1.2 区域边界属性的不确定性指标
  由边界定位误差引起的多边形属性不确定性,不仅与边界线的定位精度有关,而且
与多边形的形状和面积及相邻多边形中属性特征值的变化程度有关[1~3]。故可利用
下列数值指标衡量由边界定位误差引起的多边形属性不确定性:
  (2)
式中:Ti为第i个多边形的边界属性不确定性值;ni、Si分别为第i个多边形的边界线条
数和面积;Sij为第i个多边形中第j条边界线的“e-带”面积;wij反映第j条边界线相邻
多边形的属性差异程度。下面利用模糊集合论探讨权wij的确定方法。
  不妨设两相邻多边形i和k属性值的模糊集合为
μi=(μi1,μi2,Λ,μin)  (3)
μk=(μk1,μk2,Λ,μkn)  (4)
其中n为专题图上属性的类型数,且满足归一化要求,即有和则权的计算公式为
  (5)
式中:0≤wij≤1。如果不考虑相邻多边形属性特征值的变异程度,可令wij=1,则式(
2)简化为
  (6)
  (6)
2.2 区域内部的属性误差
  属性区域内部的属性值,例如环境科学中土壤化学成份的含量等,都是通过抽样测
量得到的。不妨将某一特定位置处的空间属性表示为
Ai(xt)=bi(xt)+Δi(xt)  (7)
其中:Ai(xt)为xt处第i个空间属性的观测值,带有随机误差Δi(xt);bi(xt)为其真
值。对于不同的x值序列,函数Ai(x)和Δi(x)分别为一元随机过程。而A(xt)=g(A1(xt
), A2(xt), Λ,Am(xt))和Δ(xt)=h(Δ1(xt),Δ2(xt),Λ,Δm(xt))则为m元随机场

  根据随机场理论[9],空间属性观测量的统计不确定性可由下列相关函数表达
σij(x1,x2)=ρij(x1,x2)σi(x1)σj(x2)  (8)
其中:ρij(x1,x2)为第i、j个数据层中x1,x2处属性观测量的相关系数,而σi(x1),σ
j(x2)为其方差。
3 属性不确定性的传播
  在GIS应用过程中,常常需要利用空间数据库中的一些基础属性数据派生一部分新属
性数据。例如,根据某一区域的土壤类型、坡度以及湿度属性数据产生一幅关于在这区
域种植某种农作物的适宜性地图[1]。这种GIS空间操作函数可表达为
Z(x)=f(A1(x),A2(x),Λ,Am(x))  (9)
式中:Z(x)为对m个空间属性Ai(x)(1≤i≤m) 进行空间操作f得到的新属性域。实用中,
模型(9)常表现为逻辑模型和算术模型[10]。
3.1 逻辑模型
  GIS中传统的逻辑模型是布尔模型,只能处理确定性的属性数据分析。为了处理不确
定性的属性数据, 下面对传统的布尔逻辑模型进行扩展,建立模糊逻辑不确定性传播模
型。
  以任意位置处的属性值满足属性值条件的程度作为隶属度,记
μAi(T=vi(x))=f(vi,αim,αir,βim,βir)  (10)
其中:vi(x)为位置x处第i个属性的属性特征值;μAi(T=vi(x))为位置x处属性值为Ai的
隶属度,简记为μAi;参数αim,αir分别为属性值条件的左、右临界值; βim,βir分
别为左、右临界值缓冲宽度。
  对N幅单一属性专题图进行逻辑操作,得到一幅具有N种属性的新专题图,其并、交
、补模糊逻辑不确定性传播模型分别为
  (11)
  (12)
  (13)
3.2 算术模型
  在GIS属性数据分析中,算术模型是派生新属性数据另一类常用模型,如水土流失量
FAO计算模型[1]。设对N幅单一属性数据层进行算术运算,得到新专题图的属性数据为

Z(x)=f(A1(x),A2(x),Λ,AN(x))  (14)
上式线性化后,应用协方差传播定律得[11]
DZZ=eDAAeT  (15)
其中,
顾及σij=ρijσiσj,展开得
  (16)
  若N=1,则为对一幅专题图进行GIS算术操作,则式(16)简化为
  (17)
4 算例分析
  由边界定位误差引起的属性不确定性指标的计算比较简单。例如对于一个属性多边
形,通过式(2)直接计算其位置误差带加权面积与多边形本身面积的比值得出。对于一幅
专题图,可以对所有的多边形属性不确定性指标值进行统计,得到总体的属性不确定性
指标值。因此,下面重点讨论属性不确定性的传播。
4.1 逻辑模型
  下面是GIS中根据布尔逻辑模型进行空间信息查询的一个例子。
  “如果区域的坡度≤10%;粘土含量≥41 mg/kg;3.5≤PH≤8.5;那么该区域为所选
择的植被生长适宜土地。”
  基于普通集合论思想,则上述知识规则可表示为
若根据上述隶属函数进行区域选择,则易导致土壤属性值偏高或偏低于属性临界值而使
选择失误。为此,下面根据式(12)进行属性不确定性传播分析。
  不妨假定满足上述属性值条件的隶属函数分别为线性函数,即
根据上述3个隶属函数,首先计算某区域Ω中任意位置处分别属于属性值A1,A2和A3的隶
属度,列于表1、2、3; 然后利用式(12)计算μ(T=v(x)) ,结果列于表4。其中行、列
数分别表示区域任意位置的x、y局部区域标识坐标[1]。
表1 数据层1上区域Ω中任意位置属性值的模糊表示
Tab.1 Fuzzy representation of attribute values in the region Ω of the firs
t data layer
0 1 2 3 4 5 6 7 8
1 0 0.11 0.23 0.35 0.51 0.34 0.28 0.09
2 0.06 0.20 0.38 0.56 0.70 0.57 0.35 0.16
3 0.13 0.30 0.54 0.71 0.85 0.73 0.54 0.25
4 0.35 0.57 0.80 0.92 1.00 1.00 0.76 0.43
5 0.48 0.72 1.00 1.00 1.00 0.96 0.78 0.57
6 0.64 0.88 1.00 0.90 0.86 0.79 0.62 0.43
7 0.41 0.68 0.76 0.70 0.64 0.44 0.26 0.09
8 0.22 0.40 0.49 0.46 0.30 0.27 0.20 0
表2 数据层2上区域Ω中任意位置属性值的模糊表示
Tab.2 Fuzzy representation of attribute values in the region Ω of the sec
ond data layer
0 1 2 3 4 5 6 7 8
1 0.14 0.35 0.70 0.82 0.84 0.71 0.65 0.40
2 0.36 0.62 0.80 0.92 1.00 0.88 0.76 0.48
3 0.48 0.70 0.93 1.00 0.96 0.72 0.56 0.44
4 0.74 0.89 1.00 1.00 0.88 0.68 0.48 0.40
5 0.94 1.00 1.00 0.86 0.72 0.56 0.44 0.40
6 0.82 1.00 0.94 0.80 0.60 0.40 0.24 0.20
7 0.68 0.86 0.72 0.54 0.42 0.23 0.11 0
8 0.42 0.54 0.48 0.36 0.27 0.10 0 0
表3 数据层3上区域Ω中任意位置属性值的模糊表示
Tab.3 Fuzzy representation of attribute values in the region Ω of the thi
rd map layer
rd map layer
0 1 2 3 4 5 6 7 8
1 0.43 0.46 0.54 0.44 0.38 0.34 0.34 0.24
2 0.60 0.68 0.70 0.62 0.52 0.40 0.42 0.32
3 0.62 0.72 0.78 0.70 0.64 0.50 0.54 0.40
4 0.70 0.90 1.00 0.88 0.76 0.56 0.60 0.48
5 0.90 1.00 1.00 1.00 1.00 0.76 0.54 0.32
6 1.00 1.00 0.80 0.74 0.72 0.60 0.44 0.32
7 0.86 0.80 0.66 0.54 0.54 0.36 0.22 0
8 0.62 0.60 0.40 0.35 0.36 0.11 0.06 0
表4 叠置层上区域Ω中任意位置属性值的模糊表示
Tab.4 Fuzzy representation of attribute values in the region Ω of the over
laid map layer
0 1 2 3 4 5 6 7 8
1 0 0.11 0.23 0.35 0.38 0.34 0.28 0.09
2 0.06 0.20 0.38 0.56 0.52 0.40 0.35 0.16
3 0.13 0.30 0.54 0.70 0.64 0.50 0.54 0.25
4 0.35 0.57 0.80 0.88 0.76 0.56 0.48 0.40
5 0.48 0.72 1.00 0.86 0.72 0.56 0.44 0.32
6 0.64 0.88 0.80 0.74 0.60 0.40 0.24 0.20
7 0.41 0.68 0.66 0.54 0.42 0.23 0.11 0
8 0.22 0.40 0.40 0.35 0.27 0.10 0 0
分析表4知,经模糊逻辑运算得到的新专题图,其属性值不确定性与原始数据层属性值不
确定性密切相关。下面以满足属性值程度为0.7作为选择各数据层上区域范围的截值,分
别得区域Ω1,Ω2和Ω3,如图3(a)、(b)和(c)所示,将其进行逻辑叠置操作运算
,结果如图3(d)。
图3 逻辑操作下的属性不确定性传播
Fig.3 Propagation of attribute uncertainty in logical operation
4.2 算术模型
  在某环境评价专题图上存在一多边形区域,其中铅、钙两种元素含量属性数据的抽
样值及其精度列于表5。在GIS中利用下列模型[3]
R=Pb+13Ca  (18)
来预测土壤中铅的浓度(Pb)和钙的浓度(Ca)对环境的危害系数R。利用公式(17)计算的
危害系数的标准差列于表5中最后一列。
表5 不同误差状态下计算危害系数的起始数据和计算数据(单位:毫克/千克)
Tab.5 Data for computation of risk factor and results under different error
statements(unit:mg/kg)
序号 Pb σPb Ca σCa ρPb,Ca R σR
1 210.0 3.5 4.7 0.12 0 271.1 3.83
2 210.0 3.5 4.7 0.12 0.6 271.1 4.24
3 215.0 3.9 5.0 0.14 0 280.0 4.30
4 215.0 3.9 5.0 0.14 0.8 280.0 4.92
5 220.0 3.7 4.8 0.13 0 282.4 3.99
6 220.0 3.7 4.8 0.13 -0.4 282.4 3.66
  分析表5可知,危害系数R的误差取决于铅和钙浓度的误差及其相关系数,其中钙的
浓度抽样误差对危害系数R计算值精度的影响程度大于铅的。
5 结论与建议
  (1) 矢量专题图上定量属性数据的不确定性主要取决于属性分类不确定性(或边界
判断不确定性)、边界定位误差和属性数据本身的抽样误差。
  (2) 模糊逻辑不确定性传播模型适于模拟GIS逻辑操作中由属性分类产生的模糊属
性数据的不确定性;算术模型用于模拟属性区域内部的随机定量属性数据中的统计误差

  (3) 属性数据的不确定性研究是一个比位置数据误差更为复杂的课题,相对而言
,后者则比较单一、简单。而属性数据的表现形式多种多样,例如定量的、定性的、数
值的、文本的等,其不确定性也与多种因素有关,故需分别进行系统研究。■
国家自然科学基金(编号:49801016;49671063)资助项目。
作者简介:刘文宝,男,35岁,博士后,教授。主要研究领域为遥感与GIS中的数据质量
、误差与不确定性及信息可视化等方面。
作者单位:刘文宝(山东科技大学地球科学系,山东 泰安,271019)
     邓敏(山东科技大学地球科学系,山东 泰安,271019)
     刘文宝(美国麻省大学地球地理科学系,波士顿,02125)
     夏宗国(美国麻省大学地球地理科学系,波士顿,02125)
     夏宗国(武汉测绘科技大学,湖北 武汉,430079)
喜欢0 评分0
游客

返回顶部