1.什么是空间插值?
空间插值就是利用离散点构建一个连续的曲面。它的目的是使用有限的观测值,通过估计值对无数据的点进行填补。
(推论1)当只有内蕴量信息时,可通过地统计分析,弥补外蕴量信息缺口,运用HASM 构建高精度曲面。
空间插值常用于将离散点的测量数据转换为连续的数据曲面,以便与其它空间现象的分布模式进行比较,它包括了空间内插和外推两种算法。(百科)
尺度转换是指利用某一尺度上所获得的信息和知识来推测其它尺度的现象,包括升尺度和降尺度。
2.什么是空间降尺度?
降尺度转换是指将粗分辨率数据向细分辨率转换。
(推论2)当粗分辨率宏观数据可用时,应补充地面观测信息,并运用HASM对此粗粉辨率数据进行降尺度处理,可获取更高精度的高分辨率曲面。
许多模型和数据由于空间分辨率太粗而无法用于分析区域尺度和局地尺度问题。
为了解决这个问题,需要研发降尺度方法,将粗分辨模型输出结果和粗分辨率数据降尺度为高空间分辨率数据。
3.什么是空间升尺度?
升尺度是指将细分辨率数据向粗分辨率转换。
在许多情况下,为了节约计算成本,需要将细分辨率数据转换为粗分辨率数据,此过程称之为升尺度。
推论3(升尺度):当运用HASM将细分变率曲面转化为较粗分辨率曲面时,引入地面细节数据可提高升尺度结果的精度。
4.什么是数据融合?
数据融合是将表达同一现实对象的多源、多尺度数据和知识集成成为一个一致的有用形式,其主要目的是提高信息的质量,使融合结果比单独使用任何一个数据源都有更高精度。
推论4(数据融合):卫星遥感信息可用时,必须补充来自地面观测信息,尚可运用HASM构建地球表层及其环境要素高精度曲面,得到较遥感信息更高精度的结果。
推论5(数据融合):卫星遥感信息和地面观测信息可用时,可运用HASM构建地球表层及其环境要素高精度曲面,获得较卫星遥感信息和地面观测信息精度都高的结果。
5.什么是数据同化?
lisa多高
数据同化就是将地面观测数据并入系统模型的过程,其目的是提高系统模型的精度。
推论6(数据同化):当动态系统模型可用时,补充地面观测信息可提高HASM构建曲面的精度,其精度高于动态系统模型模拟结果。
推论7(数据同化):当动态系统模型和地面观测信息可用时,可运用HASM构建高精度曲面,获得较动态系统模型和地面观测信息精度都高的结果。
6.简述空间相关性的含义。
空间上相关的一系列对象表现出的特殊的统计性联系。
空间自相关(spatial autocorrelation)是指一些变量在同一个分布区内的观测数据之间潜
在的相互依赖性。Tobler(1970)曾指出“地理学第一定律:任何东西与别的东西之间都是相关的,但近处的东西比远处的东西相关性更强”。(百科)
7.简述Moran's I的含义和应用。
Moran's I是用来度量空间自相关的全局指标,反映的是空间邻接或空间邻近的区域单元属性值的相似程度。(中心值与周围值之和的线性回归)
Moran指数I的取值一般在[-1,1]之间,<0负的空间自相关,>0正的空间自相关,=0表示表明不存在空间自相关,即观测值在空间上随机排列。
应用:中国大陆省级行政区人均GDP的空间关联分析,如果全局Moran指数均为正值;在正态分布假设之上,对Moran指数检验的结果也高度显著。就是说各省级行政区人均GDP 水平的空间分布并非表现出完全的随机性,而是表现出相似值之间的空间集聚,其空间联系的特征是:较高人均GDP水平的省级行政区相对地趋于和较高人均GDP水平的省级行政区相邻,或者较低人均GDP水平的省级行政区相对地趋于和较低人均GDP水平的省级行政区相邻。
全局指标计算结果只有整体的一个值局部指标是每个省份都能算出一个值
8.简述LISA指数的含义和应用。
空间联系的局部指标(local indicators of spatial association,缩写为LISA)满足下列两个条件:
(1)每个区域单元的LISA,是描述该区域单元周围显著的相似值区域单元之间空间集聚程度的指标;
(2)所有区域单元LISA的总和与全局的空间联系指标成比例。
LISA包括局部Moran指数(local Moran)和局部Geary指数(local Geary)
应用:将Moran散点图与LISA显著性水平相结合,可得到“Moran显著性水平图”;作图可显示出显著的LISA区域,并分别标识出对应于Moran散点图中不同象限的相应区域,仍以中国大陆省级行政区人均GDP进行计算,如果位于第1和第3象限内,为正的空间联系,属于低低集聚和高高集聚类型,如果位于第2和第4象限内,为负的空间联系,属于低高集聚和高低集聚类型
9.简述空间数据的特点。
空间自相关:相邻的点属性值相似(详见6)和空间异质性:一个区域内某一性状、事件或关系的不均匀分布,可分为空间局域异质性(spatial local heterogeneity)和空间分层异质性(spatial stratified heterogeneity)。前者是指该点属性值与周围不同,例如热点或冷点;后者是指多个区域之间互相不同,例如分类和生态分区。空间局域异质性可用LISA,Gi和SatScan来检验;空间分异性可用地理探测器q-statistic来检验。
or它指的是一个区域内每个物种的不同浓度的不均匀分布or空间上的特征差异,这个特征可以是均值、方差、空间自相关等(课件上)
空间数据是指用来表示空间实体的位置、形状、大小及其分布特征诸多方面信息的数据,它可以用来描述来自现实世界的目标,它具有定位、定性、时间和空间关系等特性。定位是指在已知的坐标系里空间目标都具有唯一的空间位置;定性是指有关空间目标的自然属性,它伴随着目标的地理位置;时间是指空间目标是随时间的变化而变化;空间关系通常一般用拓扑关系表示。空间数据是一种用点、线、面以及实体等基本空间数据结构来表示人们赖以生存的自然世界的数
据。
空间数据具有三个基本特征:空间特征(定位)、属性特征(非定位)、时间特征(时间尺度)。(百度)
10.简述空间抽样三位一体原理。(王劲峰,第二讲里面)
EIV三位一体:地学对象ℜ,空间抽样ℑ,统计推断Ψ
●地学对象:独立同分布(σ)、空间自相关(r)、空间分异性(q)、混合(&=r+q)
●空间抽样:随机R,系统T,分层S,聚类C
●统计推断:简单平均A,分层统计S,IDW(D),kriging(K),MSN(M)
11.简述样本纠偏方法。Biased sample remedy。(王老师2-34)
样本有偏是:样本的均值不等于总体均值。
在进行抽样时,如果样本没有比较客观地反映原始总体的信息就会得到有偏的样本。B-shade 模型充分利用了地理空间横向相关性,以及样本与区域总体之间的纵向相关性。即使样本有偏,用B-shade模型也可以得到区域总体无偏最优估计。
考虑样本之间的相关性,通过赋予合适的权重来校正可能的偏差,最小化估计方差。12.简述空间分异性的定义和度量。
(王劲峰,以下英文都是自己翻译的,供参考)
(1)空间分异性的定义:
Heterogeneous(异质性):a term used in statistics to indicate the inequality of some quantity of interest(usually a variance)in a number of different groups,populations,etc统计学中的术语,用来表示一些不同的体、人等的数量(通常是方差)的不均等性。
Spatial heterogeneity(空间异质性、分异性):the uneven distribution of a trait,event,or relationship across a region一个区域内某一性状、事件或关系的不均匀分布。
A property generally ascribed to a landscape or to a population.It refers to the uneven distribution of various concentrations of each species within an area.这些性质由地形或者落引起,它是一个区域内每个物种的不同浓度的不均匀分布。
The differences of a characteristic across space.跨空间的差异
The uneven distribution of a trait,event,or relationship across a region(Anselin,2010).The features might be the mean,va
riance and autocorrelation(Dutilleul2011).在一个地区上不均匀分布的事物的特性、活动以及相互之间的联系,这种特性可以是平均值、方差和自相关。(2)空间分异性的度量(可参考裴韬老师讲的部分,G统计量、LISA、SatScan)
13.简述数据结构在路径算法中的重要性。
数据结构是算法实现的基础,算法的操作对象是数据结构,数据结构与算法是程序的灵魂和朴素的基础。在程序的设计中,数据结构的选择是一个基本的设计考虑因素,算法的设计取决于数据结构,而算法的实现依赖于采用的数据结构。同样路径算法实现的困难程度和算法运行的效率(复杂度)都严重的依赖于所选择的数据结构是否合适。例如:采用k叉堆、二项堆或Fibonacci堆优先级队列来实现Dijkstra算法,时间复杂度为O(mlogn)或O(m+nlogn);采用桶结构基数堆实现的Dijkstra算法,在假定弧段整数权值前提下,复杂度为O(m+nlogC/loglogC)(C为最大整数权值),而基数堆和F堆相结合的Dijkstra算法复杂度仅为O(m+n(logC)1/2)。
14.简述Dijkstra算法和A*算法的差异及算法的适用性。
Dijkstra算法特点:通用性好,效率依赖于具体的实现方法或运行结构。
A*算法特点:搜索下一个节点时引入了启发式估计函数,搜索过程具有方向感;但存在局部最优问题。
1.Dijkstra算法计算源点到其他所有点(single souce all destinations)的最短路径长度,A*关注点到点(single source single destination)的最短路径(包括具体路径)。
2.Dijkstra算法建立在较为抽象的图论层面,A*算法可以更轻松地用在诸如游戏地图寻路中。
3.Dijkstra算法的实质是广度优先搜索,是一种发散式的搜索,所以空间复杂度和时间复杂度都比较高。对路径上的当前点,A*算法不但记录其到源点的代价,还计算当前点到目标点的期望代价,是一种启发式算法,也可以认为是一种深度优先的算法。
4.一般而言由于A*算法使用了启发函数来缩小计算面积,提高了效率,付出的代价就是可能得出非最优解;而Dijkstra可以得到理论上的最优。
5.当目标点很多时,A*算法会带入大量重复数据和复杂的估价函数,所以如果不要求获得具体路径而只比较路径长度时,Dijkstra算法会成为更好的选择。
6.Dijkstra算法适用于静态环境的寻路,A*算法适用于动态环境的寻路。
15.简述基于空间相互作用模型的可达性度量的基本流程。
基于空间相互作用的方法它认为某需求点的空间可达性可以采用所有设施施加到该点的潜能总和来表示,潜能总和越大,可达性越好。基于这一理念的模型和方法主要包括潜能模型(含各种改进公式)、胡弗模型(Huff Model)、核心密度法(Kernel Density Method)等。该类方法将空间上供需双方的空间效应随距离而衰减与供需双方自身的引力规模结合起来衡量可达性水平,体现了居民对公共服务设施选择利用的一般行为规律,能够更为全面准确地衡量居民获取公共服务的难
易程度,尤其适用于非紧急型设施的空间可达性评价。但该类方法具有一定的抽象性,较难理解,同时表达设施与需求点距离衰减关系的出行摩擦系数不易确定。
第一步,在研究区域范围内确定所要研究的可达性问题及所需要的数据。
第二步,通过各种方法获取并处理所需要的空间数据、属性数据、其它数据。并对数据进行分层,建立GIS数据库。
第三步,根据研究的可达性问题选择合适的可达性度量模型,然后利用相应的空间数据处理技术和空间分析功能得到起始点和目标点的地图数据层,根据所选吸引力指标,得到目标点的吸引力,并确定可巧性度量模型的其它参数值。
第四步,根据所选择的可达性度量模型,利用切S空间分析功能来计算交通阻抗,通
过GIS空间连接,字段计算,统计等功能得到可达性值,标准化后,输出可达性值。第五步,对可达性值进行可视化表达,以专题地图、统计图表等方式来表达。
16.简述轨迹数据挖掘的主要研究主题。
轨迹数据挖掘:从大量的移动对象轨迹数据中抽取模式、关联、变化、异常等,寻潜在的特征和规律,是MOD、数理统计、人工智能与机器学习算法的综合。
(1)地图匹配:将定位传感器获得轨迹的坐标位置采样序列与数字地图路网匹配的过程。携带或开启了定位传感器的手机、计步器、公交卡的行人,装载了GNSS、3G/4G模块的城市出租车、公交车、公租自行车、长途客车、货车等,可根据实时位置研究轨迹变化模式,判断交通状态等
(2)轨迹聚类:将具有相似轨迹特征的移动对象划分到一起。核心在于轨迹相似性度量方
(3)异常检测
概念:根据大量历史和动态轨迹信息挖掘统计模式,监测实时轨迹,判断是否发生了异常轨迹,例如交通拥堵等
原理:实时轨迹特征参数与历史数据对比,判断轨迹异常发生的位置及程度,如交通异常与人移动异常
(4)时序分析:移动对象轨迹数据所附带的时间标签,使得轨迹数据的时序分析演化为流数据分析过程,可表征网络的运行状态
(5)轨迹预测:通过挖掘历史轨迹数据,预测移动对象在未来某个时间可能的位置。
交通预测:短时交通预测(<30m)到长时交通预测(>2h)
依据交通状况的时序相关性、空间相关性、周期规律性,根据实时与历史数据预测交通情况。交通模式识别:
出行路径特征分析:
海运路径风险评估:
海运路径优化:
17.简述复杂网络的基本特征。
具有自组织(系统自发形成有序结构)、自相似(系统的局域性质或结构与整体类似)、吸引子(系统朝稳态趋势发展)、小世界、无标度中部分或全部性质的网络称为复杂网络。
复杂网络是对复杂系统的抽象。任何复杂系统,当把构成要素抽象成节点、要素之间的关系抽象为边时,都可以当作复杂网络来研究。复杂网络关注系统中要素关联作用的拓扑结构,是理解复杂系统性质和功能的基础。
基本特征:
(1)小世界效应:(发现绝大多数大规模真实网络的平均路径长度比想象的小得多!)(2)无标度特性:复杂网络中节点度分布符合幂律分布,且该分布与系统特征长度无关。
18.简述导航与位置服务对地理网络表达的新需求。(自己根据PPT整理,供参考)(1)位置服务:集成移动目标定位、地理信息系统、无线通讯等技术,以移动目标位置为依据,在电子地图支持下,向用户提供信息服务的技术系统(LBS)。所采用的定位方式多种多样,不限于卫星定位。信息采集手段多样化,实时的采集与处理。
(2)位置服务队地理网络的新要求
地理网络表达:单模式到多模式、静态拓扑到动态拓扑、从二维拓扑到三维拓扑、从固化地图到SLAM。
19.什么是空间推测?它与空间内插有何区别?
空间推测:It is a process to estimate the value at a location without direct observation.It often depends on other data(values of points at nearby sites where observations were made and/or values of other factors at the sites).空间推测是通过其他数据(这些数据为在观测点附近的点的值和/或其他因素在此处的值),来推测没有直接观测数据的某地的观测值。
空间内插:It is a process to estimate the value at a location based on the values of nearby sites where observations were made.空间内插是通过观测点附近的其他点的值以估计该点值的过程。