中国人口密度数字模拟
作者: 刘纪远岳天祥
摘要:运用基于格点生成法的人口密度空间分布模拟模型,通过运行净第一性生产力空间分布、数字高程、城市规模及其空间分布和交通基础设施空间分布等数据集,模拟了中国人口密度的空间分布规律。模拟结果表明,人口密度的最高值集中在北京、上海和郑州之间的三角区 (BSZ) 及珠江三角洲地区;同时,这个BSZ峰值三角区有发展为以上海-南京-杭州大都市密集区、武汉市、西安市、北京-天津-唐山大都市密集区和沈阳-大连大都市密集区为顶点的五角形峰值区的趋势,珠江三角洲峰值区也正在向外围地区扩展。
关键词:格点生成;多源信息;人口密度;空间分布;数字模拟;中国
中国人口密度数字模拟
刘纪远1,  岳天祥1,  王英安2,  邱冬生1,  刘明亮1,  邓祥征1,  杨小唤1,  黄裕婕3
(1. 中国科学院地理科学与资源研究所,北京  100101; 2. 山东省可持续发展研究中心;济南  250014;
3. 清华大学水利工程系;北京  100084)
人口密度是表现人口分布的主要形式,影响并决定中国人口密度空间分布的主要因素是自然环境条件和基础设施发展水平[1]。诸如气候、水文、地形、土壤等各种自然因素的不同组合对人口分布所提供的条件表现出巨大的地理差异性。有些区域为人类生产和生活提供了良好的条件,为人口高密度分布提供了可能;而有些区域为人类生产和生活造成诸多不便,仅允许较低的人口密度。在各种自然因素中,气候是对人口分布密度影响最大的因素,它影响着土壤的肥力、适宜耕作的程度、产业结构和生产力。地形会影响气候,不同的地形区域会形成各种特征的地方性气候,从而影响人类的生产活动与土地生产力;同时,不同的地貌类型对交通基础设施的发展所起的作用各不相同,因而制约着人口密度的空间分布。虽然自然环境条件对人口分布有很大的影响,但它为人口分布只是提供了一种可能性。这种可能性在多大规模和程度上实现,与生产力的发展及其空间分布格局密切相关[2]。例如,交通运输基础设施的发展大大缩短了空间距离,使人口分布摆脱对农业的依赖性,把众多的人口吸引到交通线的周围和交通枢纽地区。
1  模型与方法
打分数
20世纪60年代出现了格点生成技术[3]。数值化格点生成技术的发展形成了一个独立的数学分支。20世纪90年代,格点生成技术的发展达到了一个新的阶段。格点生成可以被看做是寻地图上有用的参数化信息的过程[4],格点生成技术应用的独特性在于它不局限于任何特定的公式和需要任何特定的理论基础[5]。格点生成技术最重要的步骤是到合适的从自然现象到数值化信息的转换方法。基于内插的
格点生成方法有2大优势,即相对于局部微分方程的快速计算能力和对格点的直接控制。
近年来,已经发展了许多格点生成方法,每一种方法都有其各自的优势和缺陷。
本文选取一种基于重力模型的方法,通过融合净第一性生产力、数字高程、城市
规模和密度、交通基础设施密度等数据集,来模拟2000年中国人口密度的空间
分布。
1.1 重力模型
秦岚整容牛顿在 1687 年提出的万有引力定律可表述为:任何2个物体之间的吸引力与它
们质量的乘积成正比,与它们之间距离的平方成反比。1858年Carey 首先将万
有引力定律应用于社会科学问题[6]。1885 年Ravenstein 在英国人口迁移流的
研究中发现,城市对人口的吸收能力与当地人口数量成正比,与距离成反比[7]。
1924 年Young在美国农业人口迁移研究中提出了一个重力模型[8]。1929 年
Reilly以 Young 重力模型为基础,通过研究德克萨斯州225个城市的零售贸易
区,提出了零售业吸引力定律。1960 年Isard等在Dodd [9]、Ikle[10] 和
Carroll[11]工作的基础上提出了重力模型的通用表达式[12]:
T = K  (1)
式中:T为i 和j 之间的相互作用,K 为常数,b1、b2 和b3为待定参数,dij
为 i 和j 之间的距离,Pi为点i的质量,Pj为点j的质量。
1.2  格点生成公式
模拟人口密度空间分布的格点生成是从欧几里得空间E2到E3的转换,即从(i, j)
到(i, j, Pij(t))的转换。如果格点 (i0, j0) 上人口密度P(t) 已知,根据重
力模型,格点 (i, j) 人口密度可表达为:
SPD (t) = •IN(t) (2)
IN(t) = (G(t))•(F(t))(Dem(t))              (3)
式中G(t) 是由铁路Raij(t)、公路Roij(t)、航空Aiij(t)、海运Maij(t)、内
陆水运Iwij(t) 和电讯Coij(t)系统等基础设施确定的函数;如果格点 (i, j)
位于农村地区,Fij(t) 取值为sin•?仔,如果位于城镇地区,Fij(t) 取值为其
所在城镇的面积; Sk(t) 是第k个城市的面积;M(t) 为城市的总数;d(t) 是格
点 (i, j) 到第k个城市中心点的距离;Dem(t) 为格点 (i, j) 的高程;t 是
时间变量;a1(t) (l = 1, 2,2 3, 4, 5) 是经验参数。
林地补偿2    数字模拟的基本数据背景及来源
数字模拟的陆地生态系统净第一性生产力根据中国科学院地理科学与资源研究
所刘明亮的博士论文“中国土地利用/土地覆盖变化与陆地生态系统植被碳库和
生产力研究”(2001.)。数字模拟的地形、城市规模、铁路网和公路网等基本
数据背景来源于中国科学院地理科学与资源研究所资源环境数据中心。
2.1  中国陆地生态系统净第一性生产力的空间分布
净第一性生产力是指绿植物在单位时间和单位面积上所累积的有机物数量,可
表达为绿植物累积光合作用和累积自养呼吸之间的差值。根据中国气象站点数
据、土壤数据和地形数据,刘明亮运用中国陆地生态系统生产力模型 (TEPC) 计
算和分析了中国20世纪90年代陆地生态系统净第一性生产力的平均值的空间分
布。分析结果表明,中国净第一性生产力的空间分布的总趋势是从东南到西北逐
渐减少 (图1)。净第一性生产力的绝大部分分布于410mm等年降水量线以东地
区。最大的净第一性生产力分布于水热条件较好的地区,包括东北的小兴安岭、
长白山脉、云贵高原、广西、海南、重庆、湖北西部的落叶阔叶林地区、长江中
下游沿岸地区。按照土地覆盖类型,灌木和疏林地的净第一性生产力为1071 gC •m-2•yr-1,常绿阔叶
林为975 gC•m-2•yr-1,落叶阔叶林为928 gC•m-2•yr-1,针阔叶混交林为870 gC•m-2•yr-1,农田系统为752 gC•m-2•yr-1,常绿针叶林为587 gC•m-2•yr-1,落叶针叶林为585 gC•m-2•yr-1,草原为271 gC•m-2•yr-1。
2.2  中国地势
中国地势自西而东下降,形成了地形上的三级台阶 (图2)。青藏高原是中国最高一级地形阶梯,其海拔在4000~5000m;第二级地形阶梯位于青藏高原的北面和东面,包括海拔1000m左右的塔里木盆地、大部分海拔不到1000m的准噶尔盆地、海拔1500~2000m的河西走廊和阿拉善高原;横断山脉以东至大兴安岭、太行山、伏牛山、雪峰山一线山地与高原的海拔大多在1000~2500m。第三级地形阶梯位于大兴安岭、太行山、伏牛山、雪峰山以东,其中东北平原、黄淮海平原和长江中下游平原的海拔低于200m,江南丘陵地区海拔只有数百米;这些平原和丘陵以东的长白山-千山山脉、山东低山丘陵和浙、闽、粤等地山脉的海拔为500~1500m[13]。
2.3  中国城市规模及其空间分布密度
由于历史、地理和社会经济发展多种因素的影响,在近代以来,中国城市的空间分布一直呈现自东而西由密到疏的特征[14]。中国城市在空间上集中分布于沿海地区 (图3)。根据2001年统计数据[15],中国667座主要城市中的42.1 % 分布在仅占全国9.5 % 土地面积的东部;34 % 分布在占全国17.4 % 土
地面积的中部;23.8 % 分布在占全国70.4 % 土地面积的西部。中国东部和中部城市的空间分布密度分别为西部的13.1 倍和 5.8倍。由于中国沿海地区拥有多方面的地理优势和经济基础,不仅是城市分布密度最高的地区,而且上海-南京-杭州、北京-天津-唐山、广州-香港-澳门和沈阳-大连等中国的大都市密集区都分布在这一地区。
2.4  中国交通基础设施的空间分布
目前中国综合交通运输网有铁路、公路、水路、航空和管道等5种各具特的现代交通运输方式组成。交通干线网是综合交通运输网的骨架,也是区际主要运输通道。中国目前的交通干线网主要由6个近似东西向和7个近似南北向的大通道构成[15]。6个近似东西向的交通主干线包括绥芬河-哈尔滨-满洲里通道,丹东-沈阳-北京-包头-兰州通道,青岛-济南-石家庄-太原-西安通道,连云港-郑州-兰州-乌鲁木齐-阿拉山口通道,上海-武汉-重庆-成都通道和上海-杭州-南昌-株洲-贵阳-昆明通道。7个近似南北向的交通主干线包括哈尔滨-沈阳-大连-上海-广州通道,天津-济南-徐州-南京-上海通道,北京-武汉-广州通道,北京-九江-深圳-九龙通道,大同-太原-焦作-枝江-柳州-湛江通道,安康-重庆-贵阳-柳州-南宁-防城通道和中卫-宝鸡-成都-昆明通道。根据中国统计年鉴[16],中国东部和中部的铁路网密度分别是中国西部的7倍和 5 倍;东部和中部的公路网密度分别是西部的122倍和 61倍 (图4)。铁路、公路网密度低于1000 km/104 km2的省份包括西藏、新疆、青海和内蒙古,它们全部位于中国西部。交通网密度大于5000 km/104 km2省
份包括广东、北京、天津、上海和海南,它们全部分布在中国东部。中国交通的平均状况是从西北到东南,交通网密度越来越大。
liangluoshi3  SPD格点生成的过程和结果
3.1  格点生成的过程
当P(t) 取2000年的平均人口密度值时,模拟人口密度空间分布的格点生成模型可表达为:
SPD = 2354.8•(ra)•(ro)•(f)•(dem)• (4)
式中: ra为2000年铁路密度归一化值; ro为2000年公路密度归一化值;f为2000年的F归一化值; S为2000年第k个城市的面积;M为2000年城市的总数;dijk是格点(i, j)到第k个城市中心点的距离;Dem当小于3000m时dem 取1值,当Dem大于3000 m时dem取的归一化值。
计算过程中一共包含 7个数据层,它们是根据气象台站观测数据、土壤数据和遥感数据计算得出的NPP (净第一生产力) 数据层, GridRail (铁路网) 铁路交通图数字化数据层, GridRoad (公路网) 公路交通图数字化数据层, Demnew (中国陆地高程) 地势图数字化数据层、Chbnd (行政区界) 勘测数据层和Chzh (城市面积) 统计数据层[6]。数据的预处理过程如下:(a) 把 NPP和Demnew转换成矢量数据;(b) 通过Intersect将Chbnd和 GridRoad 、GridRail叠加,创建一个新的数据层ChBndNew;(c) 在 Chz
h 中添加CityFlag字段,作为城市和农村的标志代码;添加CityArea字段,存储城镇的面积;(d) 通过Intersect 将Chzh和ChBndNew叠加,创建一个新的数据层ChCity;(e) 通过Inter-sect 将NPP、Demnew和ChCity叠加,创建一个新的数据层NppNew。在NppNew和CityShp 图层的基础上利用方程 (4) 生成人口密度格点,其生成过程如下:
第 1 步:读入每个模拟人口密度格点的属性值
mNpp:=Recs.Fields.Item(´Value´).Value;
mRail:=Recs.Fields.Item(´Rail´).Value;
mRoad:=Recs.Fiel ds.Item(´Road´).Value;
mDem:= Recs.Fields.Item(´Dem´).Value;
mFlag:=Recs.Fields.Item(´CityFlag´).Value;
mArea1:=Recs.Fields.Item(´CityArea´).Value;
第 2 步:对交通网进行模拟
mRail:=Power(mRail,0.5);
mRoad:=Power(mRoad,0.15);
mNpp:= Power(mNpp,0.5);
mArea1:=Power(mArea1,0.5);
mDem:= Power(mDem,-0.15);
第 3 步:定义一个SPD格点的搜索半径和对SPD格点有相当影响的搜索城市  while f do
begin
ccDist:=vLen1;
recs2:=lyr2.SearchByDistance(tmppnt1,
深渊派对Map1.ToMapDistance(ccDist),´´)
if city.Checked then
begin
while recs2.Count<=ccNum do
begin
ccDist:=ccDist+ccStep;yukewei
recs2:=lyr2.SearchByDistance(tmppnt1,Map1.ToMapDistance(ccDist),´´)  end;
第 4 步: 计算搜索城市对模拟人口密度的影响力因子
//summation,recs2 is set of the cities that meet specification
while f do
begin
tmppnt2:=IMoPoint(IDispatch(Recs2.Fields.Item(´Shape´).Value)); mArea2:=Recs2.Fields.Item(´Chengzhen´).Value;
tmpval:=tmppnt1.DistanceTo(tmppnt2);
if (mArea2>0)and(tmpval>0.00001)
then  mVal:=mVal+mArea2/tmpVal;
recs2. MoveNext;
end;
mVal:= Power(mVal,0.15);
第 5 步: 计算 SPD
if mFlag=1 then  SPDij:=23548*mRoad*mRail*mArea1*mDem*mVal
else SPDij:= 23548*mRoad*mRail*mNPP*mDem*mVal
3.2  运算结果
计算结果显示 (图5),模拟人口密度的最高值几乎集中在以北京市、上海市和郑州市之间的三角地带 (BSZ) 以及珠江三角洲地区。武汉市及其周边地区和沈阳市及其周边地区也具有较高的模拟人口密度。同时,峰值BSZ三角区有发展为以上海-南京- 杭州大都市密集区、武汉、西安、北京-天津-唐山
大都市密集区和沈阳-大连大都市密集区为其顶点的五角形峰值区的趋势,珠江三角洲峰值区也正在向外围地区发展。
这里需要说明的是,由于全球定位系统设备的数量和研究队伍规模的局限,在短时间内很难完成全国范围内的抽样调查研究,所以本文只讨论实际模拟结果。
4  讨论
人口空间分布分析已有很长的研究历史,它可追溯到19 世纪始于欧洲和美国的统计革命时期。也就是说,人口空间分布分析是在行政单元框架内新生人口注册数据与定期人口普查数据相结合的产物[17, 18]。目前,已有许多分析方法和量度指标。例如,总人口与净耕种面积的比率,量度不同土地利用模式的系数,基于卡路里、生产力或国民收入的指标。这些方法只强调人口空间分布的某些方面,因此,它们都没有逃脱学术界的批评[19]。
人口密度的空间分布在很大程度上要受自然因素的影响,尤其是净第一性生产力和陆地地势。然而,自然因素对人口密度空间分布的影响依赖于诸如交通基础设施和城市空间分布等经济因素。例如,当青藏铁路横穿青藏高原或一座新的城市出现的时候,人口的空间分布会很快发生变化。在中国,现代交通到达的地区和没有到达的地区之间的差别变得越来越明显,前者发展迅速,大城市在加速扩展。交通有利于城市的发展,城市可以通过人口的集聚直接影响人口空间分布。
从方法上讲,格点生成法可以有效地融合和运用包括遥感、统计、观测和实地调查等不同来源的各种数据,随着数据质量和可用性的改善,模型的运行结果随之改进;有关变量的局部变化可以立刻反映在模拟人口密度模型的运算中。在模拟人口密度与实际人口密度的关系建立以后,格点生成模型就发展为一种可以用来预测人口密度空间分布变化的动态模型。