第46卷第12期2020年12月
Vol.46 ,No.l2 ii  j
December, 2020 Sichuan  Building  Materials 江苏省过江特征与交通量分析
—基于多源数据融合技术周涛打裴剑平打唐强2
(1•中设设计集团股份有限公司,江苏 南京210014 ;2.苏州大学轨道交通学院,江苏 苏州215131)
摘 要:为了支撑江苏省过江通道建设,摸清机动车过江现
状,了解过江出行特征,江苏省开展了全省机动车OD 调查
本调查结合交通行业数据、问卷数据和手机信令大数据等调 查多种手段,获得不同类型的多源异构数据;根据数据特点,
对多源数据进行剔除、整理、融合、归并和统一等处理,按需
求形成机动车OD 矩阵和出行特征,最后利用GIS,Python 和
Echart 进行可视化展示。本调查成功将多源数据融合技术
应用到区域性0D 调查中,大大提升了调查效率和全面性;
确定了数据融合扩样的规则,形成了全套数据融合处理技 术。而且,调查形成了 0D 对与出行特征对应的属性表,研
究不同0D 对间客货运量与出行特征的关系,发现交通量与
区域经济结构、产业分布、城市特、过江通道类型等都有着 密切的关系。
关键词:过江通道;手机信令;多源数据;0D 调查;可视化;融
合扩样
中图分类号:U491. 1 文献标志码:A
文章编号:1672 - 4011( 2020) 12 - 0230 - 03 DOI :10. 3969/j. issn. 1672 - 4011. 2020.12.118
Analysis  on  the  characteristics  of  river
crossing  and  traffic  volu  me  in  Jiangsu  Province
------Based  on  multi  - source  data  fusion  technology
ZHOU  Tao 1 ,PEI  Jianping 1 JANG  Qiang 2
(1. China  Design  Group  Co. ,Ltd. ,Nanjing  210014,China ;
2. School  of  Rail  Transportation , Soochow  University ,
Suzhou  215131, China)
Abstract : In  order  to  understand  the  current  cross  - river
transportation  condition  and  its  characteristics , an  Origination  and
Destination  distribution  ( OD ) vehicle  traffic  survey  has  recently
been  organized  in  Jiangsu  Province  to  support  the  following
planning  and  construction  of  cross  - river  channels. This  survey
generates  multi  - source  in  various  types  and  structure  based  on
statistical  data , questionnaire  data , and  cellular  signaling  data.
The  vehicle  OD  matrix  and  traveling  attributes  has  been  built  by  culling , sorting , fusion  analysis , and  merging  on  multi  - source  data. The  result  of  the  survey  and  following  data  analysis  has
been  visualized  by  GIS , Python , and  Echart  tools. The  survey  and
its  following  analysis  successfully  applies  multi  - source  data  fusion  method  into  regional  origination  and  destination
distribution  survey , improves  the  efficiency  and  co
mprehensiveness  of  traffic  survey , and  sets  up  the  rule  for  data
fusion  and  sampled  data  expansion. The  research  on  the
收稿日期:2020 -05 -08
作者简介:周涛(1991 -),男,湖北黄冈人,硕士,工程师,主要研究方 向:综合交通与交通大数据。
恋爱一周年relationship  between  traveling  attributes  and  passenger/freight
volume  in  OD  pair  illustrates  the  correlation  between  traffic  and  regional  economy  structure , industry  distribution , city  characteristic , and  type  of  cross  - river  channels
Key  words : pathway  crossing  rivers  ; cellphone  signaling  ;
multisource  data ; OD  investigation ; visualization ; fusion  and  sa  mple  enlargement
0前言
交通调查是进行交通规划和交通预测的基础,江苏省规
划2018〜2020年间新建9座过江通道,然而自2007年开展
“江苏省主要公路机动车OD 调查”以来,近10年全省性交
通调查数据未跟新,因此,开展了本次全省过江0D 调查。
随着交通和信息化的快速发展,本研究结合大数据技术,充 分利用行业数据、手机数据和问卷进行0D 调查,并结
合调查数据,采用大数据手段对数据进行聚类分析,形成以
出行0D 对为基础的出行链,分析各种出行属性的关联性。
1全省过江调查与多源数据融合
1.1基于多源数据的调查技术
本次结合江苏省的实际情况,调查主要采用高速公路联
网数据、汽渡票根数据、行业统计数据、调查问卷数据和电信
手机信令等5种数据。5种不同类型的数据均从特定的角度
反映了真实的过江特征,本次调查需对获得的多源异构数据
进行整合,形成具有法定效用的出行特征参数,供规划建设
单位使用。本次调查综合各种调查方法的优势,采用取长补
短,结合实际情况结合,针对全省23处过江调查采取不同调
查方法。8处过江大桥(全部收费)分别指南京长江第二大
桥、南京长江第三大桥、南京长江第四大桥、润扬大桥、泰州
大桥、江阴大桥、苏通大桥和崇启大桥,采用高速公路联网收
费数据进行调查;13处汽渡(全部收费)分别指板桥汽渡、镇
扬汽渡等汽渡,采用票根数据进行调查;2处隧道分别为扬 子江隧道和南京长江隧道(全部免费),采用隧道监控数据。
1.2 多源数据融合技术
多源数据融合主要分为三类:数据层融合、特征层融合
和决策层融合。本次研究主要在特征层和决策层进行融合,
采用集中式分布体系,通过对比分析不同数据源的出行特
征、0D 结果进行融合扩样,数据融合技术路线如图1所示。
本次获得的交通行业数据较全,基本满足过江0D 出行
分析及主要的出行频次、出行时间、载重等参数分析,因此, 本次数据融合采用对比扩样法,以交通行业数据为主,以微
信调查数据和手机信令数据为扩样对象,以每个过江通道的
0D 对小区为扩充对象,按照不同0D 小区对交通量的差值
进行出行特征扩样,并形成完整的出行特征表(包含0D 出
行对)。
多源数据处理首先要对数据进行清洗,包含无效数据剔
230
6 g  坊
Sichuan  Building  Materials
第46卷第12期2020年12月
Vol.46,No.l2December, 2020
除、数据自校核和数据对比校核;其次数据融合包含数据的
融合和扩样。本次融合与扩样均以各通道的区县OD 对为
基础,首先,将客运单位统一归并到人,货运单位统一归并到
t,完成单位归一化处理;其次,依据各通道各区县OD 对的比 例,对非全样本数据(问卷数据和手机信令数据)进行扩
样,对应的其他出行特征相应进行扩样;然后,以各通道区县
OD 对为唯一标示码,用Python 语句的Join 功能将不同数据
源进行连接,将问卷数据中出行目的、载货货种、载客人数、
出发时间等信息链接到0D 数据对后;最后对数据按照通 道、和全省三各维度进行数据合并。最后,根据融合后的数
尊敬老师据进行出行特征分析和可视化展示。
结果输出
特征融合时
检验检核
怔效数据剔除| |数据修补| |数据误差分析|腰据一致性分析|
采集存储命-
Q I 数据输出|
Q I 数据融合层|
<]=||交通特征层|
<]=■擞据接可
B|
|交通行业数据|惆查问卷数据| |手机信令数据|
图1多源数据融合体系框架图
2 全省过江出行特征
2.1出行属性表与出行特征画像
谢霆锋陈坤为了深入分析过江出行规律,更好地建立过江出行模 型,本次在完整的出行属性表之后,加入了时间、距离和费用
参数。本次通过Python 语句,调用高德地图的API 接口,按
照Driving 模式,最短时间模式提取任何两个区县0D 对之间 的出行时间、距离和费用;并且,通过各区县的统计局统计各 自的经济GDP 数据,并将二者GDP 链接到0D 对属性表后
面,建立了 0D 交通量、出行特征、时间费用以及经济参数一
一对应的属性表,该属性表将为建立过江出行模型提供详实 的数据基础。
经过0D 数据对进行融合扩样后,将得到客货完整的出
行属性表如表1所示。
表1长江二桥客运出行属性表(整理后)
0D
编码车型出行车辆数人数标准车时间费用/元0GDP /亿元
频次/辆/人/pcu /h 10003
85
6117
3771170.8061801000484
10229
510
2290.8
20
6180
710074
8
712
151302
151
10.9
38512556
注:0D 编码中AB0CD 中,AB 表示起点区县,CD 表示终点区县;
车型8表示7座以下小客车、出行目的4表示上班、上学;5表示公务 出行,7表示探亲访友。
相比于以往的交通调查,本次调查不仅获得了真实完整
的0D 出行矩阵,并获得了完整的出行特征,并且建立了 0D
对与出行特征一一对应的关系;同时,加入的时间、距离和经
济参数更加丰富了调查结果,理解任意两个0D 对间过江量 具有重要的意义。图2为出行特征画像。
图2出行特征画像
2.2 全省过江出行主要特征
根据调查,获得全省过江量约84. 6万pcu/d,其中客车
占63. 3%,货车占36. 7% ;全省8座大桥机动车过江标准车 约为54. 5 pcu/d,约占总量的64. 5% ;两处南京隧道过江机
动车当量数约为21.1万/d,约占总量的25. 0%,其余13处
汽渡过江量约9万pcu/d,占比10. 5%。在桥梁过江中,苏通
大桥通过车辆约13. 0万pcu/d,江阴大桥约9. 9万pcu/d,南 京长江二桥约9. 4万pcu/d,此三座大桥拥堵已成为常态;节
假日中,润扬大桥、长江三桥也加入了拥堵行列。跨江大桥
主要解决长江南北城市间区域出行,而地处南京两座隧道解 决江北新区与南京主城区之间通勤出行。融合分析手机信 令数据和隧道流量监控数据,发现江北新区与主城区(江苏
省南京市秦淮区、建邺区、鼓楼区等)、江宁区之间流量占比
超过81%。
从板块来看,全省区域过江出行形成了两头重中间轻的
空间格局,南京和(沪)苏通过江出行占比超过50%,镇扬和 无锡过江占比较低,常州过江出行成为洼地。从0D 出行结
构来看,一带两轴的过江通道特征明显,沿江两岸区县之间
过江出行旺盛,占比超过54%,其次表现为沿我省中部通道
和沿海通道沿线分布,通道特征与全省客流走廊基本一致。
从区域客运来看,呈现沿江城市连绵化发展趋势,省内 客运出行约占81%,省内货运出行约占73%,全省过江出 行,以省内为主。省内出行占70. 9% (隧道占全省25%),内
外交通量(一端在省内,一端在省外)占23. 9%,过境交通量
出行(两端均占省外)只占5.2%。从对外出行结构来看,安
徽和上海与我省联系密切,内外出行占比超过90%,说明我
省是沿江大通道上核心省份,东西向交流十分密切;山东和
秋分是农民丰收节
浙江与我省联系较强,内外出行占比约占71%,过境交通约
占29% ,说明我省是沿海大通道上重要省份,贯通南北。
过江隧道高峰小时位于早7: 00—8: 00,高峰小时系数约
为8. 8%,大桥客运高峰小时系数约为9% ;货运出行无明显
高峰特征。受益于南京大力建设江北新区,拥江发展,南京
市通勤高频次过江出行远高于全省水平。全省来看,区域出
行以公务出差为主,但各个区段又各有特。全省客车平均
载客率为3. 5人/辆,其中南京区段最高为4. 2人/辆,苏通
区段最低为2.6人/辆。全省货种运输中,农副产品、食品比
例最高,达到16.5%,其次为金属及制品,其他货种占比较均
匀。全省过江平均载重24.5 t/辆(含车辆自重),南京最高, 为26.7 t/辆,锡常泰区段最低,为22. 1 t/辆。
2.3不同出行特征的关联性
采用大数据技术对各属性进行相关性分析,得到各相关 性结论如下所示:①江苏过江出行在通道选择时,偏好选择
出行时间短的过江通道;而且倾向同一通道往返;②客运交
通量、载客人数与经济势差之间有明显的正比关系,而且两
城市间经济差越大,二地间客流量越大;③出行时间越短,其
231
6 g  形T Sichuan  Building  Materials
第46卷第12期
2020年12月
Vol.46, No. 12December, 2020
交通占比越大,出行频次也越高,上班、上学等通勤出行特征 更明显;数据显示,50%以上的过江出行的出行时间均小于
lh,江苏省过江出行高频次特征明显;④货运量运输对出行
费用更加敏感,客运出行对出行时间更加敏感;⑤通勤出行
越明显,载客率越高;运输距离越近,载客率越高;商务出行
和个人出行载客率较低;⑥城市的产业分布与货种密切相 关,南京区段的运输设备、机械、电子通讯、石油、矿建等占比 较高,镇扬区段各产业在全省占比较低,锡常泰区段的金属
制品、物流快递占比较高,苏通区段的纺织原料、物流、农副 产品、家具等占比较高。
图3为利用过江隧道及全省过江出行期望线图。
(c)江苏省中区总量0D 图
图3利用过江隧道及全省过江出行期望线图
3江苏过江交通量模拟
3.1过江交通量影响因素
按照区县间0D 对的属性表,对过江交通量进行模拟分
析。数据显示,客运交通量主要与出行目的、出行频次、时 间、费用、两地的经济相关以及过江通道数量有关;而货运交
通量主要与两地经济、货种、出行时间、费用、过江通道数量
以及货运政策相关。影响过江出行人数的因子主要有:起终
点出行时间、出行距离、经济、人口、费用、出行目的等。对全 省数万个0D 对样本进行综合分析,过江人数与出行目的的
相关显著性sig 为0. 029,与时间相关性最高,而距离、时间和
费用三者自相关系数大于0. 98,与人口与经济这两个因素的
相关系数高达0.926。考虑影响因素之间的相关性后,发现
可用岀行目的、人口、经济以及出行时间模拟出行人数。
出行目的与人数相关,但相关不强;研究发现,分目的进
行相关性分析之后,不同目的人数与人口、经济以及时间的 相关性有所提升。本次研究选择按不同目的的出行人数W
和人口 P 、经济G 、时间T 进行了 4种组合,组合1为人口、经
济和时间的线性组合;其他参照引力模型,分别建立3种组 合,组合2为:琢2二P 起”起/厂,组合3为兀£二E 起"/严,
组合4为莊4二&起XE 中XP 起XP 7T 4O 其中P 起代表起
点人口,P 终代表终点人口,
式中,E 起为起点经济,E 终为终点经济,Wi 为第i 种
组合。
根据分析,采用引力模型较线性模型能更好地反映过江 人数;而在引力模型的三种组合中,组合2(起点人口 x 终点
人口)/时间2相关性最高,相关系数为0. 098, sig 小于0. 01 ;
本次研究选择组合2的方式进行数据分析。
3.2过江交通量
通过区分出行目的进行人数分析,整体相关性明显提高,
本次研究选择通勤出行、公务出差和休闲旅游三种出行目的
分别进行出行人数模拟,得到出行各出行目的的方程如下。
上班上学:Y 二3872. 298 x  X  + 150. 512, t 检验变量之间
显著性sig 二0. 004
休闲旅游:¥=46. 666 XX + 301. 427,其中t 检验变量间 sig  =0. 001
公务出差:Y=684.616 xX+23& 63,其中t 检验变量间 sig  二 0. 0001
其中:二P 起*&起/厂
以上结果说明自变量可以有效预测因变量,回归模型显
著,得到的回归方程有效。
通过过江人数分析发现,过江人数与起点城市相关性最
大,与起点城市的经济、人口因子呈正相关,与时间呈负相
关,整体呈现以起点城市为核心的圈层结构。从不同出行目
的来看,区县间基础过江人数约200〜300人;城市人口与经 济的发展,通勤出行的人数增长最快,其次是休闲旅游,区域
公务出差人数增长最慢。
4结论
本次基于多源数据融合调查方法成功应用于区域0D
调查实践中,按照交通特征层融合制定了详细的融合扩样规
则,以区县0D 对为标识码的出行属性表更加科学、高效,便
于存入数据库中;加入出行时间、经济和费用等参数后,方便
利用机器学习深入分析各出行特征与交通量的关系,通过区
分出行目的进行过江人数拟合,得到的模拟方程更准确。数
据表明,过江出行主要和起点城市相关,未来随着城市的发
展,以通勤出行为目的的交通出行会快速增长,而区域增长
台式电脑组装教程
相对较小。
[ID :010561]
参考文献:
[1] 邓润飞,周涛•基于多元数据融合的过江0D 调查技术[J].中
国公路,2019,26(1) :118 -120.
[2] 中设设计集团股份有限公司•江苏省过江通道交通量0D 调查
专题[R] •南京冲设设计集团股份有限公司,2018.
[3]
陈胜武•论大区域公路交通0D 调查的组织与实施[J] •现代交 通技术,20106( S2) : 182 -184.
[4] 史学文•高速公路多源交通数据融合方法研究及系统开发
[D].北京:北京交通大学,2017.
[5] 刘博恺•交通0D 调查与交通大数据应用[J].中国公路,2016,
23(1) :144.
[6] 杨东援,段征宇•大数据环境下城市交通分析技术[M ].上海:每年高考时间
同济大学出版社,2015.
[7] 钱昌犁,邵妍•运用机器学习识别信令记录中的用户出行信息[C]//中国城市交通规划年会.2017.
232