第23卷第2期 2021年2月加孫信憩瞄莩
Journal of Geo-infomiation Science
Vol.23, No.2
Feb., 2021
贷款工资证明引用格式:应申,窦小影,徐雅洁,等.新型冠状病毒肺炎疫情可视化进展与分析[j].地球信息科学学报,2〇21,23(2):2丨丨—22丨.[Y i n g s,D〇u x Y,Xu Y J, et al. Visualization of the epidemic situation of COVID-19[J]. Journal of Geo-information Science, 2021,23(2):211-221. ] DOI:
10.12082/dqxxkx.2021.200301
新型冠状病毒肺炎疫情可视化进展与分析
应申,窦小影,徐雅洁,苏俊如,李霖
武汉大学资源与环境科学学院,武汉430070
Visualization of the Epidemic Situation of COVID-19
YING Shen*,DOU Xiaoying,XU Yajie,SU Junru,LI Lin
School of Resource and Environmental Sciences, W u h a n University, W u h a n430070, China
Abstract: The COVID-19 epidemic has extremely attracted our attentions and lots of maps and visualization charts were created to represent and disseminate the information about COVID- 19 in time,which exactly became a key role for the public to acquire and understand the quantitative information and spatial-temporal information of COVID-19. The paper analyzed the dimension of data for COVID-19 and processing levels about them,then divided the COVID- 19 visualization into three types,that is1-order visualization,2- order visualization and multi-order visualization for COVID-19,based on direct data or indirect data of COVID-19 with the corresponding visualization methods,characteristics and information transmission Shortcomings and weakness of visualization methods for COVID-19 were analyzed in details,from the aspects of multiple scale unit in spatial data statistics,max value dealing in data classification,also many key design points were described including color connotation in disease visualization,the influences of area/unit size in visualization, symbol overlapping,multiple-scale heat maps and labels in statistical tables.The paper indicated the visualization traps of COVID-19, such as misuse of visual effects and excessive visualization,and reasonable abilities of COVID- 19 visualization including map-story narrative methods and visualizati
on pertinence for specific problems should be considered sufficiently to provide the references for cartographers to design the maps and for readers to understand the maps.
Key words: COVID-19; data visualization;color unit method;heat map;spatial temporal relationship;infonna-tion transmission;map symbol;diagram design
♦Corresponding author: YING Shen,E-mail:shy@whu.cdu
摘要:新冠肺炎疫情期间,疫情数据成为民众关注的重点,涌现出f大量可视化图件,及时地向公众传达着疫情的数量信息和 时空分布及变化,帮助大众快速了解疫情当前状况、推断发展趋势本文从疫情数据可视化表达内容的维度出发,分析不N 可视化的表达形式以及其对疫情数据的加工程度,结合示例把可视化分为“1阶”、“2阶”和“多阶”,并分析各自表达的数据类 型、表达方式、设计特点和信息传递同时,针对疫情可视化中的+足,探i、t 了数椐统计中制图单允多级选择、数据分类中的
收稿日期:2020-06-10;修回曰期:2020-09-10.
基金项目:“十••五”国家重点研发计划项目(2017YFB0503500)。[ Foundation item:National K e y Research a nd D e v e l o p m e n t Program of China, N〇.2017YFB0503500.]
作者简介:应申(1979—),男,安徽界首人,博士,教授,主要从事地图学、3DGIS与维地籍、位
置数据关联等研究 E-mail: s h y@w h u.e d u.c n
212地球信息科学学报2021 年
极值处理问题,以及疫情可视化手段中不同颜的内涵、质底法地图中K域面积和统计单元的影响、符号地阁中符号压盖处 理、热力图中比例尺的影响、统计图表和标注信息等在疫‘W可视化中的设计M题,指出疫情可视化设计中的视觉效果误用、设 计过于复杂的误区,最后指出疫情信息可视化应具备讲故事的能力、问题针对性的特点,以图面简洁、高效信息传递为根本,为制W者合理设H-图表和用户理ft:阅读疫情地W提供参考
关键词:新细冠状病®肺炎;■视化;质底法;热力阁;时空关系;信,a、传递;地闯符4;图表设计
1引言
流行病学在研究中常常需要把数据可视化:1854年英国医生约翰.斯诺(John Snow)在调查伦敦 时,将死亡病人资料和街区的水并位置标注在 地图h,说明了受污染的水是®乩的来源,这一事 件被认为是流行病学调杏的开端m。在新型冠状病 毒肺炎(COV1D-19,简称新冠肺炎)聚集性疫情流 行病学调查指南中流行曲线、时序图、病例关系图 等可视化图表,是梳理总结聚集性疫情关键信息的 重要手段'新冠病毒或传染病的传播与人类流动 紧密相关,体现在传播链和感染量、距离和疾病到 达
时间等方面|3_41,对制定公众聚会、人口流动等政 策起艾键因索,特別新冠疫情暴发城市的“封城”行 为对阻滞或延后疫情传播作明敁|5'计算机、大数 据分析等技术的发展让疫情防控服务更智慧|7_'数 据可视化形式也越来越多样,医学相关的可视化系 统建设技术也不断完善1一些可视化T.具可快 速生成设计精美的可视化图件,借助可视化库可开 发web端、移动端界面,实现后台数据实时更新的 可交互的可视化页面
数据可视化是一种讲故事的手段新冠肺炎暴发以来,新闻媒体实时为公众通报疫情情况,运 用地阍、折线阍、玫瑰图等可视化手段向公众传递 疫情发展情况|141。相比于一般可视化,疫情可视化 具有更强的时效性,iif注重疫情信息实时更新和展 示。新冠疫情数据可视化是为丫清晰、准确、高效 地向读者传达疫情倍息,这些信息包括数值信息、位置信息和时序信息等,通过可视化向读者传达:①疫情在哪里;②如何发展的;③形势如何。新冠 肺炎疫情期间媒体报告的数据统计量分为6大类:累计数据、增量数据、存M数据、比率数据、个体数 据和其他数据,前5种类型数据呈现出明显的地理 和时序特征,是典型的时空数据累积数据包括累积确诊、累积治愈和累积死亡,增量数据包括新增 确诊、新增治愈、新增死亡、新增重症、新增疑似、较 昨曰数据和新增输人,存量数据包括现有确 诊、现有重症和现有疑似,比率数据包括治愈率、病
死率、重症率,个体数据包括逗留时间、逗留地点、密切接触者位置和活动名称,以及辟谣信息、公众 情绪、科普知识等其他数据。疫情前期公众关注的 是累汁数据,随着疫情的发展,公众更关注增M
信 息、比率数据、病例剖析和风险评估,以及辟谣、科 普等作品。疫情形式逐渐向好,社会逐渐复工复 产,公众更关注的是存i t数据。
疫情期N相关专家从不同的角度对疫情可视 化进行总结|l5i,从时空地理大数据视角梳理时空可 视化的起源与方法,并对时空地理分析可视化进 行描述w。更专业的疫情地图制作,可从空间尺度 (如大尺度聚合、小R度聚合等)、单元类型(如省 级、地市级等)、聚类方法(分位数法、标准差法等)和呈现形式(如面元密度图、核密度图等)4个方面 绘制和解读N71,片且考虑地阁投影、颜配置、彩 渐变图、密度图、等比例符号等在疫情地|?|制作和 数据传达方面存在差异,还有=维地图、web地图 具有的优缺点lls|等方面。针对疫情期间主要媒体 发布的图件,可以从疫情可视化设计的州户分类、数据类型、特点和演化过程等方面总结||91。
本文针对新冠肺炎疫情的可视化图件,从数据 可视化表达内容的维度出发,将疫情信息可视化分 为“1阶”可视化、“2阶”可视化和“多阶”可视化,并 结合案例对相应表达的内容和特点进行阐述:本 文还对疫情可视化中的数据统计和可视化展现方 而的问题进行反思,并对疫情可视化中的误K和要 求进行分析,为制图者合理设计图表和用户理性阅 读提供参考。
2疫情数据可视化形式分类
疫情数据可分为直接数据和间接数据,直接 数据是疫情情况的统计数据,间接数据是依据模 型、公
式等对直接数据计算加T.后得到的知识数据 (图1)。1阶可视化反映某一时刻的疫情分布情况 或者是某一类数据的时间变化情况,涉及到疫情累 计数据、增量数据、存量数据和比率数据。2阶可视 化反映疫情在时间和空间上的发展过程,涉及到疫
折线图,柱状W y
1阶可视化
玫瑰阉j 质底法地图
饼图|符号地图
散点图J v 热力图2阶可视化
$轨迹地图多阶可视化
基丁•社交距离风险评估J j i :区风险评估图
、时间轴 动阁 暗雨表
疫情演化阉病例时空关系丨冬丨
图1疫情数据可视化方式
Fig. 1 Different visualization symbols of C O V I D -19
情轨迹数据和时间序列数据(或历史疫情数据) 多阶可视化反映了对疫情的评估、预测等情况,侧 重于数据挖掘的知识数据展示,涉及到的数据是计 算、加工后得到的知识数据。2.1 “1阶”可视化
“1阶”可视化形式是统计和展示某一维度的疫 情数据,只关注数据的单一维度,比如某一时刻的 累计确诊数、新增确诊数、出院数、死亡数等等,侧 重对数据本身的直接展示
(1)地图
地图在表达具有时空特性的数据方面凸显了 绝对的优势,新冠疫情期间,各大媒体均开通新冠 疫情专题每日通报疫情情况,以地图形式的11 了视化 备受关注。常用的疫情地图有质底法地图、符号地 图和热力图等形式,其中符号法在全球疫情地图中 最常见。
质底法地图(图2(a ))可呈现各地疫情的累计确 诊病例数、新增确诊病例数等数据的地域分布情
况,多用于表达累计数据和增量数据。质底法使用 分级设的形式绘制地阍,以不同相或同种相 不同深浅区分不同的类別。针对中国的疫情情况, 分哲统i 丨•数据是常见的分类形式,而全球疫情的
地 图多采W 分国家统计数据。现在的电子地图基本 都具备交互的功能,用户可根据自己的需求进行放 大到下一级行政区、浏览详细情况等操作
符号地图(图2(b ))用于统计累计确诊病例数、 累计死亡数等数据的地域分布情况,多用于表达累 计数据在符号的选择k 多采用点状符号(如圆 点),圆点的大小代表数M 的多少,符号的颜单
符号的位置常选择放置在丨X :域的重心位置
世界疫情地图设计中,比例符号地图运用最多,为 避免引起误解,制图者会设置缩放级別限制,防止 符号点落到具体的居民地上。
热力图(图2(c))多用于表示城市级别的确诊病 例的空间分布情况,多见于表达个体数据,相似的 还有密度图,这类地图具有变化连续、边界模糊的
(a )质底法地图 (b )符号地图
姓王的历史名人
注:图(a )来源 r hgis.uvv.edu/vims/;图(b )来源 r.https:"coronavirus.jhu.edu/map.htm
(c )热力图
直接数据
间接数据
j 累丨I •数据
in  I 比牛数捉_轨迹数据时问序列数椐 I 模拟数据I 【'卩估数据:------------------    七
--------------------..i. - - - - w - J --------------------------------------------------------------------麵
麵.
2期
应申等:新®冠状病毒肺炎疫情可视化进展与分析
>13
高考几号出成绩
AFRICA
uth湖北有多少个市
视化分类
情数据褚时健女儿
图2疫情地图分类
Fig. 2 C O V I D -19 m a p s  with different
symbols
214地球信息科学学报2021 年
特点,在宏观特征提取、疫情时空演变和过程模拟 等方面具有优势。
(2)统计图
统计图具有简单直观的特点,往往作为辅助的 功能,放置在可视化大屏、仪表盘界面的一侧。虽 然统计图不能表达空间关系,它的作用可能被制图 者低估;同时,电子统计图具有交互的功能,能够表 达的信息逐渐丰富。
报考会计证折线图(图3(a))常用于表达趋势,在表达增量 数据、比率数据等类型数据时具有优势。柱状图 (图3(b))用于分类量之间的大小比较,可表达累计 数据、存量数据等类型数据。饼状图或类似的玫瑰 图(图3(c))在表达累计数据、增量数据中常用。若 以空间区域作为分类项,统计图表虽缺失对空间区 域关系的表达,但在数量大小的比较方面比地图更 直观。
注:图(a)来源于财富时代;图(b)来源于;图(c)来源于人民日报微博
图3疫情统计图
Fig. 3 Statistical graphs of COVID-19
2.2 “2阶”可视化
对疫情数据进行2个维度上的统计和展示,展示
时间空间上的变化,侧重展示数据前后变化等信息,
可视化采用比如轨迹图、时间轴、晴雨表等形式。
(1) 轨迹图
移动轨迹的可视化多用于展示个体病例数据,
比如具体病患个案的移动轨迹可视化(图4),以交
互地阁的形式展亦病患在哪一天乘坐何种交迪r.
具去往何处,重点展示了起点、目的地和出行日期
信息,为公众的自我防护提供了重要的依据。
(2) 时间轴
时间轴的可视化方法相当于在“1阶”地闬点状 符号法可视化方法基础上加入了时间维度,来展现 疫情总体分布的历史发展变化状况,以动态和交互 的方式展示疫情统计数据的时间和空间分布情况 如图5(a),同时对疫情的空间扩散情况能有直观的 认识。时间轴在统计图中也有应用,比如河流图 (图5(b)),聚焦于某个统计单元的每日新增病例, 彩流的宽度表示疫情统计值大小,每条彩的垂直 高度随同当日数据改变,垂直线高度就是当日新增
注:来源于www. b i丨ib i1i.c om/video/av983443 74n
图4疫情病例个体行踪可视化
Fig. 4 Visualization of personal trajectory about individual case
病例的总量,横轴表示时间的推移D河流图能清晰 展现一个统计单元内的某个或2个疫情统计数据的 时间发展整体趋势,曲线的外轮廓高低起伏的状态 可以清晰地呈现出新增病例数量的变化,并显示出 疫情严重的地区。
(3)晴雨表
晴雨表(图6)聚焦于增量数据,对每日历史数 据进行统计,
宏观呈现疫情发展态势。晴雨表中方
应申等:新型冠状病毒肺炎疫情可视化进展与分析
215
2期
(a )地图时间轴 (b )河流图时间轴
注:图⑷图来源 /covid-19/;图(b )来源 zeelab/WuhanThemeRiver 。
图5疫情时间轴可视化
Fig. 5 C 0V I D -19 visualization with timeline
EN 新冠病毒肺炎疫情晴雨表
世界每曰新增确诊数及舆变化趋势
当T ffiW 用.
至 2020年4月7E24W
•w ^f i a R a a o s :^ f i
7]«H Sstafii£*7«:r
. _»3子?8亍SI•携》=芎5妒:■
裏«子«鏖35多...•方李”3日,»濟利5话5巧JTfilSHAfc* ,»子戈用了?:用
注:来源 vis.pku.edu/ncov/barometer/
图6疫情晴雨表可视化
Fig. 6 C O V I D -19 visualization with barometer
块颜表示当日新增确诊数较前日的变化,面积表 示增量的多少。方块下方的数字为当日新增确诊
数,括号内为核增或核减数。晴雨表可以对每天的 增量数据进行统计,运用彩和方块大小展示每个 地区的疫情发展,以地理名称代表不同的地区。2.3 “多阶”可视化
新冠疫情的“ 1阶”可视化和“2阶”可视化,侧重 对疫情基本统计数据本身的时间和空间变化的直 观展示。而“多阶”可视化侧重对新冠疫情数据的 挖掘、分析和评估,通过一定的方法对疫情数据进 行挖掘如关联、对比、预测和可视化分析等。通过 手机定位追踪疫情期间用户的活动情况,并结合疫
情的发展模拟、真实数据来评估保持社交距离可以 降低或减缓新冠病毒传播的效应(图7(a )),不同区 域可根据该评估来提出本地的限行、保持社交距离
和禁止公众集会等决策。在疫情的后期,依据I X :;域 社K 划分数据、POl 网格数据、空间交互数据、病患 逗留小区数据,建立风险估算模型,计算传播矩阵 用以刻脚社K 到社区之间的风险传播度,从而对每 个社区进行风险评估(图7(b )),
为社会复T .、
生产、
生活提供参考。
针对个体病例,构建人(患者)、事(探亲等活 动)、地(地理位置)、物(接触对象)和时间相互联系 的框架,聚焦于个体病例数据之间的关联,通过位置
关联可以有效地进行时空交叠或共现分析,绘制病 例时序图、关系图和移动轨迹图,可快速调查病例之
间的传播链,支持流行病学调查如图8所示,通过 时空关联分析,得到病例415号为输入型病例(右侧 位置转变图),且先发病入院(健康状态时序图),并 传染给402号和397号病例(左侧关系图和健康状态 图)。而面向新冠病毒全球大暴发的过程,不同新冠 病毒谱系变异、国家之间的时间演进、病例总量的动 态变化、国家间的病例输人等复杂多维的信息亦可 以通过实时动态地图进行生动的绘制和展示(图9)。
3疫情数据可视化中的反思
3.1疫情可视化中的反思
面对多样的疫情数据,疫情可视化设计时存在 一定误区,
包括对统计数据的制图单元选择和数值