2023年4月Apr.2023重庆工商大学学报(社会科学版)
Journal of Chongqing Technology and Business University (Social Science Edition )
第40卷第2期Vol.40㊀No.2
doi :10.3969/j.issn.1672-0598.2023.02.006
㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀
㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀㊀
∗收稿日期:2022-04-29
㊀基金项目:陕西省社会科学基金项目(2019S037) 我国跨境电子商务面向丝绸之路经济带的持续贸易促进研究
㊀作者简介:张夏恒(1982 ),男,山东济宁人;博士后,西北政法大学管理学院教授,硕士生导师,主要从事电商物流研究㊂
肖林(1998 ),女,陕西汉中人;西北政法大学管理学院研究生,主要从事文本挖掘研究㊂
㊀本文引用格式:张夏恒,肖林.基于消费者在线评论数据的快递物流服务质量评价研究[J].重庆工商大学学报(社会科
学版),2023,40(2):66-79.
基于消费者在线评论数据的快递物流
服务质量评价研究∗
张夏恒,肖㊀林
(西北政法大学管理学院,西安㊀710122)
摘要:挖掘㊁明晰及满足消费者需求,是影响与提升快递物流服务质量的关键因素㊂以菜鸟平台在线评论的文本数据为爬虫数据源,针对所获取的6.5万条数据,运用TF-IDF 算法㊁词云图㊁语义网络关联分析㊁LDA 主题模型等文本量化分析,构建情感词典并进行文本情感赋值与分析㊂研究发现:时效性㊁价格合理性㊁服务优质性㊁应用平台功能性是消费者对快递物流服务质量产生消极情感倾向的关键因素㊂为提升消费者对快递物流服务质量的评价,需从提升物流供应链的时效性㊁完善物流价格制度的合理性㊁提高物流服务的优质性㊁优化物流应用平台的功能性方面予以重视㊂
关键词:快递物流;服务质量;在线评论;LDA 主题模型;情感分析
中图分类号:F724.6;F529.2;F274㊀㊀文献标志码:A㊀㊀文章编号:1672-0598(2023)02-0066-14
一、引言
据邮政行业发展统计公报的公开数据显示,2020年快递服务企业业务量为833.6亿件,同比增长了31.3%[1]㊂中国快递发展指数报告指出,2020年快递服务总体满意度得分为76.7分,同比下降0.6分,时限测试满意度得分为69.2分,同比2019年下降1.3分[2]㊂我国快递物流行业虽呈现出规模化的发展态势,但仍面临着诸多风险与挑战㊂快递物流行业为实现高质量发展和构建新发展格局,不仅需要注重规模效应,还应注重提升行业整体的服务质量㊂在线评论集中表现了消费者对服务或产品的感知与体验,大多数消费者在做出购买决策前,都会习惯性地浏览产品或服务的在线评论[3],在线评论为消费者决6
6
第2期张夏恒,肖林:基于消费者在线评论数据的快递物流服务质量评价研究
策提供了有价值的参考依据,同时消费者评论也是对行业整体服务质量的真实反馈,对行业提升整体服务质量有重要的借鉴意义㊂
二、文献综述
(一)物流服务质量评价视域
有关物流服务质量评价的研究,主要分为服务提供商视域和消费者视域㊂(1)服务提供商视域㊂Czajkowska(2015)等[4]从供应商视域论述人力资源和技术手段对提升物流效率的作用,并以此提高企业物流服务的质量㊂Roslan(2015)等[5]引入第三方物流,将服务成本纳入影响物流服务质量评价中,以此探析顾客满意度与第三方物流之间的关系㊂Kang(2008)等[6]从供应商角度出发,要求企业内部全面提升服务能力质量㊁服务传递质量和服务结果质量㊂从供应商视域出发提升物流服务质量,是通过促进企业内部沟通与协作,从而提升物流服务质量水平的方法㊂随着消费者市场的壮大,供应商视域的质量改进已经逐渐失去应用价值㊂(2)消费者视域㊂Chen(2014)等[7]从消费者视域出发构建物流服务质量的评价体系,从提升物流服务的可靠维度㊁保障维度㊁有形维度㊁同情维度和响应维度来满足消费者需求㊂Kou(2015)等[8]从消费者角度总结出四个维度,并以此研究如何实现电商网购和物流之间的有效协同㊂Zhang(2017)等[9]从消费者视角构建了快递服务的客户体验与期望评价模型㊂Murfield(2017)等[10]为更全面地剖析影响顾客满意度和忠诚度的因素,通过调查零售业物流服务中的顾客感知度,提出从物流可用性㊁物流时效性以及生产的过程性等方面提升消费者满意度㊂物流服务质量评价的研究视角从服务供应商转向消费者,其根本原因是市场状况从 卖方市场 变成 买方市场 ,经营与生产方式由 企业导向型 转变为 消费者导向型 ,因此以消费者视角研究物流服务质量评价更具
有实际应用价值㊂
(二)物流服务质量评价方法
目前物流服务质量评价的主要研究方法有数理统计法㊁模糊层次法和文本分析法等,数理统计法是较为常用的一种方法㊂张卫国(2016)等[11]基于问卷数据,运用数理统计方法对影响京东物流服务质量的因素进行评价㊂Parmata(2016)等[12]以数理统计的方式,借助SERVQUAL模型评价医疗用品的分销物流服务质量㊂Li(2019)[13]借助数理模型构建了B2C逆向物流服务的质量评估体系㊂模糊层次法也是常用的一种方法,Liou(2007)等[14]应用模糊分析法对比国际与伊朗航空物流服务质量㊂Chang(2008)等[15]使用模糊层次分析法解决服务评估过程的不确定性和不准确性㊂常香云和范体军(2008)[16]运用模糊层次分析法对逆向物流处理中心选址优化问题进行研究㊂杨浩雄和王雯(2015)[17]运用模糊层次法构建了第三方物流企业顾客满意度测评体系㊂文本分析法用于物流服务质量评价较少,Huang(2016)等[18]应用文本挖掘分析导致消费者不满的物流服务因素㊂张公让等(2021)[19]基于互联网海量评论文本数据进行情报分析,以此确定影响顾客满意度高低的因素㊂由于本文以网络爬虫所挖掘的文本信息为数据源,即消费者所发表的在线评论,因此在选择研究方法时优先考虑使用文本分析法㊂比较消费者视角和供应商视角的物流服务质量研究,以消费者视角研究物流服务质量评价更具有实际应用价值,这是由市场状况以及企业的生产经营现状决定的㊂分析现有的学术研究成果,数理统计法㊁模糊层次法以及文本分析法都是具有应用价值的研究方法㊂其中,数理统计法和模糊层次法的数据大多源于问
卷及访谈,文本分析法则是通过挖掘海量的在线消费者评论作为数据来源㊂相对于问卷数据,消
76
重庆工商大学学报(社会科学版)第40卷
费者评论数据的获取具有便捷性㊁海量性㊁真实性和客观性㊂因此,以消费者视角研究物流服务质量评价,佐以海量的评论文本数据挖掘影响快递物流服务质量的主体因素,对快递物流企业提高服务质量㊁提升管理水平具有重要意义㊂
三㊁研究设计
(一)样本选择
现有研究的数据大多源于电商平台产品的评论数据或直接选取单个平台的评论数据,电商产品评论数据由于存在大量虚假好评,其评论真实性有待提高[20]㊂顺丰等单个平台评论数据量仅为千条左右,评
论代表性不高㊂由于菜鸟平台的在线评论数据量高达6.5万条,且菜鸟平台覆盖了三通一达㊁顺丰㊁EMS 等我国主流的快递物流企业,所以本文选择菜鸟平台的在线评论作为研究样本,既能确保数据的充分性,也能确保数据的代表性㊂
(二)样本收集
运用Python3.8设置爬虫规则,共计抓取65102条评论数据,数据抓取时间截至2021年5月30日㊂为确保评论数据内容丰富度,运用计算机自动筛选和人工手动筛选相结合的方式,剔除字数少于5的评论㊂与此同时,利用Python和Excel数据分析工具对采集到的65102条评论数据进行文本数据清洗,包括对不规则字符的剔除㊁不规范语气词剔除以及不文明用语剔除等,清洗后数据约为49012条㊂对清洗后的数据进行随机抽样检测,合格率高达90%后进行下一步分析㊂
(三)分析方法
针对所爬取的菜鸟物流企业用户的在线评论,主要对其进行文本分析和情感分析,具体包括:(1)文本语义分析,包括对文本特征词和词频统计的可视化研究;(2)文本网络语义分析,通过文本数据构建出的网络语义图可以分析出文本的特征关联度;(3)LDA主题模型分析,通过主题模型可聚类出影响物流服务质量的主题数目;(4)情感分析,通过对文本数据消极和积极情绪分析可以识别出影响消费者的主题情感倾向㊂
四㊁基于文本语义分析的快递物流服务质量评价
(一)文本特征权重计算
文本特征分析前,运用Python3.8中的内嵌分词板块Jieba对清洗后的文本数据进行分词处理,处理的分词结果转入词袋模型并进行文本特征分析㊂特征权值指的是通过权值大小评估特征项在文本中的重要性的方法㊂本研究运用TF-IDF算法计算文本权值,TF-IDF(Term Frequency Inverse Document Fre-quency)是一种常用的结合词频(TF)和逆文档频率(IDF)计算特征权重的方法[21],其算法公式如下:
TF-IDF=TF∗IDF(1)
TF w=n t w(2) 86
第2期张夏恒,肖林:基于消费者在线评论数据的快递物流服务质量评价研究
IDF=log(N N w+1)(3)其中,n代表某一类词条w出现的次数,t w表示该类中所有的词条数目,N代表语料库中的文档总数,N w 代表包含词条w的文档数目㊂
将TF-IDF算法代码输入Python,提取出高频词及TF-IDF排名前30的特征词㊂通常词频较高的特征词更有利于文本分类,但部分词在文本分析实操过程中对文本分类意义不大,却依旧呈现出高权值的特点㊂因此,TF-IDF方法可以帮助有效甄别具有分类能力的特征词㊂
(二)文本特征分析
在词频统计的排序中, 包裹 和 快递 排在榜前,几乎每条评论都会提及,这与数据抓取来自于菜鸟平台有很大关联,因为菜鸟平台聚合了我国主要的快递企业与快递包裹业务㊂ 方便  隐私  态度  服务  效率  系统  速度  效率 等特征词出现频率很高,说明消费者对物流企业提供服务的便利性㊁私密性㊁时效性㊁礼貌性等问题较为关注㊂从TF-IDF的排序中可以看出, 速度  方便  推广 等特征词具有较高的权重,在文本中具有很高的重要性㊂ 快递  包裹 两个特征词在词频统计中名列前茅,但在TF-IDF统计中排名垫底,说明 快递 及 包裹 是属于 高权值㊁低分类能力 的特征词,对于这类词在进行主题聚类时,可选择性地予以剔除㊂ 价格  及时 等特征词的词频权值较低,但其TF-IDF权值较高,属于 低权值,高分类能力 的特征词,在进行主题聚类时可选择性地予以保留㊂同时,从TF-IDF特征词排序中也可以看出,消费者在选择物流服务企业时会受广告效应㊁明星效应以及价格等因素的影响,具体参见表1㊂
表1 特征词及TF-IDF
序号特征词TF-IDF序号特征词TF-IDF
1方便问题16查询收货
2包裹速度17超级收费
3快递方便18崩溃派送
4隐私推广19
5破坏投诉20学校手机
6寄件错误21时间登录
7态度强制22广告唯一
8服务价格23及时运输
9软件导入24一目了然快递
10效率关联25价格安全
11总的来说朋友26关联顾客
12驿站实用27满意态度
13系统及时28麻烦包裹
14速度寄件29软件效率
15人员软件30隐私服务为更加直观且清晰地分析消费者的关注点,以词云图的形式将特征词可视化㊂在菜鸟平台评论词云
96
重庆工商大学学报(社会科学版)第40卷
图中,消费者评论的核心特征词为:方便㊁隐私㊁包裹㊁效率㊁态度㊁软件㊁服务等㊂从图1可以看出较多的正面特征词:满意㊁实时㊁快捷㊁一目了然㊁五星㊁值得㊁方便㊂可视化图中呈现的正面特征词,体现了消费者对菜鸟物流所提供服务的肯定㊂同时,从图1也可看出较多的负面词:崩溃㊁强制㊁麻烦等,说明消费者对菜鸟平台提供的应用软件评价较低㊂菜鸟应用软件是联系消费者和菜鸟物流企业的重要桥梁,因此优化菜鸟应用软件将会直接影响消费者的体验感和满意度
图1㊀特征词词云
五、基于文本语义网络关联分析的快递物流服务质量评价
通过文本特征分析可以提炼出文本特征词,并看出消费者对快递物流服务所关注的因素,而网络语义分析则可以展现特征词和特征词之间的联系,并直观地看出主要特征词之间的中心节点㊂启用ROOST 分析软件对分词后的文本数据进行社会网络和语义网络分析,依次产生共词矩阵㊁社会网络图等分析结果,相关分析结果如表2及图2所示㊂
表2 共词矩阵
破坏
隐私态度服务效率方便软件 破坏1177
211222170
515245 隐私1177
227
233537244 态度211227741
626341134 服务222233
输入手机号查所有快递
741627
327135 效率170626
627293
118 方便515537341327293360
软件245244134135118360
7