相关性分析
白旭晨\周宇珂2
(1.武汉大学新闻与传播学院湖北武汉430000;
2.北京大学工学院北京100000 )
摘要:近年来,网络自制剧产业快速发展,点击量过百 亿的现象级网剧层出不穷。在数量繁荣之下如何推动网络自制 剧产业健康良性发展,在获得经济效益的同时增大社会效益,需要基于数据驱动挖掘传播学内在机理,把握好网络传播规 律。本研究以2011年至2018年上线的网络自制剧作为研究对 象,通过海量数据分析要素的量化效果,利用BP神经网络模 型和Pearson相关系数方法,论证网络自制剧传播效果的影响 要素,完善网络自制剧的理论建设。
关键词:网络自制剧 传播效果 点击量 评分
随着互联网的发展,人们的生活方式也随之发生了巨大 的转变,特别是移动终端和5G技术的出现,使得人们可以更 好地利用碎片化的时间丰富自己的娱乐生活。网络自制剧也 因为其内容多元、观看时空自由
等优势更加能够迎合受众需 求,越来越获得青睐。随着我国网民的增多,目前电视观众 与网民呈现一定的分化趋势,即网民看电视越来越少,电视 观众不断向网民分流111。近年来,网络自制剧在影视传播中的 地位愈发重要,对我国视频行业发展方向的影响日益显著,在经历了 “先台后网”"网台同播”后,视频网站和影视公司 联合制作网络自制剧,再输出给电视台,形成"先上网再上 星”的现象121,与电视剧形成了有力竞争。在这样的背景下,网络自制剧如何能够获得更好的传播效果和竞争力变得更加 重要。基于互联网传播的技术特征,我们可以基于海量数据 挖掘,运用信息技术对影响网络S制剧传播的关键要素进行 分析,从而精准预测其传播效果。
点击量和评分是评估网络自制剧传播效果的重要指标,点击量准确反映了信息接收的网络用户规模,评分则量化反 映了用户的信息接受状态,作为一个行为指标和一个心理指 标131,从"使用”和‘‘满足"两个维度反映了网络自制剧在受 众中产生的影响。通过大数据和人工智能技术,到网络自 制剧点击量和评分的影响因素,就可以实现传播效果的精准 预测,进一步引导网络剧的积极建设与发展。
一、网络自制剧传播效果的影响要素
借鉴王金辉、白敬璇构建的网络剧价值评估体系141,从 创意阶段、播出阶段、营销阶段着手选取了各阶段与点击量 和评分密切相关的影响因素,为了便于研究分析它们与网络 自制剧点击量、评分间可能存在的关系,本研究提出影响因素的指标体系及交互影响的量化方法。
创意阶段指标包括演员百度指数、类型指数、是否丨P改 编。演员本身自带一定的影响力和话题度,直接影响到网络 自制剧的传播,其粉丝团体作为目标受众体的组成部分,对点击量和评分可能做出正向贡献。百度将每位演员作为一 个主题,把与其相关的主题词汇总再综合计算捜索数量,得 到该演员总体的百度指数151。这_指数体现了网民对演员及 其相关信息的搜索量,反映了演员的知名度和人气,可作为 衡量演员影响力的指标。由于同一部网络自制剧有多个主 演,我们可通过四位主要演员的平均百度指数,量化得到网 络自制剧的演员百度指数。不同类型的网剧有着不同的受众 体,也有着不同的观众喜爱度。随着网络自制剧的发展,受众的需求越来越清楚,类型化会越来越明显,针对性会越 来越强161。本研究参考豆瓣网对网络自制剧进行分类,并将 类型影响力的量化指标定义为属于该类型的网络自制剧点 击量的平均值。每个网络自制剧都可能同时具有多个类型属 性,可通过对其所属所有类型的影响力指标进行平均,获得 该剧的类型指数。知名的IP往往在网络上拥有相当规模的忠 实受众,他们会选择观看由该IP改编的网络自制剧并展开讨 论,在贡献点击量的同时,无形中为网络自制剧进行了宣传,因此IP改编的剧本有很好的受众引流作用171。
播出阶段指标包括播出平台指数、集数。播出平台作为 传播渠道,对传播过程和效果具有重要的影响。不同播出 平台所拥有的用户数量及会员数有所差异,因此播出平台可 能会对网络自制剧的传播产生影响。特别是为了吸引更多用 户,增强用户黏性,从而获得更多经济收益,网络视频平台往 往会选择对网络自制剧进行全网独播。我们将同一网络视频 平台上所有网剧的平均点击置作为其平台指数。网络自
制剧 集数是其首播周期的一个重要指标,对其网络热度持续时 间、受众观看的时间成本等造成直接影响,而集数和艺术效 果的相关性对点击量和评分也会产生相关性。
营销阶段指标包括网络自制剧百度指数、媒体报道数、评分人数、短评数,反映网络自制剧的推广水平及反馈水平。网络自制剧的百度指数可以一定程度上体现出它的热度。开 播初期,其百度指数会急剧上升,常会出现整个剧播出期间 的最高百度指数,以2016年7月4日上映的<;老九门》为例,由于前期宣传充分,仅在其播出第二日就达到了整部剧百度 指数的最高值,这说明网络自制剧初期的百度指数峰值确实
系南持椿观1年第4期(总第2〇〇期
)
r
I紧盯前沿理论透析传播实践
DOIMGNAN CHUANBO传腿究-新媒介研究的
可以认为是整个时期内百度指数的峰值。有的剧一开始并不 是那么知名,如2015年12月13日于乐视首播的现象级网络 自制剧《太子妃升职记》,初期逐渐积累口碑,以相对较慢的 速度达到百度指数的高峰,之后其百度指数随着剧情发展波 动,出现了多个峰值,但后期的百度指数峰值也只是达到与 初期峰值齐平的程度,初期的百度指数峰值约等于全时期 内百度指数的峰值。经过统计分析,我们发现网剧初期最高 百度指数基本可代表全周期的最高百度指数,因此将开播初 期的百度指数峰值作为网络自制剧百度指数。评分人数、短 评数即参与网络互动的受众规模,其数量多少直接反映了该 网络自制剧的受众关注度,研究选取了较为有代表性和可靠 性的豆瓣网作为网络评分、评分人数及短评数的数据来源。
二、基于人工神经网络横型的影响要索贡献验证
人工神经网络是受生物学启发,从结构、实现机理和功 能上模拟生物神经网络,它可以模仿生物的学习
特性,并通 过学习实现适应性,即通过调整修正神经网络的连接权值,从而获得最接近现实的系统行为。人们通过不断提出不同的 学习规则和算法,实现对不同网络模型的适应。B P神经网 络是一种按照误差反向传播算法训练的多层前馈神经网络,网络包括输入层、隐藏层及输出层,它良好适用非线性函数 拟合,能够处理尚没有明确数学模型的系统的特征提取和预 测问题|81。网络传播过程的复杂性,使得网络自制剧传播效 果及其影响因素间必然为非线性关系,不能通过线性模型将 数据的全部特征充分反映出来,因此选取B P神经网络从较 高的维度,充分地抽象、提取数据内在的特征。
本研究选取2011年至2018年播出的445部网络自制剧 为样本,在对各影响要素进行量化和对数归一化处理的基础 上,尝试以各影响要素为变量构建B P神经网络模型,观察数 据特征,以探究各要素对点击量和评分有所是否存在影响。神经网络的学习能力同隐藏层的层数及各隐藏层上的节点数 有着密切的关系。增加隐藏层数量,往往可以促使神经网络 更好地抽象数据的特征,降低网络训练的误差,提高精度,但是反过来也会增大计算量和训练的时间,对计算资源提出 更高的要求。类似的,适当选择隐藏层上的节点数,也可以在 控制计算时间的同时提高训练精度。本次训练中,考虑到网 络自制剧传播效果影响因素的复杂性,采用两个隐藏层更好 地提取数据特征,以实现影响因素的量化关系建模,达到更 好的预测效果。
图1网络自制剧点击量影响因素指标拟合效果
构建基于B P神经网络模型的网络自制剧点击量测算模 型,通过对互联网上可获取的网络自制剧百度指数、演员百 度指数、媒体报道数、类型、播出平台、集数、是否IP改编 等要素作为输入层的7个神经元,输出值为网络自制剧点击 量,试验发现,两个隐藏层均放置18个节点时神经网络的表 现较好,收敛速度较快。通过对比网络自制剧点击量的真实 值和训练后的神经网络通过7个神经元获得的测算值,实现 了如图1显示的非常好的拟合效果。说明训练后的神经网络 体现了数据特征,即通过7个要素形成的数字集合与点击量 之间存在着内在的紧密联系,而每个要素均对网络自制剧点 击量形成了正向贡献,它们的数据变化都将带来点击量的变 化。因而可以认为选取这些因素是合理的。
构建基于B P神经网络模型的网络自制剧评分测算模 型,以网络自制剧百度指数、演员百度指数、媒体报道数、类 型、播出平台、集数、丨P改编、评分人数、短评数、点击量等 10个要素作为输入层的神经元,输出值为网络自制剧评分,试验发现,两个隐藏层均放置15个节点时收敛速度较为合 适,且满足精度要求。通过对比评分的真实值和训练后的神 经网络通过10个神经元获得的测算值,获得了如图2显示的 非常好的拟合效果,同样也证明了上述10个要素对网络自制 剧的豆瓣评分有_定的影响。
co-'
图2网络自制剧评分影响因素指标拟合效果
三、点击置与影响要索相关性分析
上述基于B P神经网络模型验证了网络自制剧构成要素 和点击量及评分之间的影响关系。为定量化地分析网络自制 剧各构成要素同点击量及评分之间的关系,本研究进一步采 用Pearson相关系数得到更精确的量化相关性分析。
Pearson相关系数是统计学中用于研究2个变量之间线 性关系最常用的一种相关系数。本研究利用SPSS软件,采 用Pearson相关系数法对各网络自制剧传播效果的影响要素 同点击量及评分间的相关关系进行了分析,得到表1相关系 数和显著性检验结果。
网络自制剧的点击量同网络自制剧百度指数、演员百度 指数、媒体报道数、类型指数、集数都有较好的相关性。其 中,网络S制剧百度指数和演员百度指数对于点击量的作用
2〇21年第4期(总第2〇〇期)|系态#
播
最为明显。
创意阶段指标播出阶段指标营销阶段指标
演员百度指数类型指数I P改编播出平台集数网络自
制剧百
度指数
媒体报
道数
r.507*.370".284**.202".374**•685".391"
表1网络自制剧点击量与要素之间的相关性分析结果
注:r为P e a r so n相关系数;**.在0.01水平(双侧)上显著相关;
*在0.05水平(双侧)上显著相关。
营销阶段指标与网剧点击量呈现相对更加紧密的正相 关,其中网络自制剧百度指数与点击量的正相关性最强,Pearson相关系数达到0.685。网络自制剧百度指数和媒体 报道数反映了网剧的热度,与点击量是互为因果的关系。从 网络自制剧被受众知晓、关注到选择使用,其结构必定符合 金字塔理论。加大网剧的宣传投入和力度,扩大受众的知悉 范围,吸引受众“眼球”,是获得更好点击量的基础,也是网 剧营销的主要目的。特别是我们基于观察网络自制剧的百度 指数变化发现,其播放初期的百度指数即为峰值,也就是我 们量化选取的数值,这进一步说明了初期宣传效果对点击量 具有重要意义。同时,随着网剧点击量的增加,其热度必然 上升,必然带来更多的网络注意力,从而获得更多用户的信 息选择和信息再生产。相应的直接反应就是提升了网络自制 剧的媒体报道数,保持百度指数在相当水平。特别当一部网 络自制剧成为现象级的网剧,收获大量讨论度时,媒体也会 追逐热点,进行报道。网剧热度与点击量相互促进,形成良 性循环,可以使网络自制剧的传播达到更好的效果。
创意阶段指标与网剧点击量也呈现出正相关,其中演员 百度指数同点击量表现为较强的正相关性,Pearson相关系 数为0.507。网络自制剧创作质量是影响其得到受众注意力 的重要因素,类型、丨P和演员构成直接影响到目标受众体 规模,而研究发现,演员成为获取点击量的一个关键因素。高热度演员往往自带粉丝基础和可观的点击量,特别是在当 前“注意力经济”背景下,流量明星就是点击量的基本保证。从这个研究结果看,就可以解释在网络自制剧播出前炒作明 星的行为,就是通过提升演员的热度来达到受众对其近期 作品的关注,达到营销效果。同时,网络自制剧的走红同样 可以成就演员的知名度,比如肖战因出演 <;陈情令》走红,潘 粤明因出演(白夜追凶〉翻红。网络自制剧的类型和丨P改编 也与点击量成正相关,但是起相关性较演员略差。网剧类型 和IP也有各自的受众体,这决定了其与点击量的必然相关 性。网剧可以通过与同类型剧的关联获得该类型受众的关 注,特别是在网络推荐算法的作用下直接建立传播关系。而 IP改编作品能够激起人们检验改编质量的想法,尤其是原IP 的粉丝体,他们往往会想要验证人物、情节等是否符合他 们的预期,这一心态吸引他们观看网络自制剧,并积极地参 与讨论,从而提高了网络自制剧的话题度与知名度,促进点 击量提升191。
相比于创意阶段和营销阶段,虽然播出阶段指数与点击 量保持了一定的正相关,但其影响作用相对较小。作为传播 渠道,网络视频平台有其固定的用户体,可以为点击量提 供_定得保证,但是互联网获取信息方式的多样性,当受众对网剧产生关注或主动选择的时候,即使与视频平台没有关 联或者黏性较低,依然可以通过搜索引擎、算法推送、关联 链接等方式进行观看,特别是当该网剧热度较高时,平台
自 身影响就变得更加微弱了,反而是平台通过网剧获得更多受 众关注,进而增加自身影响力,提升用户黏性。剧集的影响 虽然看上去相关性更高,但是其主要是提供线性的点击量增 长,也就是说对于相同的用户消费规模而言,集数越多获得 点击量越大的概率更大。
四、评分与影响要素相关性分析
进一步通过分析得到表2结果体现网络自制剧的评分同 评分人数、短评数和集数有相对较好的相关性,研究涉及的 其他要素相关性较差。评分人数和短评数呈现正相关状态,而集数呈现负相关状态。特别是网剧的点击量与评分的相关 性并不强。
创意阶段指标播出阶段指标营销阶段指标
点击
置演员百
度指数
类型
IP改
编
播出
平台
集数
网络
自制
剧百
度指
数
媒体
报道
数
评分
人数
短评
数
R• 144**• 117.'136.0.008.213”-.112.• 141.•233**.130*
表2网络自制剧构成要素与评分之间的相关性分析结果
注:r为P e a r so n相关系数;★*.在0.01水平(双侧)上显著相关;*.
在0.05水平(双侧)上显著相关。
点击量和评分作为评价网络自制剧传播效果的两个维 度,呈现较弱的相关性,Pearson相关系数为-0.130,这 表明高热度未必代表高□碑,受众"使用”并不一定会“满 足"。一些网剧由于较好的营销效果、使用流量明星等方式 获取了较高的点击量,但是由于质量相对不高或与受众预期 相差较大,导致
评分不高。这也反映出对网络自制剧评估要 兼顾多个因素,不能够只从点击量等角度评价,还要考虑观 众的满意度。比如制作方想要出品续集时,不能够一味关注 点击量,还要参考原作的□碑,以免出现续集无人问津的情 况。(假凤虚凰》第一季点击量达到1.6亿,实际上豆瓣评分 仅为5.9分,到了第二季点击量就仅有6千万。同时,也有一 些小众的网络自制剧,虽然会有较高的艺术水准,但是由于 目标受众体较小,仍然会出现“叫好不叫座”的现象。我们 也要关注到,随着近年来网剧质量的提升,高点击量高评分 的网剧数量也在明显提升,而这种相关性的变化,也将从一 个方面说明网络生态在不断发生着变化。
营销阶段指数与网络自制剧评分的相关度相对更高,特别是评分人数、短评数呈现了较好的正相关,主要原因在 于受众的信息再生产动机,当受众在对网剧的信息消费过 程中,当其对该剧持或价值不认同时,首先的行为 是中止对该剧的消费行为,为其成本投入及时止损,而将注 意力转向其他信息,相比于在消费过程中持正面评价或价 值共鸣进行信息再生产的概率较低,也就是说当网剧质童 越高,越能够获得受众认同时,才会出现“一片叫好声’’,而 质量较差不能获得受众认同时,更多的是弃剧和无人问津。因此高质量必然带来高参与和高热度,反正则不然,高热度 并不一定代表高质量,网络自制剧百度指数、媒体报道数与 评分呈一定的负相关性,Pearson相关系数分别为-0.112
系忐#播• 2〇2!年第4期(总第2〇〇期)
r
11 紧盯前沿理论透析传播实践
、
潘鄂明DONGNAN CHUANBO 传臓-繼研究
U
和-0.141,这表明有的作品尽管收获了较高的关注度,有大 量受众进行相关搜索或是进行信息消费,却并没有足够高的 质量来支撑这种关注度,不能够真正让观众满意,带来一种 盛名之下其实难副的失望感。此外随着媒体报道数量的增 长,评分可能会有微弱的下降,说明书过度宣传可能造成受 众过高的期待,特别是部分媒体报道是剧组宣传的产物,不 能客观反映网剧真实的质量,以至于实际观看后产生失望的 情绪,给出相对消极的反馈。过多的媒体报道本身也会令人 审美疲劳,引起观众的厌烦情绪和逆反心理。
创意阶段指数应该与网络自制剧评分呈现较强的正相 关性,但是由于网剧质量和艺术水平较难进行量化,因此研 究中测算的演员百度指数、类型指数和IP 改编情况与评分相 关性不强,且呈现一定的负相关性,在B P 神经网络模型中, 已经发现了这些要素对评分的负面贡献,Pearson 相关系数 的结果更是精确而直观地反映出了这些数据之间的关系。究 其原因,主要是由于前期网剧传播更关注的是点击量带
来的 经济效益,更多选择流量明星担任主演,虽然有些流量明星 自带粉丝基础和高话题度,自身演技却不够出彩,在剧中的 表演引起观众的尴尬,最终拉低整部剧的评分。因此为了提 升网络自制剧的口碑,在选择演员的同时,可能不能一味关 注流量,还要考虑演员本身的适配性,保证网络自制剧的质 量。同样,IP 改编对评分呈现的负面作用,也与早期部分IP 改编剧所表现出的低质量有关。一些网络自制剧过于依赖所 改编自的IP ,缺乏创新性,_味依靠原IP 的粉丝资源,失去了 自己的核心竞争力,对于IP 的盲目争夺使得整个市场处于较 为混乱的状态,因而IP 改编剧的质量往往不能得到很好的 保证IU )I 。此外,购买知名IP 往往要花费大量资金,可能导致 服化道及后期等重要部分的资金短缺,最终使得网络自制剧 质量不理想mi 。确实有很多成功的IP 改编网络自制剧收获了 高点击量与高评分,可与此同时,也有很多低质量的IP 改编 剧被跟风制作出来,导致整体上IP 改编剧可能不能收获良好 □碑。类型对评分带来一定的负面影响,是对于类型的衡量 指标采用了相应类型的点击量,而高点击量类型中有很大一 部分是爱情片,由于其制作时考虑的受众需求,它们常常表 现出高点击量低评分的特征|121。
播出阶段指数与网络自制剧评分的相关性同样较弱,并 呈现一定的负相关性。特别是集数对评分带来较强的负面效 应。说明随着集数的增加,势必带来情节拖沓,导致受众的 反感。很多网剧更加关注播放初期的传播效果,吸引更多受 众并获得较高评价,从而获得更高的注意力和点击量,而对 后期质量关注不够,虎头蛇尾。至于播放平台与评分相关性 最差,也就是说平台自身口碑和用户黏性并无法保证网剧一 定受到受众的认同和喜爱。
总体看来,评分与网络自制剧传播效果各影响要素间的 相关性没有点击置同各要素间相关性那么显著。一方面是由 于评分与各因素不能简单地用线性模型描述,另_方面,恰 恰反映出区别于点击量,评分是相对主观的一个因素,受到 个体的影响较大,没有一个客观标准,艺术价值相对难以量 化。不同的受众体,对一部网剧的评价可能会表现出显著 的差异性。因此,对网络自制剧的评估在参考点击量这一直 观数据的同时,还要考虑□碑质量,综合考虑基于文本数据 的情节信息提取、画面内涵挖掘、价值导向评论等多种因素 以提高评价的准确性。
五、结语
点击量反映了受众的"使用”规模,信息行为产生的流量 为网剧产业带来'‘注意力资源"的直接经济回报;评分反映 了用户的‘'满意"程度,信息行为选择的流向为网剧产业带来‘'社会影响力_’引发的间接经济价值和社会效益。从量化研 究的结果看,加大前期宣传、使用流量明星、改编网红IP 等 宣发策略可以在初期推高点击量获得短期经济效益。但是, 受众的消费选择不等同于文化认同,作品本身的质量才是网 络自制剧获得观众青睐的决定性因素,过多的非质量要素操 作反而会造成受众的心理抗拒导致社会影响消解和经济效 益削弱。质量提升是增强网络自制剧长远发展的核心竞争 力,只有通过“提质"实现"增量",才能在获得更多受众认 可的基础上实现网剧产业的社会影响,从而转化为稳健可持 续的经济效益。
同时,运用大数据和人工智能技术建立模型分析预测, 通过基于数据的影响因素解析与基于场景的传播决策分析, 可以进一步优化网络自制剧产业发展的变量调整,实现网络 效应文化传播的实时感知,决策网络文化建设的量化投入, 获得经济与社会效应最大化平衡。
m 喻国明,李彪.收视率全效指标评估体系研究——以电视剧为例[J ].现代传播-中国传媒大学学报,2009 (04) : 36-38+55.【2]秦然然,李皎.从网络自制剧网台联动看视频制作行业的未来走向U ].黄山学院学报,2017, 19(04〉: 84-88.
[3J 段鹏.收视率与满意度的博弈一刍议电视节目传播影响力与收视率、满意度的关系[J ].现代传播(中国传媒大学学报),2007(06): 85-87.[4] 王锦慧,白敬破.基于IP 视角下的网络剧价值评估影响因素研究[J ].中国海洋大学学报(社会科学版),2016(05):87-95.
[5] 百度指数[OL ].http : z 7index .baidu /.
[6j 白洁.中国大陆网络剧的类型划分及特征研究[D ].山西师范大学,2019.
[7] 付晓岚.大IP 、弹幕如何助力网络剧[J ].上海艺术评论,2016(02) : 81-82.
[8] 侯瑞人工神经网络BP 算法简介及应用[J ].科技信息,2011(03) : 75+418.[91陈功,赵青林.网络自制剧的传播特征分析[J ].当代传播,2014(06) : 101-103+106.
[10] 赵欢.IP 影视剧现存问题与对策研究[D ].河北经贸大学,2018.
[11] 郭婧.网络剧的“IP ”现状研究[J 1.西部广播电视,2019(12) : 84-85.[12】郝丹青.网络自制剧的形态及其传播研究[D ].南京师范大学,2019.作者简介:
白旭晨武汉大学新闻与传播学院博士研究生;周宇珂北京大学工学院本科生。
【责任编辑:肖玉平】
2〇2丨年第4期(总第200期)|系卷#播
发布评论