怎么做数据分析
一、看趋势
顾名思义就是追踪数据的趋势变化,到一些增长或者下降的拐点,然后去分析对应的原因,适用于一些指标的长期追踪或者衡量一些关键动作有无效果。
比如产品的核心指标是GMV,那肯定就需要定期关注增长的趋势是否正常,是否符合预期,在追踪的时候,自然而然就需要对比着来分析。
二、看对比
光看趋势不一定靠谱,因为某些指标是一直增长的,比如注册用户数,这个数据肯定是一直在增加,除非没有新用户进来了。
另外没有对比就没有伤害,比如你的增长速率是每年50%,觉得已经很不错了,也许你的竞争对手正在以每年500%的速率进行增长…
所以,通常情况下,数据会对比着来看,一方面是纵向比较,即自身和自身进行对比,另一
方面是横向比较,即自身和别人进行对比。
纵向对比通常包括环比、同比。
环比就是本期统计数据与上期比较,比如拿2018年9月份的数据和2018年8月份的数据进行对比;
同比指的是本期统计数据和上一周期的同期数据进行比较,比如拿2018年9月份的数据和2017年9月份的数据进行对比。
通常情况下,我们在进行数据分析的时候大都会用本周的数据和上周的进行对比,或者用本月的数据和上个月的进行对比,然后控制不同的变量进行分析…
这里面需要关注一些周期性的波动,比如某些产品会有明显的周末效应。以我们的产品为例,DAU基本上是周一最低,周二周三持续低迷,周四小幅回血,周五下降,周六周日达到巅峰,然后持续循环…
之前有个其他部门的同事问我做了什么,为什么昨天的数据涨的很厉害,我翻了下,发现
是周四,就告诉他和上周同期的数据对比下,然后把这个周期拉长一些,以周为单位再看下。
按照经验来看,大多数APP在小长假期间数据都会下跌,特别是春节这种节日,下降的会非常厉害。
遇到这种情况先不要方,先看看有没有新发版本,确认下埋点是否有异常,再看看是否处在节日影响范围内,和其它同周期的数据对比看下,之后再其他原因。
横向对比通常包括行业竞品,全站数据,测试AB组等。
和竞品对比,主要是为了了解我们目前做的怎么样,业界的领先水平是怎样的,虽然这部分数据很难获得。
全站数据通常指的是大盘数据,有可能你负责某个功能模块的时候发现数据涨了,最后绞尽脑汁也没分析出来原因。然后回头一看,哦,原来是整体的数据涨了,顺带着躺赢了一把…
测试AB组指的就是实验组和对照组了,控制不同的变量对比分析不同的结果。
三、看细分
通常情况下用的最多的就是数据细分,不仅能够追溯到问题发生的原因,还能为后续的一些动作提供参考依据。
本部分主要分为维度和度量、拆数据、拆用户和拆因子这几部分。维度和度量主要是概念说明,后面几部分则是具体如何看细分数据。
怎么做数据分析四、维度和度量
很多时候数据分析都是通过不同的维度和度量进行交叉对比分析,到一些可能的原因,然后再去验证猜想。
维度,指的就是分析数据的角度,比如城市、时间、浏览器、新老用户、操作系统、终端等。
度量,指的就是具体的数据值,比如UV、PV、转化率、跳出率等。
通常情况下,单独的数据值只能传递整体的概况,细分查看需要结合着维度。
比如整体DAU可能是在逐渐上升的,同时老用户的留存可能却是在下降的,如果我们只是看度量的话,有可能就被蒙蔽掉。
通常情况度量需要结合着具体业务来看,比如以一款内容型产品为例,用户最核心的路径是浏览内容》产生互动行为。
那需要关注的度量就是人均浏览时长、人均浏览条数、使用频次、点赞、评论、转发等互动行为。
在此基础上,再结合着新老用户、男女用户、年龄分布、地域分布、终端分布、行为差异等维度再来进行更细致的分析。
五、拆数据
这部分就是基于数据本身来做一些拆解,可以分为单指标和多指标两种形式。
单指标主要是衡量功能本身的表现情况,比如说:
∙功能本身的深度:使用频次、使用时长、分布情况等;
∙功能本身的广度:使用人数、DAU%等;
∙功能本身的留存度:留存率;
∙功能本身的转化率:各环节转化率。
多指标主要是对其它关联指标的贡献,比如对目标值的贡献度,如留存率,转化率、相关性等,比如新用户阅读了X篇文章,留存下来的可能性会增加多少。
六、拆用户
主要是针对用户本身进行分,再结合着数据指标进行交叉对比,通常情况下可以按照用户的静态属性和动态属性进行拆分。
静态属性主要指新老用户、版本、终端、地域、操作系统、渠道等。
动态属性主要指用户的行为,比如按照用户的点击次数,用户购买商品的客单价,或者某个行为路径的操作步骤来进行分。
结合着分析的目标,把数据和用户拆分之后,应该就能得到一些思路了,然后再继续分解和交叉对比,直到到一些结论。
七、拆因子
这部分主要指的是一种思考方式,尽量先把目标值抽象成一个具体的公式,然后再按照因子去拆解。
比如上司来你说我们这段时间DAU下降了,你去分析分析是什么原因造成的。
那首先我们可以考虑一下DAU相关的部分都有什么,可以用这样一个公式来进行概括:
∙DAU=新增用户数+活跃用户数+回流用户数
先排除一下数据异常、周期性波动,再结合着这个公式来看下各因子的细分情况。
首先看下各部分的构成变化,是新用户下降,还是活跃用户下降,还是回流用户下降。
如果是新用户数下降,那就去看看最近一段时间新增的用户数有没有变化,是数量下降,
还是质量下降,按照渠道和日期来拆解每天的新增数量,然后再拆解各渠道的留存率看看。
如果是活跃用户数下降,就按照新老用户的留存率对比分析看下,是新用户留下来的少了,还是老用户留下来的少了。前者就在新用户激活的路径上原因,后者就在最近新上的功能上原因。
如果是回流用户数下降,按照回流的渠道拆解一下,看推送、短信召回、活动召回等形式带回来的用户数有没有变化,然后再结合着具体的变化继续对应的原因。
最后结合着分析出来的原因,产出初步的结论,后续做一些对应的动作进行干预,观察对应的数据指标变化。
发布评论