数据分析⽅法论(6种⽅法,8个思路)
数据分析的流程
在介绍数据分析⽅法论和思路之前,我们还是先不厌其烦地看⼀下数据分析的流程,简单来说分为以下六个步骤:
1、明确分析的⽬的,提出问题。只有弄清楚了分析的⽬的是什么,才能准确定位分析因⼦,提出有价值的问题,提供清晰的指引⽅向。
2、数据采集。收集原始数据,数据来源可能是丰富多样的,⼀般有数据库、互联⽹、市场调查等。具体办法可以通过加⼊“埋点”代码,或者使⽤第三⽅的数据统计⼯具。
3、数据清洗。对收集到的原始数据进⾏数据加⼯,主要包括数据清洗、数据分组、数据检索、数据抽取等处理⽅法。
4、数据转换。通过探索式分析检验假设值的形成⽅式,在数据之中发现新的特征,对整个数据集有个全⾯认识,以便后续选择何种分析策略。
5、数据分析。数据整理完毕,就要对数据进⾏综合分析和相关分析,需要对产品、业务、技术等了如指
掌才⾏,常常⽤到分类、聚合等数据挖掘算法。Excel是最简单的数据分析⼯具,专业数据分析⼯具有FineBI、Python等。
6、数据可视化。借助可视化数据,能有效直观地表述想要呈现的信息、观点和建议,⽐如⾦字塔图、矩阵图、漏⽃图、帕累托图等,同时也可以使⽤报告等形式与他⼈交流。
7、撰写分析报告。通过分析得出结论,并给出明确意见。
数据分析⽅法论
数据分析的⽅法论很多,其中六种⽐较常见的理论。
1、PEST分析法
PEST,也就是政治(Politics)、经济(Economy)、社会(Society)、技术(Technology),能从各个⽅⾯把握宏观环境的现状及变化趋势,主要⽤户⾏业分析。
宏观环境⼜称⼀般环境,是指影响⼀切⾏业和企业的各种宏观⼒量。
对宏观环境因素作分析时,由于不同⾏业和企业有其⾃⾝特点和经营需要,分析的具体内容会有差异,但⼀般都应对政治、经济、技术、社会,这四⼤类影响企业的主要外部环境因素进⾏分析。
政治环境:政治体制、经济体制、财政政策、税收政策、产业政策、投资政策等。
社会环境:⼈⼝规模、性别⽐例、年龄结构、⽣活⼒式、购买习惯、城市特点等。
技术环境:折旧和报废速度、技术更新速度、技术传播速度、技术商品化速度等。
经济环境:GDP 及增长率、进出⼝总额及增长率、利率、汇率、通货膨胀率、消费价格指数、居民可⽀配收⼊、失业率、劳动⽣产率等。
2、5W2H分析法
5W2H,即为什么(Why)、什么事(What)、谁(Who)、什么时候(When)、什么地⽅(Where)、如何做(How)、什么价格(How much),主要⽤于⽤户⾏为分析、业务问题专题分析、营销活动等。
该分析⽅法⼜称为七何分析法,是⼀个⾮常简单、⽅便⼜实⽤的⼯具,以⽤户购买⾏为为例:
Why:⽤户为什么要买?产品的吸引点在哪⾥?
What:产品提供的功能是什么?
Who:⽤户体是什么?这个体的特点是什么?
When:购买频次是多少?
Where:产品在哪⾥最受欢迎?在哪⾥卖出去?
How:⽤户怎么购买?购买⽅式什么?怎么做数据分析
How much:⽤户购买的成本是多少?时间成本是多少?
3、SWOT分析法
SWOT分析法也叫态势分析法,S (strengths)是优势、W (weaknesses)是劣势,O (opportunities)是机会、T (threats)是威胁或风险。
SWOT分析法是⽤来确定企业⾃⾝的内部优势、劣势和外部的机会和威胁等,通过调查列举出来,并依照矩阵形式排列,然后⽤系统分析的思想,把各种因素相互匹配起来加以分析。
运⽤这种⽅法,可以对研究对象所处的情景进⾏全⾯、系统、准确的研究,从⽽将公司的战略与公司内部资源、外部环境有机地结合起来。
4、4P营销理论
4P即产品(Product)、价格(Price)、渠道(Place)、推⼴(Promotion),在营销领域,这种以
市场为导向的营销组合理论,被企业应⽤最普遍。
可以说企业的⼀切营销动作都是在围绕着4P理论进⾏,也就是将:产品、价格、渠道、推⼴。通过将四者的结合、协调发展,从⽽提⾼企业的市场份额,达到最终获利的⽬的。
产品:从市场营销的⾓度来看,产品是指能够提供给市场,被⼊们使⽤和消费并满⾜⼈们某种需要的任何东西,包括有形产品、服务、⼈员、组织、观念或它们的组合。
价格:是指顾客购买产品时的价格,包括基本价格、折扣价格、⽀付期限等。影响定价的主要因素有三个:需求、成本与竞争。
渠道:是指产品从⽣产企业流转到⽤户⼿上全过程中所经历的各个环节。
促销:是指企业通过销售⾏为的改变来刺激⽤户消费,以短期的⾏为(⽐如让利、买⼀送⼀,营销现场⽓氛等等)促成消费的增长,吸引其他品牌的⽤户或导致提前消费来促进销售的增长。⼴告、宣传推⼴、⼈员推销、销售促进是⼀个机构促销组合的四⼤要素。
5、逻辑树法
逻辑树⼜称问题树、演绎树或分解树等。它是把⼀个已知问题当成“主⼲”,然后开始考虑这个问题和哪些相关问题有关,也就是“分⽀”。逻辑树能保证解决问题的过程的完整性,它能将⼯作细分为便于操作的任务,确定各部分的优先顺序,明确地把责任落实到个⼈。
逻辑树的使⽤必须遵循以下三个原则:
要素化:把相同的问题总结归纳成要素。
框架化:将各个要素组织成框架。遵守不重不漏的原则。
关联化:框架内的各要素保持必要的相互关系,简单⽽不独⽴。
6、AARRR模型
AARRR模型是所有运营⼈员都要了解的⼀个数据模型,从整个⽤户⽣命周期⼊⼿,包括获取(Acquisition)、激活(Activition)、留存(Retention)、变现(Revenue)和传播(Refer)。
每个环节分别对应⽣命周期的5个重要过程,即从获取⽤户,到提升活跃度,提升留存率,并获取收⼊,直⾄最后形成病毒式传播。
数据分析思路
数据分析⽅法论主要是从宏观⾓度介绍如何进⾏数据分析,它就像是⼀个数据分析的前期规划,搭建⼀个清晰的数据分析框架。那么对于具体的业务场景问题,就要靠具体的分析⽅法来⽀撑了,下⾯⼩编就介绍⼏种常⽤的数据分析思路。
1、趋势分析
最简单、最常见的数据分析⽅法,⼀般⽤于核⼼指标的长期跟踪,⽐如点击率、GMV、活跃⽤户数。可以看出数据有那些趋势上的变化,有没有周期性,有没有拐点等,继⽽分析原因。
2、多维分解
也就是通过不同的维度对于数据进⾏分解,以获取更加精细的数据洞察。举个例⼦,对⽹站维护进⾏数据分析,可以拆分出地区、访问来源、设备、浏览器等等维度。
3、⽤户分
针对符合某种特定⾏为或背景信息的⽤户,进⾏特定的优化和分析,将多维度和多指标作为分条件,有针对性地优化供应链,提升供应链稳定性。
4、漏⽃分析
按照已知的转化路径,借助漏⽃模型分析总体和每⼀步的转化情况。例如将漏⽃图⽤于⽹站关键路径的转化率分析,不仅能显⽰⽤户的最终转化率,同时还可以展⽰每⼀节点的转化率。
5、留存分析
留存分析是⼀种⽤来分析⽤户参与情况/活跃程度的分析模型,考察进⾏初始⾏为的⽤户中,有多少⼈会进⾏后续⾏为。衡量留存的常见指标有次⽇留存率、7⽇留存率、30⽇留存率等。
6、A/B 测试
A/B测试是为了达到⼀个⽬标,采取了两套⽅案,通过实验观察两组⽅案的数据效果,判断两组⽅案的好坏,需要选择合理的分组样本、监测数据指标、事后数据分析和不同⽅案评估。
7、对⽐分析
分为横向对⽐(跟⾃⼰⽐)和纵向对⽐(跟别⼈⽐),常见的对⽐应⽤有A/B test,A/B test的关键就是保证两组中只有⼀个单⼀变量,其他条件保持⼀致。
8、交叉分析
交叉分析法就是将对⽐分析从多个维度进⾏交叉展现,进⾏多⾓度的结合分析,从中发现最为相关的维度来探索数据变化的原因。