9种⽅法,化繁为简。
1 对⽐分析
⼀个数据本⾝是没有任何意义的,只有在把它和其他数据放在某个场景下做对⽐,我们才能真正发现它的意义。
我以前在汽车⾏业,公司每年的销售增长率在20%上下。这个增速到底⾼还是低?跟的发展相⽐当然是偏低,但是如果你考虑到我们公司所在⾏业年增长率也就10~15%,那20%就是⼀个相当不错的成绩了。
再举个例,现在接近年底了,负责薪酬的HR都在做⾃⼰公司下⼀年⼯资增长幅度的预测,这个时候你也需要把⾃⼰的数据去和⾏业相对⽐,⽽不是单看⾃⼰公司期望⽐例,这样才知道⾃⼰处于市场的什么地位。
⼀般来说,对⽐有两种,⼀种是时间上的,另⼀种是空间上的。
时间上的对⽐⼜分两种:本⽉的数据和上⽉相⽐,叫环⽐;本⽉的数据与去年同期相⽐,叫同⽐。空间
上的对⽐也分两种,⼀种是和外部⽐较,⼀种是内部部门之间互相⽐较,拿⾃⼰公司离职率去和⾏业离职率做对⽐,属于前者;各部门之间的离职率对⽐,属于后者。
当⼿上有了数据,⾸先想到的能够拿它去和哪些数据做对⽐。正是在这种不断的反复对⽐之下,数据才会凸显出⾃⼰所蕴藏的意义。
2
做数据分析的⽬的是为了透过现象看本质,并进⼀步提出问题的解决⽅案。
怎么做数据分析细分分析帮助我们把数据分解到颗粒度更⼩的维度,从⽽更容易看清事情的本质。假如公司的年离职率达到了10%,超过⾏业5个百分点。现在想分析这10%的⾼离职率究竟是如何造成的,我们可以将数据进⾏各种细分,细分维度可以包括离职原因、绩效、司龄、年龄、部门、薪酬、级别、籍贯,等等。
再举个例,在招聘中,我们经常需要分析招聘⼯作的效率。我们可以根据候选⼈的数据来划分为渠道、费⽤、年龄、学历、周期等等不同维度进⾏细分。
有⼀家处于快速成长期的公司,每年有⼤量的招聘。为了确保招聘流程的⾼效,HR把招聘流程分解为10个关键节点,然后依次统计每个候选⼈在各节点之间所花费的时间,从⽽可以迅速发现流程中的症
结,便于及时采取⾏动,提⾼效率。
3 交叉分析
做细分分析的时候,每次只能看到数据的⼀个维度。⽐如做离职分析时,选择离职原因,就只能看到每个员⼯的离职原因;选择绩效就只能看到每个离职员⼯的绩效。
如果我们希望把不同的维度结合起来⽐较,⽐如:⾼绩效的员⼯⼀般都是因为什么原因⽽离职的,此时就需要⽤到交叉分析。
Excel表格上的原始数据⼀般都是按照单⼀维度来呈现的,“数据透视表”这个功能就可以很好地帮助我们实现交叉分析功能。有⼈曾经夸张地说,Excel的核⼼功能⽆⾮只有两个:⼀个是V-lookup,另⼀个就是数据透视表。对数据透视表不太熟悉的同学,可⾃⾏百度。
4
如果数据是来⾃不同的时间段,此时通常要做的是趋势分析。你也可以把趋势分析理解为时间维度下的对⽐分析。
昨天,美国的财经电视台CNBC发了⼏张图表来总结中国⾃建国以来70年所取得的经济成就,⾥⾯主要使⽤的就是趋势分析。其中⼀张图表分析的是中国进出⼝贸易总额所占GDP⽐例的情况:
通过这张图,我们不难看出:进出⼝贸易在中国经济总量占⽐中⼀直呈现上升趋势,在2007年前后达到峰值,占GDP的64.48%。之后,该⽐例有所下降,⽬前占GDP的40%左右,这从另⼀⽅⾯也说明我国的经济结构更趋合理。
再⽐如,下图是某公司按岗位类别划分的招聘天数的变化趋势:
从中可看出:客服类岗位的招聘天数下降明显,⽽运营和销售类岗位的天数都呈上升趋势,其中销售类的趋势尤为明显。从HR的⾓度来分析,我们就需要重点关⼼销售类岗位,解决其耗时上升的问题。
5 模式分析
模式分析和趋势分析类似,也是看数据的变化趋势或形态,所不同的是这⾥没有时间维度。
下图是某公司给⼀名员⼯做的360度考评得分表。左边是对员⼯进⾏考核的各个维度,右边的彩⾊线条代表各个不同同事的打分。打分靠左意味着分数偏低,靠右意味着分数偏⾼:
从这张图表中,我们不难看出打分结果数据整体呈现出的⼀种模式:在“创新”和“选拔与发展他⼈”这两个维度,⼏乎所有的打分者都认为该员⼯在此项能⼒上表现偏低(和其他能⼒相⽐),⽽在“诚实正直”这个维度上,⼏乎所有⼈都认为该员⼯表现偏⾼。
因此,如果从该员⼯的⾓度来分析这份报告的结果,也许可以忽略每个打分者的具体打分结果,但他明显需要重视那些所有⼈都给出低分的维度,⽐如“创新”。
6 假设分析
⾕歌在其著名的六步数据分析模型中把第⼀步定义为“观点或假设”。
什么是观点或假设?就是⼈们对某件事物形成的⼀种意见,它是与事实相对⽴的。我们在做数据分析前,收到别⼈的意见时应该先把它当作观点或假设来对待,⽽不是当作事实。
举个例⼦,业务经理告诉你说员⼯⼯资过低,需要加薪挽留员⼯。如果你把这件事当作事实,就会开始琢磨公司还能拿出多少预算、需要把这笔预算花到哪些⼈⾝上才能更好地挽留员⼯。
但是,假如我们⾸先把这个当成⼀个观点或假设,接下来⼀步正确的做法就应该是收集与这个观点相关的数据和指标,再进⾏分析,最终通过分析结果来印证或推倒推到该观点,并提出后续⾏动⽅案。
因此,在前述案例中,尽管业务经理的观点是希望加薪,但是最终通过分析会发现导致员⼯离职的原因不仅仅是薪⽔,还可能涉及到公司⽂化、领导者风格等因素,后续采取的⾏动也就更能有的放⽮。
这样,才能确保⽚⾯的观点不会遮掩事实的真相。
7 相关分析
把两组不同的数据放在⼀起分析,出其中的相关性,就是相关分析。
相关分析往往是做因果分析的重要前提。⽐如,⽼板们都希望看到员⼯在正常的⼯作时间段以外加班,恨不得加班时长越长越好。那是不是加班时间越长,员⼯或公司的绩效就越好呢?⼀个简单的⽅法是把加班时间和绩效两组数据放到⼀起做⼀个相关性分析,即可以看出其中的规律。
不过,做相关分析的时候要⼩⼼⼀点,就是寻的数据需要尽可能互相独⽴。之前有⼈提到,想分析员⼯奖⾦和公司绩效之间的关联性,看是否⾼奖⾦带来了⾼绩效。这样分析会有问题,因为奖⾦系数本⾝就是根据绩效来计算的,两者之间当然是⼀种强关联。为了实现以上⽬的,倒是把员⼯基本⼯资和公司绩效放到⼀起分析,更合理⼀些。
8 因果分析
做数据分析的⽬的是希望到表⾯现象下⾯的原因,从⽽到解决问题的正确途径。
因果分析可能是数据分析⾥最复杂的⼀种。很多⼈把相关性分析等同于因果分析,这是⼀个常识性的错误。相关并不⼀定等于因果。举个例⼦,夏天来了,你会发现游泳的⼈数和购买冰淇淋的⼈数这两组数据呈现强相关性,但你并不能因此就得出结论说是因为游泳的⼈多所以导致买冰淇淋的⼈多。
统计学家们在做因果分析时,⼀般会有严格的条件限制。要得出两个因素之间存在因果关系,⾄少得满⾜两个前提:第⼀,两个因素在发⽣时间上存在先后顺序,先发⽣的为因,后⼀个为果;其次,在其他条件不变的前提下,第⼀个因素发⽣变化,会导致第⼆个因素的变化。
举个例,公司做了⼀次⼈才发展项⽬,你如何证明这个项⽬是有效果的呢?严格的做法是,⾸先,收集这个⼈在参加项⽬之前、期间和之后的绩效表现,观察前后阶段绩效是否发⽣明显的变化;其次,确保在项⽬实施期间,员⼯除了该项⽬之外,不会受到其他任何外部因素的影响。
更严格的做法,是另⼀组同样的⼈做对⽐。这组⼈的来源和之前⼀组完全⼀样,不同的是他们没有参加任何⼈才发展项⽬。假如项⽬结束之后,前⼀组⼈的绩效提升明显⾼于后⼀组⼈,就有了充分的证据来印证该项⽬的有效性。
之前⼀位客户曾告诉我,他们在分析⼀个⼈才项⽬有效性的时候,使⽤了更极端的⽅法:挑⼀组明显能⼒低于平均⽔平的员⼯参加项⽬,之后再和正常⽔平的⼀组员⼯做对⽐。假如前⼀组员⼯的绩效提升⾼于后⼀组,就能更有效地说明项⽬确实带来了积极的效果。
9 回归分析
回归分析可以被看作是相关性分析的延续,它也是数据分析中最为重要的⽅法之⼀。
相关分析让我们看到不同数据之间的相关性,⽽回归分析则把这种相关性通过数学公式具体地量化出来。虽然相关分析不能直接解释因果,但这并不妨碍我们通过相关分析实现预测和控制的⽬的。
⽐如,我们发现员⼯⼈数和公司绩效之间有较强的相关性,然后⽤数学公式将这种关系表达出来,那么我们就可以推算当公司绩效达到某个⽔平的时候,员⼯⼈数应该处于什么⽔平。当然,回归分析出来的结果只是⼀个近似值,并⾮百分百精准,但已⾜以帮助我们在⼤多数时候做决策之⽤了。
HR数据分析中常⽤的回归分析,分为线性回归和⾮线性回归。前者包括简单线性回归和多重线性回归,
后者包括多项式回归和逻辑回归。有⼈说,做回归分析最核⼼的就是到你想研究的关键问题(Y或因变量)以及影响它的因素(X或⾃变量)。
准X和Y可以帮助我们有效地建⽴起回归模型。⽐如,为了预测什么⼈可能成为公司的⾼潜⼈才,这⾥Y就是⼀个⼈成为⾼潜的可能性,⽽X可能就包括这个⼈的学历、专业、性格、胜任⼒、承担项⽬数、专业培训经历等等。通过回归分析,我们可以到对Y影响最显著的因素X 都是哪些。
以上便是HR数据分析中最常⽤的分析⽅法,它们可以帮助你解决⽇常⼯作中⼤部分与数据相关的问题。
发布评论