数据分析的⼏个⽅⾯
描述性分析:确定所发⽣的事情,这通常涉及到描述发⽣了什么现象的报告,通常当我们需要对⼀个事件或者⼀个情况进⾏数据分析的时候,我们需要收集与此相关的数据,当我们刚拿到数据的时候,会显得杂乱⽆章,这个时候就需要我们分门别类进⾏统计。统计出的数据就能看出数据之间⼤致的关系,虽然不能准确的说明其中的原因,但是当我们拿出⼀个陌⽣的数值放⼊该统计模型的时候,我们就知道该数值是否适应这个统计模型。如果我们想要更深⼀步了解数据模型的内在关系那么我们就需要进⾏特征分析。描述分析更多是描述⼀种已经形成的现实情况,在这种情况下,从不同的⾓度看数据会有不同的解答。
特征性分析:解释现象发⽣的原因,根据数据挖掘技术来到数据之间的相关性。要做特征分析的前提在于确保我们所收集的数据的可信度,如果数据源不可信,做出来的数据分析报告肯定也是失实的。同时还可以存在⼀个问题,在于,我们进⾏特征分析的时候,如果分析⼈员本⾝的思路或者对问题的理解产⽣偏差后,在选取数据类型时出现选取错误,这样做出来的数据分析报告会出现两种情况,第⼀种情况在于做出了错误的判断,第⼆种情况在于,做出的结果并没有错误,但是该结果对于我们想要得到的原因⽽⾔是有很⼤的差距的。
特征分析是数据分析中很关键的⼀步,当我们做好了特征分析后就需要进⾏数据分析最有价值的⼀个步骤上了,那就是预测性分析。
怎么做数据分析预测性分析:评估可能发⽣的事情的概率,根据你的⼯作性质,个⼈兴趣,做⼈物画像。数据分析给出的答案通常并不是⼀个确定性的答案。⽽是⼀个加权后的数据模型。为什么会存在这样的情况呢,原因在于,世界的不确定性,是极其复杂的,带有很强随机性的,以及各种可预测及不可预测的⼲扰项太多,每⼀个⼩的变化都导致结果的⼤的变化,类似于蝴蝶效应,这也正是这个世界的迷⼈之处。那我们做预测性分析的时候,更多是在⼀个随机性的世界做⼀个相对确定性的分析及预测。这样就需要⼀个相对稳定的数据模型,但是这个数据模型只是在⼀定程度上能实现⼀样的结果,也可能出现不⼀样的结果。