如何⽤excel做正交分析_如何判断正态分布⽤excel进⾏数据分
析番外
之前看到有⼈写了⼀篇关于再订货点ROP计算的⽂章,引起了激烈的讨论,很多⼈说,这个计算太公式化,太理想,这让我想到了⼀
点,ROP的计算或者说很多预测的⽅法都是基于正态分布为前提去讨论的,但在⽇常的操作中有多少⼈会去拟合判断你的历史数据是否符合正态分布?如果不符合正态分布运⽤这些⽅法去求得的结果势必不完全符合需求。今天,咱讨论下正态分布的验证,权当娱乐。
正态分布的定义直接百度⼀下,⽹上很多,我们可以得知,正态分布通常⽤N(µ,σ)来表⽰均值µ和标准偏差σ的正态分布,μ是正态分布的平均值,⽽σ是标准偏差。
通俗的讲,µ 决定了曲线在X轴的位置,决定了⼤多数数据靠近的中⼼值。
σ是正态分布的扩散,通俗来讲,σ决定了曲线的胖瘦
说到正态分布,我们常听到Z score,Z是表⽰离开µ多少远的那个位置,我们通常会考虑离开中⼼位置多远的那个部分的⾯积,这个⾯积就是我们⽆法cover的量。这两个参数是我们计算ROP时候常⽤到的,我们通常说的service level就是要在正态分布曲线中cover多少⾯积,
⽽Z之外部分的⾯积就是我们service level⽆法cover的,也因此,通常通过假设检验,对⽐P是否⼩于等于0.05作为基准来验证正态分布。
正态分布永远都是中⼼对称的,所以基于标准的正态分布,统计结果是否符合正态分布就有了我们常⽤的⼀些偏差也是验证是否符合正态分布的⽅法,⽐如峰度,偏度。
由于许多最常见的统计检验依赖于样本或总体的正态性,因此检验基础分布是否为正态分布或⾄少是对称分布通常很有⽤。这可以通过以下⽅法完成:
以图形⽅式查看分布(通过直⽅图,箱形图,QQ图)
分析偏度和峰度
使⽤统计测试(尤其是卡⽅,卡莫格洛夫-史密罗诺夫,夏⽪罗·威尔克,贾克·巴⾥,达⼽斯蒂诺·⽪尔森)
很多正态分布验证通过软件⾮常简单的就可以得到验证结果,可是我们⽇常⼯作中,特别是物料管理中,那么多物料,我们不太可能每次都⽤个软件去验证,很多情况连软件都没有,那怎么办?
那么是否我们可以通过物料的分类来看是否物料的消耗符合或者不符合正态分布,在实际运⽤中根本不需要来进⾏验证呢?接下来,我通过选⽤XYZ三种类型的物料的正态分布验证来看下结果。
⾸先,我没有软件,我们直接⽤excel,excel有data analysis插件,通过Data analysis插件可以计算出相应的值,再进⾏验证,另外,我们也可以⽤⾮常直观的图表去验证,这⾥我直接⽤图表的⽅法:
先看下三种物料原始的消耗图
这⾥可以很明显的看出,X类物料的波动相对较⼩,Y类次之
我们先将原始数据进⾏从⼩到⼤的排序,计算出Mean和标准差Stand deviation,画出图表,可以看出X类物料的图形⽐较接近正态分布,Y类次之,Z类⼏乎就是离散的,但是光从这个图表,我们⽆法肯定Y是否符合正态分布,看着也蛮像的。
我们⽤QQ图,对⽐标准的正态分布
X类物料基本是线性的,⽽且⾮常好的cover了正负两个象限,我们近似认为符合正态分布,所以对于X类物料,我们完全可以放⼼的运⽤ROP的计算公式去计算我们合理的ROP数值;
Y和Z物料完全不符合正态分布。但是如果我们对Y类物料的消耗进⾏加⼯,去掉季节等因素,如果符合正态分布,我们依然可以对其运⽤现有的⽅法进⾏预测和分析。
对于Z物料,⼏乎是离散的,预测准确性很低,受外部影响因素很⼤。这种物料⾮要设置成PTS的话,我们通常需要跟前端销售,产品经理,市场等多⽅洽谈,确定⼤概的总消耗量,或者⽤增加安全库存的办法去尽量cover不确定的消耗需求。
当然,这只是⽤了⼀个维度分析并不全⾯,我们还可以结合价格的影响,促销,业务指标等,利⽤回归,离散等⽅法综合分析,但对于⽇常操作来说,这样的分析消耗太多的体⼒,只能针对重点物料,所以物料计划,需要在分析的基础上多沟通和交流,利⽤ABC/XYZ的特性进⾏分类管理,并需要多了解更多的影响因素,帮我们更好的判断,对于⼀些消耗不稳定的物料,有时候可能计算的结果还不如你拍脑袋来得准。
这⾥我们⽤到了EXCEL的两个函数:
怎么做数据分析可以直接利⽤excel⾃带的正态分布函数求出正态分布图
NORM.DIST(x,mean,standard_dev,cumulative)
我们可以利⽤以下这个函数得出对应的Z-Scroe,然后做出QQ图形。
NORM.S.INV(probability)
这两个⽅法⾮常简单,也⾮常容易实现。