同⼀试验的同⼀指标,⼀组符合正态,⼀组不符合,那怎么描述呢?
导读
书上得来终觉浅,⼀个博⼠⽣,问松哥这么⼀个问题。他说对于同⼀试验的同⼀指标,⼀组符合正态,⼀组不符合,那怎么描述呢?
他说书上说,符合正态分布⽤均数±标准差,不符合正态分布⽤M(P25-P75),可是统计结果要放到同⼀张表中,难道⽤两种表达⽅法。
精⿍50期SPSS统计软件实战班-上海
(北京班满员,上海班招⽣过半!欲学从速哦)
松哥统计说
能问出这种问题,基本算已经⼊门并且遇到问题了。⾸先松哥给您⼀个基础知识作为铺垫。
统计变量(或者理解为研究指标)分为三种类型:数值变量、等级变量和分类变量。松哥分别称之为⽼⼤、⽼⼆和⽼三。
⽼⼤所包含的信息要⾼于⽼⼆,同理⽼⼆要⾼于⽼三。
本例所说的变量为数值变量,为让⼤家更容易理解,稍微具体点:⽐如某次研究选取受试对象100⼈,随机分成2组,每组50⼈,效应指标为BMI。其中⼀组的BMI符合正态,另⼀组不符合。统计分析结果表述,肯定不可以⼀个⽤均数±标准差,不符合正态分布⽤M(P25-P75)。
必须统⼀,因为不符合正态/对称是不可以⽤均数±标准差,⽽符合正态的既可以⽤均数±标准差,也可以⽤M(P25-P75)。
因此为了保持统⼀性,因此,两组数据的BMI,都⽤M(P25-P75)表⽰。
松哥统计说
有⼈会说,松哥,如果我想⽤图就⾏表⽰,该做何种图呢?
⾸先,采⽤带标准误的柱状图肯定就不合适了,因为不符合正态或对称。
⽽采⽤中位数和四分位数间距的,⾮常合适采⽤箱式图就⾏表述。
⼊下图,左为柱状图,有为箱式图。
柱状图作图,只⽤到2个统计量,均数与标准差。⽽箱式图反映的信息更多,包括5个信息,如果有可疑值,也会展⽰。如下图。
标准差怎么算
SCI论⽂时,甚⾄要求将原始数据添加到箱式图中进⾏展⽰,如下图:
个量,还包括每个值的点分布,对于展⽰数据的分布特征更加细腻!