医学统计学傻瓜教程(2019版)

医学统计学傻瓜教程（2019版）

一、基础篇

【例1】本组105 例，男55例，女50例；平均年龄：62.3±6.1岁，所有入选病例均符合1999年WHO高血压诊断标准。

举这个例子是为了说明“均数”与“标准差”的概念。我实在不愿意多花时间阐述一些概念性的东西，但是由于“标准差”的概念实在太重要了。【例1】中的数据“62.3±6.1”，“62.3”就是年龄的均数，均数的概念大家都懂，那么后面的“6.1”是什么呢？它就是标准差。有人可能会问，表达一组人的平均年龄，用均数就够了，为什么还要加一个标准差呢？先看下面的一个例子：有两组人，第1组身高（cm）：98、99、100、101、102；第2组身高（cm）：80、90、100、110、120，这两组人虽然身高的均数都是100cm，但是，仔细观察，第1组的身高很接近，第2组的身高差别很大，故仅仅用一个平均数表达一组数据的特征是不完整的，还需要用另一个指标来表达其参差不齐的程度，这就是标准差。统计学上对一组测量结果的数据都要用“均数±标准差”表示，习惯表达代号是：±s，具体例子如：平均收缩压120±10.2mmHg。

我想现在同学们都已知道标准差是什么东东了，那么，标准差是怎样得到的呢？有一个比较复杂的计算公式，我们不必去深究这个公式是怎么样的，只需知道标准差越小，说明数据越集中，标准差越大，说明数据越分散。撰写医学论文的第一步是收集原始数据，如：

第1组身高（cm）：98、99、100、101、102；

第2组身高（cm）：80、90、100、110、120。

在论文中并不是直接给出原始数据，而是要以±s方式表示。利用软件《临床医师统计学助手 V10.0》，只要输入原始数据，就能自动计算出均数及标准差，即第1组平均身高：100±1.58cm；第2组平均身高：100±15.81cm，如下图。

2、两样本均数t检验

【例2】目的研究中药板兰根对“非典”疗效。方法将36例“非典”患者随机分为组19例，采用常规+板兰根口服，对照组17例，仅采用常规。结果组平均退热时间3.28

±1.51d；对照组平均退热时间5.65±1.96d，两组间对照差别有极显著意义（p＜0.01）结论中药板兰根对“非典”有显效疗效，实为国之瑰宝。

这是最常见的一种统计学数据处理类型，统计学述语叫做“两样本均数差别t检验”，说得通俗易懂一些，就是检验两组方法所得到的数据到底有没有差异，或者说，差异是否有意义。我们平时的思维习惯是，数据的大小还用得着检验吗？这是小学生都会的问题，但是统计学可不是这样简单的看问题。

可能还没有说明白这个问题，下面举一个简单的例子。我们的目的是得出这样一个结论：“北京出产的西瓜比上海出产的西瓜大”。最可靠的方法是把全部的北京产西瓜和全部的上海产西瓜都称重量，得到两个均数，然后比大小即可，可是智商正常的人并不会这样去做，通常的做法是，随机选一部分北京的西瓜和一部分上海的西瓜，先让这两部分西瓜比大小，然后推断到底那里的西瓜大。这种方法是“窥一斑可见全豹”，统计学述语叫做“由样本推断总体”，事实上，我们所做的医学科研都是基于这种方法。

再回到上面的例子，假如我们有二种做法：

A、随机选2个北京西瓜，平均重量是5.6±0.3kg；再随机选2个上海西瓜，平均重量是4.3±0.25kg；标准差怎么算

B、随机选1000个北京西瓜，平均重量是5.6±0.3kg；再随机选1000个上海西瓜，平均重量是4.3±0.25kg。

凭我们的直觉和生活常识，由B推出“北京的西瓜比上海西瓜大”这个结论的把握性就非常的大，而A则基本上推不出这个结论。为什么这样说呢？北京全部的西瓜叫“总体”，随机选择的2个西瓜叫“样本”，通常我们不会拿“总体”去比大小，这太困难了，而总是拿“样本”去比大小，这样就可能会有一个问题，你所抽到的样本，可能都是最大的西瓜，也可能都是最小的西瓜，这样由样本来推断总体就可能会出现错误（抽样误差），如何来解决这个问题呢，这就是统计学所研究的问题，总体来说，样本量越小，抽样误差越大，由样本推断总体的把握性越低，从上面例子中，相对B而言，A的可靠性就很低。现在，终于可以引出我们的主题了，统计学处理本质是研究由样本差异推断总体差异的把握性有多大，这种把握性在统计学上用p值表示。如p＜0.05或P＜0.01，可以理解为由样本差异推断总体差异的把握性达95%或99%以上；如P＞0.05，可以理解为这种把握性在95%以下。

医学统计学傻瓜教程(2019版)

发布评论取消回复

最近发表

热门文章

标签列表