2-3 變異的計算及解析
為了解釋這兩個觀念的差異,我們先看下例數據:
下例數據有經過分組,每組抽測5個數據 (即 S/S 或 n = 5的意思 )。分組的原因不外乎量產、或長期研究等, 需要分批量測而形成母體與樣本的關係。
母 體 | 樣 本 | 樣 本 | 樣 本 | 樣 本 | 樣 本 | … | 樣 本 | 標準差 估計標準差 其中、須查表、為隨常數: 約之間 約之間 |
(組1) | (組2) | (組3) | (組4) | (組5) | (組25) | |||
2 3 6 8 8 | 4 5 6 7 9 | 2 4 5 7 8 | 1 3 6 7 9 | 3 5 4 8 8 | 2 5 6 7 9 | |||
樣本平均 | 5.4 | 6.2 | 5.2 | 5.2 | 5.6 | … | 5.8 | 組間變異 =0.81 |
樣本標準差s (組內變異) | 标准差怎么算 2.7 | 2.0 | 2.4 | 3.0 | 2.4 | … | 2.6 | 平均==2.55 |
樣本全距R (組內變異) | 6 | 5 | 6 | 7 | 5 | … | 7 | 平均==6.01 |
(1) (真)標準差:
若將所有 Raw Data 視為一個母體、混合不分組,則=STDEV( )所計算出來的標準差即為所求,即工程師最熟悉的算法。
--------------------------------------------------------------
使用時機:a.) 想了解母體真正的變異的時候; b.) 想敏銳地抓出上圖/組間變異的異常的時候。
---------------------------------
目的:了解整個母體的總變異 。
優點:可以充分反映整個母體的異常 (含上圖/組間變異、及下圖/組內變異的異常…尤其是組間變異的異常)。
缺點:數據量要夠大(避免誤差過大)、且上圖不能有異常(避免組間變異顯著),否則計算出來的σ不具代表性。
(2) 估計標準差:
大部分的工程師沒聽說過估計標準差。Raw Data 若經過分組 (分組與抽樣皆要隨機),我們可以利用 樣本的變異、去估算整個母體的變異;但是要特別注意組間變異()已經被假設成常態分配;以白話來說:想像管制圖-上圖的每個組平均是一顆綠豆,當這些綠豆被一把撒到管制圖-上圖的時候,這些綠豆皆自動定位到常態分配該有的位置上,因此整個上圖的假設都是常態分配,若真有異常、也早已被視而不見。
故以估計標準差來看問題,祇能解析下圖/組內變異的異常 (即管理面的異常:如某單一人/機抽樣技術不穩定的問題、某單一作業機台不穩定的問題、某個別材料品質不穩定的問題等⎡一般因⎦ …主要還是抽樣技術不穩定的問題)。
此時的計算,都是由下圖/組內變異的平均來倒推,以估算整個母體變異的期望值:=/c4 =/d2 (註),其中c4、d2是查表值 ( 附表),隨著n (即S/S)而變,n愈大估計值就會愈接近母體。
註:樣本s、R、MR與母體之間的關係,令母體與樣本均為常態分配,不需執行冗繁的計算,可以直接以查表方式整理如下:
E(s)= c4 , D(s)= c3,其中c4、c3是查表值( 附表)
E(R)= d2 , D(R)= d3,其中d2、d3是查表值 ( 附表)
--------------------------------------------------------------------------------------------
使用時機:當組間變異過於顯著,無法正確評估製程之實力時。(註)
註:理想上=;實務上通常<:
代表著統計經驗對一特性在常態分配時的理想預測;也許是因為製程真的較差、也許是因為管制圖的管理分組做得並不好,造成上圖/組間變異變得比常態分配預期的還要大。
-----------------------------------------------------------------
目的:估算整個母體的總變異的期望值。
優點:因為計算的是期望值,當數據量不大時、較(真)標準差具代表性。
缺點:只能反映下圖/組內變異的異常,而組內變異的異常通常只能反映管理問題,所以較適
合量產使用。
t检验是对各回归系数的显著性所进行的检验,(--这个太不全面了,这是指在多元回归分析中,检验回归系数是否为0的时候,先用F检验,考虑整体回归系数,再对每个系数是否为零进行t检验。t检验还可以用来检验样本为来自一元正态分布的总体的期望,即均值;和检验样本为来自二元正态分布的总体的期望是否相等)
发布评论