離中趨勢量數是指描述一組數據離中差異情況和離散程度的量數,也稱差異量數(Measures of Variability) ,表現數據組內個數散佈情形,離中趨勢量數常見的表徵數有全距、四分位距、變異數、標準差。
(1)全距(Range):一組數據中最大值與最小值之差,其計算公式如下:
全距=極大值-極小值
(2)四分位距(IQR- Inter-quartile range) :四分位距為第三四分位數(Q3)與第一四分位數(Q1)的差,將各個變數值按大小順序排列,然後將此數列分成四等份,所得第三四分位上的值與第一四分位上的值的差。
四分位距的公式表示:
Q = Q3 − Q1
其中:Q1的位置=(n+1)/4
Q3的位置=3(n+1)/4
若(n+1)剛好是4的倍數,則計算出來的四分位元數的位置就是整數,這時,各個位置上的變數值就是相應的四分位數;若(n+1)不是4的倍數,則按照上面公式計算出來的四分位數的位次就有可能帶小數,這時可根據插值法來計算上下四分位數(Q1和Q3),再按照公式計算出四分位距。
範例說明一:
假設樣本數為10時,
Q1的位置=(n+1)/4=2.75
Q3的位置=3(n+1)/4=8.25
根據插值法來計算上下四分位數。
整理得:Q1=0.25X2+0.75X3
整理得:Q3=0.75X8+0.25X9
(3)變異數(Variance) :是指每一個觀測值和平均值之間的偏差值的平方值的平均。變異數Var(X)為對數據的變異程度的衡量,常用來量測資料分散程度之指標值,其計算公式如下:
(4)標準差 (Standard Deviation) :將變異數開根號得到標準差。其計算公式如下:
範例說明二:
兩家同樣生產馬達軸心的工廠,分別抽取10個樣本,量測其直俓的尺寸,測試資料如下,
工廠A |
10.1 |
9.9 |
10.1 |
9.9 |
9.9 |
10.1 |
9.9 |
10.1 |
9.9 |
10.1 |
工廠B |
16 |
5 |
7 |
14 |
6 |
15 |
3 |
13 |
9 |
12 |
按照量測值的大小排序如下,
工廠A |
9.9 |
9.9 |
9.9 |
9.9 |
9.9 |
10.1 |
10.1 |
10.1 |
10.1 |
10.1 |
工廠B |
3 |
5 |
6 |
7 |
9 |
12 |
13 |
14 |
15 |
16 |
工廠A中位數=(10.1+9.9)/2=10
工廠B中位數=(9+12)/2=10.5
工廠A Q1=0.25*9.9+0.75*9.9=9.9
工廠B Q1=0.25*5+0.75*6=5.75
工廠A Q3=0.75*10.1+0.25*10.1=10.1
工廠B Q3=0.75*14+0.25*15=14.25
得到的統計量數如下表:
極小值 | 第一四分位數(Q1) | 中位數 | 第三四分位數(Q3) | 極大值 | 平均值(mean) | |
工廠A | 9.9 | 9.9 | 10 | 10.1 | 10.1 | 10 |
工廠B |
3 | 5.75 | 10.5 | 14.25 | 16 | 10 |
(1)全距(Range) :
工廠A全距=10.1-9.9=0.2
工廠B全距=16-3=13
(2)四分位距(IQR- Inter-quartile range)
工廠A四分位距=10.1-9.9=0.2
工廠B四分位距=14.25-5.75=8.5
從統計數據可以看到
工廠A有50%的馬達軸心的直徑在9.9至10.1之間,最大差異為0.2。
工廠B有50%的馬達軸心的直徑在5.75至14.25之間,最大差異為8.5。
(3)平均偏差 (Mean Absolution Deviation; MAD):各個數值之離差取絕對值,然後再求平均數,其計算公式如下:
工廠A平均偏差= 1/10=0.1
工廠B平均偏差= 40/10 =4
(4)變異數(Variance)
![]() |
|||
![]() |
(5)標準差 (Standard Deviation)
(6)相對變異量數 (Measures of Relation Dispersion)
一般比較常見的相對變異量數,即為變異係數(Coefficient of Variation) ,通常以C.V.表示,其定義如下:
採用變異係數來可比較其兩者差異程度大小:
工廠A: C.V.= 0.105/10X100%=1.05%
工廠B: C.V.= 4.595/10X100%=45.95%