第一型同第二型錯誤
喺做假說檢定(hypothesis testing)嗰陣,一般會將可能會出現嘅錯誤分兩種[1]:
- 第一型錯誤(棄真錯誤、α錯誤、假陽性,Type I Error)指錯誤噉拒絕咗 ,得出咗個「假陽性」(false positive)結果-兩個變數查實冇啦掕,但研究者搵到咗一個陽性結果出嚟。
- 第二型錯誤(存偽錯誤、β錯誤、假陰性,Type II Error)指 其實係錯,但就冇俾人成功噉拒絕到,得出咗個「假陰性」(false negative)-兩個變數實際上有關但就搵到個陰性結果。
呢啲錯誤會發生有好多原因,包括係科研入面嘅某啲隨機性——例如有份研究想睇吓A、B兩個地區嘅狼嘅平均身長係咪有分別,佢哋隨機噉喺兩個地區度抽樣,再度吓啲狼嘅身長。研究嘅虛無假說係「兩個地區啲狼嘅平均身長係冇分別」。可能佢哋嘅平均身長的確冇分別( 係真),但喺隨機抽樣嘅過程當中,咁啱得咁橋喺地區A抽咗啲嗰頭最大隻嘅狼出嚟,而喺地區B又咁橋淨係抽嗮啲嗰頭最細隻嘅狼出嚟,搞到最後搵到出嚟個結果話兩個地區啲狼嘅身長有顯著分別,即係錯誤噉排除咗 -第一型錯誤。喺呢個個案入面,啲科研人員之所以搵到兩個變數(「地區」同埋「啲狼嘅身長」)之間有關唔係因為兩者之間真係有關,而係抽樣嗰陣唔好彩。呢啲事喺科學界間唔中會發生[2]。
真實情況 | |||
---|---|---|---|
(虛無假說)真 | (對立假說)真 | ||
根據研究結果嘅判斷 | 唔拒絕 | 正確判斷 (真陰性) 發生概率1-α |
錯誤判斷 (假陰性、第二型錯誤) 發生概率β |
拒絕 | 錯誤判斷 (假陽性、第一型錯誤) 發生概率α(顯著水準) |
正確判斷 (真陽性) 發生概率1-β(統計功效) |
控制邊種錯誤
編輯研究者梗係希望α同β都越細越好,但係如果樣本量固定,呢兩種錯誤嘅概率係冇可能同時變細嘅,壓低其中一個,另外一個自然噉就會上升。[3]α=β時嘅錯誤率叫做交越錯誤率(crossover error rate,CER)。
但係實際上,第一型同第二型錯誤嘅嚴重程度經常係唔一樣嘅,譬如指紋識別系統嘅「陰性」即係指紋匹配、認證通過,「陽性」係唔匹配、唔畀通過;但係亦都可能出現實際係同一個人但係俾電腦當成係另一個人嘅情況(假陽性,第一型),或者唔係同一個人嘅指紋但係畀佢過咗嘅情況(假陰性,第二型)。而噉嘅條件下我哋通常會覺得第二型錯誤比較大鑊,因為發生第一型錯誤嘅話通常試多幾次就得,而發生第二型錯誤會令到資料外泄,噉我哋就會要求將β降低,而第一型錯誤嘅概率大啲都唔緊要。
不過,喺科研當中,研究人員優先控制嘅通常係第一型錯誤。噉做係因為虛無假說係乜,一開始就講清楚嗮,兼且研究做嘅都係檢驗虛無假說啱唔啱呢個問題;但係對立假說係乜嘢,通常就好空泛。亦即係講,研究中至緊要係控制第一型錯誤,即係降低虛無假說正確但係將佢拒絕咗嘅風險。[3]
攷
編輯- ↑ Rubin, D. B.; Little, R. J. A. (2002). Statistical analysis with missing data. New York: Wiley.
- ↑ The Difference Between Type I and Type II Errors.
- ↑ 3.0 3.1 贾俊平 等 (2015)。《统计学(第六版)》 (中國中文)。中国人民大学出版社。ISBN 9787300203096。