文章來源:微信公眾號【我看人看我】
一、 非參數檢驗的基本介紹在統計學中,假設檢驗方法可分為兩大類:參數檢驗和非參數檢驗。
參數檢驗即是基于樣本的觀測數據對總體參數(比如總體均值、方差)及總體參數差異性的檢驗。在前面的文章中介紹的Z檢驗、t檢驗、F檢驗(方差分析),都屬于參數檢驗方法。參數檢驗要求總體具備某些條件方可適用,比如總體需呈正態分布、涉及兩個總體時兩總體必須滿足方差同質性(即方差相等)。
但在實際的研究中,會經常碰見不滿足參數檢驗的前提條件的情況,比如總體不服從正態分布,或者總體分布未知,這時就不能使用參數檢驗方法,不然得到的檢驗結果會不準確。在參數檢驗方法不適用的情況,我們就需要選擇非參數檢驗方法進行統計檢驗。
非參數檢驗是在總體分布未知或者知之甚少的情況下,通過樣本數據對總體分布形態等特征進行推斷的統計檢驗方法。由于此種檢驗方法在由樣本數據推斷總體的過程中不涉及總體分布的參數,不要求總體分布滿足某些條件,使用條件較為寬松,因此被稱為非參數檢驗,也叫分布自由檢驗法(distribution-free test)。
二、非參數檢驗的優劣勢非參數檢驗和參數檢驗作為統計推論的兩類,都有其適應范圍和優劣勢,具體情況如下表1。
表1 非參數檢驗的優劣勢
由于參數檢驗比非參數檢驗的統計檢驗力更好,所以在條件滿足的情況下,要首先考慮參數檢驗。至于是否應該采用非參數檢驗方法,則要根據對總體分布的了解程度和變量層次來決定。
三、統計檢驗力上述提到的統計檢驗力應該如何理解呢?
統計檢驗力(又稱為假設檢驗的效力,power of a statistical test),是指該檢驗方法能夠準確地拒絕一個錯誤的原假設的概率,是衡量檢驗方法的準確程度的指標。
要理解統計檢驗力,首先要理解假設檢驗的兩類錯誤。我們知道,假設檢驗是基于小概率原理由樣本統計值來推論總體特征的過程(詳細介紹可閱讀《統計推論(二):假設檢驗的基本介紹》),由于樣本不可能完全代表總體,因此這種推斷過程難以完全避免錯誤的產生,即無論最后是否定還是接受原假設,都可能犯錯誤。具體來說,假設檢驗會產生四種結果(如下表2),其中兩種情況是正確的,另外兩種是在推論過程中可能會犯的錯誤。
表2 假設檢驗的四種情況
第一類錯誤(Ⅰ類錯誤)也叫 α 錯誤、甲種誤差,是指原假設(H0)本身是正確的,但我們拒絕了它所犯的錯誤。這意味著,我們得到的結論是存在顯著性差異,但實際上并不存在這樣的差異。而犯第一類錯誤的可能性,即是我們所確定的顯著度。例如,我們確定了0.05的顯著度,當p<0.05時,拒絕原假設,當p>0.05時,接受原假設。也就是說,0.05是拒絕或接受原假設的分界值,若我們拒絕原假設,但實際情況是原假設是正確的,那我們犯錯的可能性最多只有5%。
第一類錯誤的產生原因,主要有以下因素:
(1)樣本數據自身的誤導性,即樣本中包含了某些極端數據,導致樣本與總體存在較大差異;
(2)研究人員采用的決策標準比較寬松,比如更大的顯著度。
第二類錯誤(Ⅱ類錯誤)也叫 β 錯誤、乙種誤差,是指原假設(H0)本來是錯誤的,但我們接受了它所犯的錯誤。這意味著,我們的得到的結論是不存在顯著性差異,但實際上是存在差異的,其后果是我們可能會一項新的發現失之交臂。不像第一類錯誤可以用明確的概率值來衡量其產生的可能性,犯第二類錯誤的可能性受到許多因素的影響,比較難確定,需要經過復雜的函數計算,一般用 β 來表示。
雖然第二類錯誤沒有明確的概率值,但我們可以確定的是,在樣本量和統計方法固定的前提下,第一類錯誤和第二類錯誤存在反比關系。要降低犯第一類錯誤的可能性,即將顯著度下調,那勢必會增加犯第二類錯誤的可能性,即接受錯誤的原假設的可能性。兩類錯誤的這種矛盾關系是不可避免的,但我們可以通過增大樣本容量來在一定程度上同時減少兩類錯誤發生的可能性,因為樣本容量越大,樣本的代表性就越好,那么由樣本推論總體的誤差就會越小,自然兩類錯誤的發生可能性也就降低了。
理解了假設檢驗的兩類錯誤,我們再回來看統計檢驗力的概念,即檢驗方法能夠準確地拒絕一個錯誤的原假設的概率,換言之,統計檢驗力衡量了該檢驗方法能夠正確地識別到真實存在的差異性的能力。結合假設檢驗的四種結果矩陣我們可以發現,實際上表2矩陣左下角部分所代表的概率即是統計檢驗力,因此我們可以有表達式:
檢驗力=1-β
由此我們可以知道,檢驗力與第二類錯誤的可能性存在反比關系,統計推論時所犯的第二類錯誤越小,則檢驗力就越大。
有哪些因素會影響統計檢驗力呢?總的來說,主要有三個因素:
(1)實際的影響效果或差異大小
若自變量對因變量的實際影響效果很大,或者兩個總體的實際差異較大,都那么影響效果或差異(心理學稱為處理效應)就會越容易被識別出來,這意味著統計檢驗力越強。
(2)顯著性標準
顯著性標準會影響我們拒絕原假設的概率,比如顯著度由0.01變為了0.05,這意味著我們更有可能拒絕原假設,因為否定域的范圍變大了,統計檢驗力因此增大了。
(3)樣本容量
在前面我們講到,樣本容量越大,樣本的代表性就越好,那么由樣本推論總體的誤差就會越小從而降低了兩類錯誤的發生可能性。由統計檢驗力和第二類錯誤的反比關系可以知道,當犯第二類錯誤的可能性降低時,統計檢驗力隨之增加。由此可以得出,統計檢驗力實際上與樣本容量成正比關系,樣本容量越大,其檢驗能力越強。
在社會學研究中,雖然非參數檢驗存在一定的不足,但仍然被頻繁應用于統計推論中,這除了非參數檢驗的使用要求低外,還在于假設檢驗的檢驗力與樣本容量存在的正比關系。只要樣本容量足夠大,非參數檢驗也可以獲得比較好的結果。而社會學研究的樣本通常都比較大,一次調查中抽取幾千上萬的樣本是常有的事情,這就很好地保證了非參數檢驗的效力。
四、有哪些常用的非參數檢驗方法SPSS提供了多種非參數檢驗方法,以適用不同的分析場景,具體如下表3。
表3 常用的非參數檢驗方法
對于這些非參數檢驗方法的適用場景、如何使用SPSS進行操作以及分析結果如何解讀,后續將一一做詳細介紹。
注:各方法的英文術語
曼-惠特尼U檢驗:Mann-Whitney U Test
K-S檢驗:Kolmogorov-Smirnov 檢驗
符號檢驗法:the sign test
維爾克松(Wilcoxon)T檢驗,也翻譯為威爾科克森符合秩次檢驗:Wilcoxon signed-rank test
克瓦氏(Kruskal-Wallis)單向等級方差分析,簡稱為H檢驗
中位值(Median)檢驗
弗里德曼(Friedman)雙向等級方差分析
游程檢驗:the runs test
【#關于作者#】
中山大學碩士,用戶研究工程師、數據分析師,微信公眾號【我看人看我】,主要分享統計分析、用戶研究理論與方法、社會科學研究與方法等。
本文發布于:2023-02-28 20:03:00,感謝您對本站的認可!
本文鏈接:http://m.newhan.cn/zhishi/a/167765265975221.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:非參數檢驗(非參數檢驗的適用范圍).doc
本文 PDF 下載地址:非參數檢驗(非參數檢驗的適用范圍).pdf
| 留言與評論(共有 0 條評論) |