怎樣用spss做pearson相關性分析
簡介
相關性是指兩個變量之間的變化趨勢的一致性,如果兩個變量變化趨勢一致,那么就可以認為這兩個變量之間存在著一定的關系(但必須是有實際經濟意義的兩個變量才能說有一定的關系)。相關性分析也是常用的統計方法,用SPSS統計軟件操作起來也很簡單,具體方法步驟如下。
方法步驟
選取在理論上有一定關系的兩個變量,如用X,Y表示,數據輸入到SPSS中。
從總體上來看,X和Y的趨勢有一定的一致性。
為了解決相似性強弱用SPSS進行分析,從分析-相關-雙變量。
打開雙變量相關對話框,將X和Y選中導入到變量窗口。
然后相關系數選擇Pearson相關系數,也可以選擇其他兩個,這個只是統計方法稍有差異,一般不影響結論。
點擊確定在結果輸出窗口顯示相關性分析結果,可以看到X和Y的相關性系數為0.766,對應的顯著性為0.076,如果設置的顯著性水平位0.05,則未通過顯著性檢驗,即認為雖然兩個變量總體趨勢有一致性,但并不顯著。
spss皮爾森相關系數分析是什么?
spss皮爾森相關系數分析表示在樣本中變量間的相關系數,表示相關性的大小。
一般來說相關性大小要看顯著性達到什么程度。顯著性越小說明相關程度越高。顯著性小于0.05則為顯著先關,小于0.01則為極顯著相關。
spss皮爾森相關系數分析研究報告:
相關系數的絕對值越大,相關性越強:相關系數越接近于1或-1,相關度越強,相關系數越接近于0,相關度越弱。
通常情況下通過以下取值范圍判斷變量的相關強度:
相關系數 0.8-1.0 極強相關。
以上內容參考:百度百科-Pearson相關系數
皮爾森相關性分析結果怎么看?
皮爾森相關性分析結果這樣看:首先看Y與X是否有顯著關系,即P值大小。接著分析相關關系為正向或負向,也可通過相關系數大小說明關系緊密程度。
一般相關系數在0.7以上說明關系非常緊密,0.4~0.7之間說明關系緊密,0.2~0.4說明關系一般。如果不太會對結果進行分析解讀,SPSSAU還提供了智能分析建議。
分析工具推薦
現實研究中使用Pearson相關系數的情況比較多。
進行皮爾遜相關性分析,需要借助相關統計分析工具,關于分析工具這里推薦使用SPSSAU,在線對各種數據進行編輯和統計分析。無需下載軟件安裝包,無需經過繁瑣的安裝過程,也不必花大量時間學習如何操作軟件。
Pearson能夠解決哪種數據的相關性判斷問題?
相關分析目前主要有四種。pearson相關分析是用來分析兩連續型變量的相關性的。此外Spearman方法是分析等級資料和連續型變量或者兩連續型變量間的相關性,該方法對數據的分布類型沒有要求。kendall是用來分析兩等級資料的相關性。最后是cramer‘V 這個方法適用于分析兩無序分類變量間的相關系數,無法判斷方向,值范圍0到1。
Pearson,Kendall和Spearman三種相關分析方法的異同
在SPSS軟件相關分析中,pearson(皮爾遜), kendall(肯德爾)和spearman(斯伯曼/斯皮爾曼)三種相關分析方法有什么異同
兩個連續變量間呈線性相關時,使用Pearson積差相關系數,不滿足積差相關分析的適用條件時,使用Spearman秩相關系數來描述.
Spearman相關系數又稱秩相關系數,是利用兩變量的秩次大小作線性相關分析,對原始變量的分布不作要求,屬于非參數統計方法,適用范圍要廣些。對于服從Pearson相關系數的數據亦可計算Spearman相關系數,但統計效能要低一些。Pearson相關系數的計算公式可以完全套用Spearman相關系數計算公式,但公式中的x和y用相應的秩次代替即可。
Kendall's tau-b等級相關系數:用于反映分類變量相關性的指標,適用于兩個分類變量均為有序分類的情況。對相關的有序變量進行非參數相關檢驗;取值范圍在-1-1之間,此檢驗適合于正方形表格;
計算積距pearson相關系數,連續性變量才可采用;計算Spearman秩相關系數,適合于定序變量或不滿足正態分布假設的等間隔數據; 計算Kendall秩相關系數,適合于定序變量或不滿足正態分布假設的等間隔數據。
計算相關系數:當資料不服從雙變量正態分布或總體分布未知,或原始數據用等級表示時,宜用 spearman或kendall相關
Pearson 相關復選項 積差相關計算連續變量或是等間距測度的變量間的相關分析
Kendall 復選項 等級相關 計算分類變量間的秩相關,適用于合并等級資料
Spearman 復選項 等級相關計算斯皮爾曼相關,適用于連續等級資料
注:
1若非等間距測度的連續變量 因為分布不明-可用等級相關/也可用Pearson 相關,對于完全等級離散變量必用等級相關
2當資料不服從雙變量正態分布或總體分布型未知或原始數據是用等級表示時,宜用 Spearman 或 Kendall相關。
3 若不恰當用了Kendall 等級相關分析則可能得出相關系數偏小的結論。則若不恰當使用,可能得相關系數偏小或偏大結論而考察不到不同變量間存在的密切關系。對一般情況默認數據服從正態分布的,故用Pearson分析方法。
在SPSS里進入Correlate-》Bivariate,在變量下面Correlation Coefficients復選框組里有3個選項:
Pearson
Kendall's tau-b
Spearman:Spearman
spearman(斯伯曼/斯皮爾曼)相關系數
斯皮爾曼等級相關是根據等級資料研究兩個變量間相關關系的方法。它是依據兩列成對等級的各對等級數之差來進行計算的,所以又稱為“等級差數法”
斯皮爾曼等級相關對數據條件的要求沒有積差相關系數嚴格,只要兩個變量的觀測值是成對的等級評定資料,或者是由連續變量觀測資料轉化得到的等級資料,不論兩個變量的總體分布形態、樣本容量的大小如何,都可以用斯皮爾曼等級相關來進行研究。
Kendall's相關系數
肯德爾(Kendall)W系數又稱和諧系數,是表示多列等級變量相關程度的一種方法。適用這種方法的數據資料一般是采用等級評定的方法收集的,即讓K個評委(被試)評定N件事物,或1個評委(被試)先后K次評定N件事物。等級評定法每個評價者對N件事物排出一個等級順序,最小的等級序數為1 ,最大的為N,若并列等級時,則平分共同應該占據的等級,如,平時所說的兩個并列第一名,他們應該占據1,2名,所以它們的等級應是1.5,又如一個第一名,兩個并列第二名,三個并列第三名,則它們對應的等級應該是1,2.5,2.5,5,5,5,這里2.5是2,3的平均,5是4,5,6的平均。
肯德爾(Kendall)U系數又稱一致性系數,是表示多列等級變量相關程度的一種方法。該方法同樣適用于讓K個評委(被試)評定N件事物,或1個評委(被試)先后K次評定N件事物所得的數據資料,只不過評定時采用對偶評定的方法,即每一次評定都要將N個事物兩兩比較,評定結果如下表所示,表格中空白位(陰影部分可以不管)填入的數據為:若i比j好記1,若i比j差記0,兩者相同則記0.5。一共將得到K張這樣的表格,將這K張表格重疊起來,對應位置的數據累加起來作為最后進行計算的數據,這些數據記為γij。
正態分布的相關檢驗
對來自正態總體的兩個樣本進行均值比較常使用T檢驗的方法。T檢驗要求兩個被比較的樣本來自正態總體。兩個樣本方差相等與不等時用的計算T值的公式不同。
進行方差齊次性檢驗使用F檢驗。對應的零假設是:兩組樣本方差相等。P值小于0.05說明在該水平上否定原假設,方差不齊;否則兩組方差無顯著性差異。
U檢驗時用服從正態分布的檢驗量去檢驗總體均值差異情況的方法。在這種情況下總體方差通常是已知的。
雖然T檢驗法與U檢驗法所解決的問題大體相同,但在小樣本(樣本數n)=30作為大樣本)且均方差未知的情況下就不能用U檢驗法了。
均值檢驗時不同的數據使用不同的統計量
使用MEANS過程求若干組的描述統計量,目的在于比較。因此必須分組求均值。這是與Descriptives過程不同之處。
檢驗單個變量的均值是否與給定的常數之間存在差異,用One-Sample T Test 單樣本T檢驗過程。
檢驗兩個不相關的樣本是否來自來具有相同均值的總體,用Independent-Samples T test 獨立樣本t檢驗過程。
如果分組樣本不獨立,用Paired Sample T test 配對t檢驗。
如果分組不止兩個,應使用One-Way ANOVO一元方差分析(用于檢驗幾個獨立的組,是否來自均值相等的總體)過程進行單變量方差分析。
如果試圖比較的變量明顯不服從正態分布,則應該考慮使用一種非參數檢驗過程Nonparametric test.
如果用戶相比較的變量是分類變量,應該使用Crosstabs功能。
當樣本值不能為負值時用右側單邊檢驗。
pearson 相關性
1、按一般經驗來說:“相關系數 0.8-1.0 極強相關;0.6-0.8 強相關;0.4-0.6 中等程度相關;0.2-0.4 弱相關;0.0-0.2 極弱相關或無相關”。
2、星號對應的是顯著性檢驗,這里的原假設為:pearson相關系數為0。拒絕原假設意味著pearson相關系數顯著不為0。兩個*表示極顯著,p值在0.01以下。一個*號表示顯著,p值在0.01-0.05之間。注意:拒絕這個原假設并不等價于強相關,這只是說明“相關系數為0”這個假設顯著不成立。當樣本量較大時,只要有很小的弱相關就可以顯著拒絕這個原假設,所以可以經常看到結果中有兩個*,lz的.378** 也是這個道理。
3、所以lz的這個結果可以解釋為:pearson相關系數顯著不為0,即存在一定的相關性,且這個相關性按一般經驗來說屬于弱相關。如果是經濟變量或關系復雜的問題,這個關系有一定意義,但還不具有決定性的說服力,需要其他信息解釋或佐證。如果研究目的是探索性的,這個關系值得保留關注;如果研究目的是驗證性的,則這個關系需要其他信息解釋或佐證。