數據分析中經常需要對數據進行描述性統計分析,例如給定一組數據,需要求和、求均值、求最大值/最小值、求中位數、求方差等。
本文將介紹數據分析中常用的12個統計量及其對應的Excel公式。
1、求和求和,就是將一組數據相加,在Excel中,通過sum公式即可求和。
2、平均值平均值,一組數據相加,再除以數據的個數得到的結果就是均值。
在Excel中,可以通過函數average來求均值。
3、最大值/最小值最大值,就是找出一組數據中的最大值,數據少的時候肉眼即可找出,數據多的時候就需要用到公式來求,Excel中的公式max可以求出最大值。
最小值,就是一組數據中的最小值,Excel中的公式min可以求出最小值。
4、極差極差,表示一組數據中的最大值與最小值之差。
在Excel中,沒有直接求極差的公式,我們可以先用max和min分別求出最大值和最小值,然后作差即可。
5、眾數眾數,表示一組數據中出現次數最多的數值。
例如,有數據:1,2,1,2,1,3,4,很明顯,數字1出現的次數最多,出現了3次,所以這組數據的眾數就是1。
當然,也有多個眾數的情況,例如,1,2,1,2,1,2,3,在這組數據中,1和2都分別出現了三次,所以這組數據的眾數有兩個,分別是1和2。
在Excel中,可以通過函數MODE.SNGL來求眾數,如果有多個眾數,用MODE.MULT。
如果想系統學習數據分析,請查看以下課程,限時優惠中。
6、中位數中位數,就是將總體中的各個數據按照升序排列,處于中間位置的數值,就是中位數。
例如,5,3,1,4,2,升序排列后:1,2,3,4,5,中間位置上的數據為3,所以中位數為3。
當然,還有一種情況,如果有偶數個數據,則中位數是中間位置兩個數字的平均值。
例如,5,3,1,4,2,6,升序排列后,1,2,3,4,5,6,中間位置上取兩個數字:3和4,則中位數為3和4的平均值3.5。
在Excel中,通過median來求中位數。
7、四分位數四分位數,將所有數據由小到大排列,分成四等分,此時會產生三個分割點,這三個分割點上的數字就是四分位數。
例如,給定一組數據,5,3,1,4,2,6,8,7,9,升序排列后,1,2,3,4,5,6,7,8,9
第一個分位點上的數字,叫作第一個四分位數,也叫下四分位數。
它的位置可以根據公式確定,這里n=9,計算后得到3,所以取第3個數作為第一個四分位數。
第二個分位點上的數字,即第二個四分位數,其實就是中位數5。
第三個分位點上的數字,叫作第三個四分位數,也叫上四分位數。
它的位置可以根據公式確定,計算得到7,所以取第7個數作為第三個四分位數。
當然,在Excel中可以用公式QUARTILE.INC可以很容易求出各個四分位數。
8、四分位差四分位差,顧名思義,就是四分位數的差值,是指上四分位數和下四分位數之差,也叫四分位距。
四分位差反映了數據中間50%的離散程度,其數值越小,表示數據越集中,反之,表示數據越分散。
9、方差方差反映了數據的波動性,用數學語言表示就是,各變量值與其均值離差平方的均值。
例如,有以下兩組數據。
組1:4,5,1,4,5,2,4
組2:4,3,4,4,5,4,4
繪制出折線圖如下。
從圖中可以看出,數據組1的波動性明顯大于組2,也就是說數據組1的方差大于組2。
在Excel中,通過公式var.s可以求出方差。
10、標準差標準差,就是方差開方得到。
由于方差是在原來數據的基礎上進行了平方,所以單位發生了變化,標準差的單位則和原來的數據一致,所以在實際分析時,標準差使用得更多。
在Excel中,通過公式stdev.s可以求出標準差。
11、偏態系數偏態系數衡量數據分布的對稱性,對于正態分布來說,左右對稱,如下圖中間這個圖所示。
左右兩側的圖不對稱,稱之為偏態,左邊的稱為正偏態,右邊的稱為負偏態。
我們用偏態系數來衡量偏態,用sk表示偏態系數。
當sk>0時,分布是正偏態的。當sk=0時,分布是對稱的。當sk<0時,分布是負偏態的。在Excel中,通過skew公式可以很容易計算出一組數據的偏態系數。
12、峰態系數峰態系數表示數據分布的扁平程度的度量。例如,不同峰態的分布如下圖所示。
用峰態系數可以衡量峰態,峰態系數用K來表示。
當K>0時,分布比較高尖,為尖峰分布。當K<0時,分布比較矮胖,為平峰分布。在Excel中,可以通過公式kurt來計算峰態系數。
本文發布于:2023-02-28 21:03:00,感謝您對本站的認可!
本文鏈接:http://m.newhan.cn/zhishi/a/167772010397607.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:統計數據分析(統計數據分析報告).doc
本文 PDF 下載地址:統計數據分析(統計數據分析報告).pdf
| 留言與評論(共有 0 條評論) |