2024年2月13日發(作者:7900日元)

文檔
37. 時間序列分析Ⅰ—平穩性及純隨機性檢驗
(一)基本概念
一、什么是時間序列?
為了研究某一事件的規律,依據時間發生的順序將事件在多個時刻的數值記錄下來,就構成了一個時間序列。對時間序列進行觀察、研究,找尋它變化發展的規律,預測它將來的發展趨勢就是時間序列分析。
例如,國家或地區的年度財政收入,股票市場的每日波動,氣象變化,工廠按小時觀測的產量等等。
注:隨溫度、高度等變化而變化的離散序列,也可以看作時間序列。
二、時間序列的特點
(1)順序性;
(2)隨機性;
(3)前后時刻(不一定相鄰)的依存性;
(4)整體呈趨勢性和周期性。
三、時間序列的分類
按研究對象的數目:一元時間序列、多元時間序列;
按序列統計特性:平穩時間序列、非平穩時間序列;
按分布規律:高斯時間序列、非高斯時間序列。
四、研究方法
文檔
1. 平穩時間序列分析;
2. 非平穩時間序列分析(確定性分析、隨機性分析)。
五、其它
任何時間序列經過合理的函數變換后都可以被認為是由下列三部分疊加而成:
(1)趨勢項部分;
(2)周期項部分;
(3)隨機項部分(隨機信號、隨機噪聲)
圖1. 四種趨勢:線性、二次、指數增長、S型
例如,手機銷售的月記錄按年增長(趨勢項);按季節周期波動(周期項);隨機信號和隨機噪聲。
時間序列分析的主要任務就是:上面三部分分解出來,是研究平穩隨機過程的變化規律,建立特定的ARIMA 模型(要求大體平穩、可能含有周期但不能有規則性的線性指數等類型趨勢項)。
文檔
六、方法性工具
1. 差分運算
(1)k步差分
間隔k期的觀察值之差:Δk=xt-xt-k
(2)p階差分
Δxt=xt-xt-1稱為一階差分;
?xt??pp?1xt??p?1xt?1??(?1)iCipxt?p?i稱為p階差分;
i?0pSAS函數實現:diffn(x )
2. 延遲算子
延遲算子作用于時間序列,時間刻度減小1個單位(序列左移一位): Bxt=xt-1, ……, Bpxt=xt-p.
SAS函數實現:lagn(x)
用延遲算子表示k步差分和p階差分為:
Δk=xt-xt-k=(1-Bk) xt
?xt?(I?B)??(?1)pCipxt?i
ppi?0p
(二)平穩時間序列
一、概念
平穩時間序列按限制條件的嚴格程度,分為
嚴平穩時間序列:序列所有的統計性質都不會隨著時間的推移而發生變化;
文檔
寬平穩時間序列:序列的主要性質近似穩定,即統計性質只要保證序列的二階矩平穩,即對任意的時間t,s,k,序列Xt滿足:
二、平穩時間序列的統計性質
(1)均值為常數;
(2)自協方差只依賴于時間跨度;
若定義自協方差函數為
γ(t,s) = E(Xt-μt)( Xs-μs)
則可由二元函數簡化為一元函數γ(t-s),得延遲k自協方差函數:
γ(k)= γ(t,t+k)
由此易知平穩時間序列必具有常數方差:
D(Xt)= E(Xt-μt)2=γ(t,t)= γ(0)
時間序列自相關函數:
?(t,s)?延遲k自相關函數:
E(Xt??t)(Xs??s)
DXt?DXs?(k)?E(Xt??t)(Xt?k??t?k)?(k)?(k)??
DXt?DXt?k?(0)??(0)?(0)基本性質:
(1)ρ(0)=1;
文檔
(2)ρ(-k)= ρ(k);
(3)自相關陣為對稱負定陣;
(4)非唯一性。
注意:協方差函數和相關函數——度量兩個不同事件(Xt,Yt)彼此之間的相互影響的程度。
自協方差函數和自相關函數——度量用一事件(Xt)在兩個不同時期之間的相互影響的程度。
三、樣本估計值
總體均值的估計值:
延遲k自協方差函數的估計值:
總體方差的估計值:
延遲k自相關函數的估計值:
文檔
四、平穩性檢驗
(1)時序圖檢驗
若無明顯的趨勢性和周期性,則平穩;
(2)自相關圖檢驗
零均值平穩序列的自相關函數要么截尾要么拖尾;若時間序列零均值化后出現緩慢衰減或周期性衰減,則說明存在趨勢性和周期性(非平穩);
(3)單位根檢驗就是通過檢驗時間序列自回歸特征方程的特征根是在單位圓內(平穩)還是在單位圓及單位圓外(非平穩)。通常用ADF檢驗法。
Dickey和Fuller (1979)利用如下的廣義自回歸模型
其中,Δxj,t表示x的一階差分;xj,t-1表示延遲一期;Δxj,t-k表示延遲k期再一階差分;εk,t表示擾動項。
上述回歸模型生成的xj,t-1的t值正好對應ADF統計量,做假設檢驗:H0: 非平穩;H1:平穩。t值在1%, 5%, 10% 置信水平的臨界值分別為:-3.524233, -2.902358, -2.588587. 以此判斷序列是否平穩。
文檔
注:若Xt不平穩,可以依次對Xt做一階、二階…差分,直到序列平穩。
例1. 平穩性檢驗——ADF檢驗的SAS實現。
代碼:
data simulation;
do i=1 to 100;
x=rannor(1234);
output;
end;
run;
data timeries;
t simulation;
x_1st_lag= lag1(x);
x_1st_diff= dif1(x);
x_1st_diff_1st_lag= dif1(lag1(x));
x_1st_diff_2nd_lag= dif1(lag2(x));
x_1st_diff_3rd_lag= dif1(lag3(x));
x_1st_diff_4th_lag= dif1(lag4(x));
x_1st_diff_5th_lag= dif1(lag5(x));
run;
proc reg data=timeries;
model x_1st_diff = x_1st_lag
x_1st_diff_1st_lag
x_1st_diff_2nd_lag
x_1st_diff_3rd_lag
x_1st_diff_4th_lag
x_1st_diff_5th_lag;
run;
運行結果:
REG 過程
模型: MODEL1
因變量: x_1st_diff
讀取的觀測數
使用的觀測數
具有缺失值的觀測數
方差分析
100
94
6
文檔
源
模型
誤差
校正合計
自由度 平方和 均方 F 值 Pr > F
<.0001
6 111.38082 18.56347 15.25
87 105.88424 1.21706
93 217.26507
1.10320 R 方
均方根誤差
因變量均值
變異系數
0.5126
0.02507 調整 R 方 0.4790
4399.76165
參數估計值
變量
Intercept
x_1st_lag
x_1st_diff_1st_lag
x_1st_diff_2nd_lag
x_1st_diff_3rd_lag
x_1st_diff_4th_lag
x_1st_diff_5th_lag
自由度 參數估計值
1
1
1
1
1
1
1
-0.01634
-0.70975
-0.26217
-0.15780
-0.01973
0.07067
0.00340
標準誤差 t 值 Pr > |t|
0.8866
0.0011
0.1759
0.3806
0.9040
0.6134
0.9745
0.11418 -0.14
0.20949 -3.39
0.19212 -1.36
0.17907 -0.88
0.16308 -0.12
0.13938 0.51
0.10591 0.03
x_1st_lag的t值 = -3.39 < t0.05=-2.902358, (或從P值 =
0.0011 < 0.05判斷)故拒絕原假設H0,即序列平穩。
五、純隨機性檢驗
若序列值彼此之間沒有任何相關性,即過去的行為對未來的發展沒有絲毫影響,此時稱為純隨機序列。
從統計分析的角度而言,純隨機序列是沒有任何分析價值的序列。因此,為了確保平穩序列還值不值得分析,還需要對平穩序列進行純隨機性檢驗。
1. 純隨機序列(白噪聲序列)
文檔
若對任取的時間t和s,時間序列Xt滿足:
(1)E(Xt) = μ;(常數均值)
(2)r(t,s) =σ2, 若t=s;(方差齊性)
(3)r(t,s) =0, 若t≠s. (純隨機性)
則稱Xt為純隨機序列或白噪聲序列(白光具有該特性),簡記為Xt~WN(μ, σ2)。白噪聲序列是最簡單的平穩時間序列。隨機生成的1000個服從標準正態分布的白噪聲序列觀察值:
2. 純隨機性檢驗
Barlett證明:n個觀察值的純隨機時間序列,延遲為k(≠0)的自相關函數ρ(k) 近似服從正態分布N(0,1/n).
由此可以構造QBP統計量(適合樣本數n≥50)和QLB統計量(適合小樣本)來檢驗序列的純隨機性:
文檔
再做假設檢驗:
H0: ρ(1)= ρ(2)=…=ρ(m),即延遲≤m的序列之間相互獨立;
H1: 至少有一個ρ(k)≠0,即延遲≤m的序列之間有相關性。
注:m一般取值為6、12。這是因為平穩序列通常具有短期相關性,只要序列時期足夠長,自相關系數都會收斂于零。
例2. 數據如下表,時間間隔為天,起始時間自定義。
10
14
33
26
9
16
15
18
33
21
11
8
10
3
12
17
17
8
10
9
19
19
12
7
12
11
16
13
8
12
10
10
19
20
14
6
7
6
19
24
14
10
7
12
12
12
12
8
10
14
34
6
5
10
14 8
10 25
15 36
14 6
8 10
5
17
29
29
12
3
(1)判斷該序列xt的平穩性及純隨機性;
(2)判斷xt的一階差分yt的平穩性及純隨機性。
代碼:
data datas1;
input x_t @@;
time=intnx('day','01jan2014'd,_n_-1);
format time monyy.;
cards;
10 15 10 10 12 10 7 7 10 14 8 17
14 18 3 9 11 10 6 12 14 10 25 29
33 33 12 19 16 19 19 12 34 15 36 29
26 21 17 19 13 20 24 12 6 14 6 12
9 11 17 12 8 14 14 12 5 8 10 3
16 8 8 7 12 6 10 8 10 5
;
run;
proc gplot data = datas1;
plot x_t*time;
symbol i=join v=star cv=red ci=green;
文檔
run;
proc arima data = datas1;
identify var=x_t nlag=24;
run;
data datas2;
t datas1;
y_t = dif1(x_t);
run;
proc gplot data = datas2;
plot y_t*time;
symbol i=join v=star cv=red ci=green;
run;
proc arima data = datas2;
identify var=y_t nlag=24;
run;
運行結果:
從時序圖看,Xt有明顯的周期性和遞增遞減趨勢,故不平穩。
文檔
從ACF圖看,Xt的自相關系數遞減到零的速度相當緩慢,在很長的延遲時期里,自相關系數一直為正,而后又一直為負,故判斷該序列非平穩。
白噪聲的自相關檢查
至滯后 卡方 自由度 Pr > 卡方
6
12
18
24
自相關
6 64.02
12 88.98
18 96.32
24 137.26
<.0001 0.506 0.539 0.374 0.291 0.258 0.148
<.0001 0.270 0.186 0.178 0.258 0.207 0.226
<.0001 0.138 -0.027 -0.053 -0.112 -0.139 -0.155
<.0001 -0.145 -0.284 -0.229 -0.306 -0.211 -0.313
延遲為6、12的檢驗P值均小于0.05,故拒絕原假設,認為Xt為非純隨機序列(非白噪聲序列)。
文檔
Yt的時序圖波動范圍有界且沒有明顯的周期性、遞增(遞減)趨勢,故可以初步判斷該序列平穩。
從ACF自相關圖看,延遲1階后的樣本自相關系數很快衰減到零附近,且1階后的樣本自相關系數均落在了兩倍標準誤的范圍之內,且在零值附近波動,故可認為Yt平穩。
文檔
白噪聲的自相關檢查
至滯后 卡方 自由度 Pr > 卡方
6 29.46
12 35.94
18 38.61
24 57.43
6
12
18
24
自相關
<.0001 -0.529 0.195 -0.080 -0.059 0.092 -0.256
0.0003 0.216 -0.075 -0.070 0.101 -0.048 0.104
0.0032 0.075 -0.142 0.045 -0.032 -0.026 -0.022
0.0001 0.173 -0.214 0.129 -0.158 0.195 -0.165
延遲為6、12的檢驗P值均小于0.05,故拒絕原假設,認為為非純隨機序列(非白噪聲序列)。
Yt
本文發布于:2024-02-13 21:53:08,感謝您對本站的認可!
本文鏈接:http://m.newhan.cn/zhishi/a/1707832388248873.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:SAS學習系列37.時間序列分析報告Ⅰ—平穩性及純隨機性檢驗.doc
本文 PDF 下載地址:SAS學習系列37.時間序列分析報告Ⅰ—平穩性及純隨機性檢驗.pdf
| 留言與評論(共有 0 條評論) |