2024年2月15日發(作者:中國移動面試)

第47卷第3期Vol.47
No.3?人工智能與模式識別?計算機工程2021
年
3
月Computer
Engineering文章編號:1000-3428
(2021)
03-0053-09文獻標志碼:AMarch
2021中圖分類號:TP301.6基于SVD和ARIMA的時空序列分解與預測楊立寧,李艷婷(上海交通大學機械與動力工程學院,上海200240)摘要:針對傳統時空序列建模過程中估計空間權重矩陣時難度較高的問題,提出一種基于奇異值分解(SVD)的
時空序列分解模型ST-SVDo對原始時空序列矩陣進行平穩性檢測并中心化為零均值平穩時空序列,在假設時間
和空間沒有交互作用的前提下,利用SVD技術將時空序列分解為空間模式、時間模式以及模式強度的乘積,通過
ARIMA模型對平穩的時間模式進行建模并得到其預測結果,在此基礎上,將時間模式的預測結果與分解得到的空
間模式相結合,利用SVD技術對真實的時空序列進行重建,得到各個空間點的最終預測結果。實驗結果表明,與
ARIMA、Lasso-VAR、LSTM和STARMA模型相比,ST-SVD模型的訓練時間成本降低50%以上,預測精度提升10%
以上,其在實際工程應用中能夠有效完成時空序列預測任務。關鍵詞:時空序列預測;奇異值分解;STARMA模型;VAR模型;長短時記憶網絡;基站流量開放科學(資源服務)標志碼(OSID):
||||中文引用格式:楊立寧,李艷婷.基于SVD和ARIMA的時空序列分解與預測[J].計算機工程,2021,47(3):53-61.
英文弓I
用格式:YANG
Lining,
LI
Yanting.
Spatio-temporal
quence
decomposition
and
prediction
bad
on
SVD
and
ARIMA[
J].Computer
Engineering,2021,47(3):-Temporal
Sequence
Decomposition
and
Prediction
Bad on
SVD
and
ARIMAYANG
Lining,LI
Yanting
(
School
of
Mechanical
Engineering,Shanghai
Jiao
Tong
University,Shanghai 200240,China)[Abstract]
To
address
the
difficulty
of
estimating
the
spatial
weight
matrix
in
the
traditional
spatial-temporal
quence
modeling
process,this
paper
propos
a
spatial-temporal
quence
decomposition
model,ST-SVD,bad
on
singular value
original
spatial-temporal
quence
matrix receives
the
stationary
test
and
is
centralized
into
a
zero-mean
stationary
spatial-temporal
,assuming
that
there
is
no
interaction
between
time
and
space,the
spatial-temporal
quence
is
decompod
into
the
product
of
the
spatial
pattern,the
temporal
pattern,and
the
pattern
the
ARIMA
model
is
ud
to
model the
stable
time
pattern
and
get
the
prediction
result
of
the
time
this
basis,
the
prediction
result
of
the
time
pattern
is
combined
with
the
spatial
pattern
obtained
from
the
real
spatial-temporal
quence
is
reconstructed
by
using
the
singular
value
decomposition
technique
to
obtain
the
final
prediction
results
of
each
spatial
experimental
results
show
that
compared
with the
ARIMA, Lasso-VAR,
LSTM
and
STARMA
models,
ST-
SVD
reduces
the
model
training
time
cost
by
more
than
50%,
while
improving
the
prediction
accuracy
by
over
10%.It
can
efficiently
complete
the
prediction
of
spatial-temporal
quence
in
actual
engineering
applications.[Key
words] spatio-temporal
quence
prediction;
Singular
Value
Decomposition(SVD)
;
STARMA
model;
VAR
model;
Long
and
Short
Term
Memory(
LSTM)
network;
ba
station
trafficDOI:
10.
19678/j.
issn.
1000-3428.
00568850概述時空數據是指同時具有時間和空間維度的數
據[11,傳感器、移動電話、射頻識別(RFID)和智能電
網等智能設備的發展促進了實時時空數據流的采基金項目:國家自然科學基金(71672109)o集。考慮一個時空隨機過程,時空建模的目標是基
于時空數據構建時空模型以對給定時刻所有位置的
行為進行預測[21o若不考慮時間因素,可以采用單
純的空間模型進行建模,如kriging方法[31,但是其準
確性較低,添加時間維度可以提高預測的準確性。
作者簡介:楊立寧(1994-),男,碩士研究生,主研方向為時空序列建模、高維時空數據統計與建模;李艷婷(通信作者),副教授、博士收稿日期:2019-12-12
修回日期:2020-01-29
E-mail:
*************
54計算機工程2021年3月15日隨著時空數據流采集難度的降低,時空序列建模逐
漸成為學者們的研究熱點之一。目前,關于時空序列預測主要分為基于物理模
型、基于統計模型和基于機器學習的3種方法。基
于物理模型的方法首先對時空序列的機理進行研
究,尋找其內在的系統動力學規律并構建系統動力
學模型,然后對時空序列進行表達進而預測。其中,
JONES等人[41提出隨機偏微分方程以描述連續型時
空隨機過程。
基于統計模型的方法主要分為描述型
時空模型和動態時空模型兩類。前者利用統計學中
的描述型統計量表達時空模型的性質,并對統計量
進行建模以消除隨機誤差;后者考慮時間和空間的
自相關性并利用過去和其他地區的數據對當前數據
進行建模,然后實現迭代更新預測。近年來,隨著機
器學習和深度學習的不斷發展,人工智能技術被廣
泛應用于時空序列建模和預測任務。通過機器學習
模型能夠提取時空序列中復雜的特征模式,也可以
對高維時空序列進行降維和聚類從而使得分析更
簡便。本文提出一種分離時空數據中的時間模式和空
間模式并分別建模的方法。對原始數據進行平穩性
檢驗并中心化,利用奇異值分解(SVD)分解中心化的
數據集,通過時間序列模型中經典的ARIMA模型對
時間模式建模并檢驗其有效性,然后利用ARIMA模
型預測時間序列,將預測結果與空間模式相結合并
對真實時空序列進行重建,以得到各個地理觀測點
的預測值。1相關工作描述型時空模型較早以時空協方差為研究對
象,通過對樣本協方差值進行曲面擬合獲得協方差
函數,然后利用協方差函數分析時空模式的演變。
時空kriging方法[5-71基于時空過程的協方差函數給
出未知地區給定時刻的最優線性無偏估計。但是,
由于時空協方差是一種描述型統計量,很難解釋時
空模式的內在動態變化。
描述型時空模型在數學上
更通用,但是動態時空模型在科學上有更強的解釋
性[81。動態時空模型基于條件概率分布進行建模,
其中最主要的動態時空模型為層次時空模型。
層次
時空模型可分為2個主要類別:一類是經驗層次模
型,其認為觀測到的時空過程是真實時空過程的演
變以及真實過程通過某種函數作用產生觀測過程,
其機制類似于隱馬爾可夫過程;另一類是貝葉斯層
次模型,和經驗層次模型的主要區別在于,貝葉斯層
次模型認為真實過程中的參數也是動態變化的,其
在經驗層次模型的基礎上增加了底層的參數過程,
因此,貝葉斯層次時空模型將時空序列過程分解為
參數過程、真實過程和數據過程3個層次并分別
建模[8-101o無論經驗層次模型還是貝葉斯層次模型,真實
過程都是最重要的,其對理解時空動態變化模式具
有重要意義。因此,時空模型的一個研究重點在于
真實過程的模型構建。
統計時空模型的構建主要來
源于時間模型和空間模型的結合。CLIFF和0RD較
早將時間序列模型應用于空間分析中,提出空間自
回歸模型(SAR)、空間移動平均模型(SMA)和空間
回歸模型(SR)等[111。MARTIN和OEPPEN將空間
信息整合到傳統的ARIMA模型[121中,提出STARMA
模型[121。STARMA定義了空間階次的概念并在真實
應用中產生了良好效果[13-151
o但是,隨著時空數據的
概念外延,STARMA模型中關于歐式距離越小則空
間階次越低的假設越來越難以滿足,使得其在一些
未知空間相關性結構的數據集中表現較差。BESSA
等人結合其他地區的歷史數據和待預測地區的數
據,構建向量自回歸模型VAR[161以對時空序列進行
建模描述。但是,VAR模型中的待估計參數空間較
大,一方面需要消耗極大的計算資源,另一方面可能
由于樣本量不足而引起過擬合問題。因此,基于
Lasso的VAR(Lasso-VAR)模型被廣泛應用[171,盡管
Lasso-VAR在一定程度上解決了模型過擬合問題,
但是其優化模型變得更難求解,計算成本過高。BAHADORI等人[181通過將時空數據作為張量
進行處理,提出一種低秩張量學習框架以進行多元
時空序列分析。BAROCIO等人[191通過動態模式分
解的方式對時空數據進行降維并提取時空特征。
LI[t1
利用梯度提升回歸樹
/
Gradient
B
oosting
Regression
Tree,GBRT)算法對城市共享單車的時空數據進行
建模并預測數量。在深度學習方法中,遞歸神經網
絡 /
Recurrent
N
eutral
N
etwork,
RN
N)和深度神經網
絡(Deep
Neutral
Network,DNN)被廣泛應用于時空
序列模型構建任務。SHI[211利用RNN模型的一個變
體,即長短時記憶(Long
and
Short
Term
Memory,
LSTM)
網絡對地區的降雨量進行預測。CHE等人[221將傳統
的RNN拓展到時空領域,提出時空遞歸神經網絡
(
Spatio-Temporal
Recurrent
Neural
Network,
ST-RNN),
以對時空序列進行建模預測。類似地,在深度學習
方面,ZHANG等人[231將深度殘差網絡拓展到時空領
域,提出時空深度殘差模型(ST-ResNet)以對人流量
進行預測。2算法描述2.1時空數據的奇異值分解SVD是一種矩陣分解技術,其在信號處理和統
計學中有很多應用[241o給定一個秩為l的時空數據
矩陣Yd
x
T,其中,D表示空間中觀測點的個數,表示
第47卷第3期楊立寧,李艷婷:基于SVD和ARIMA的時空序列分解與預測55采樣時間點的個數。時空數據矩陣Ydxt的奇異值分
解如下:Y
=
USV'
=
s1
u
1
v
1
+
s
2
u
2
v2
+
—+
sl
u
l
v
(
1)其中,U
=
(u
1,
u2,
—,
uj,
V
=
(v
1,
V2,
—,
vl),S
=
diag{sn
s2, —,
sl},且
s
1》s2》…》sl
A
0o
向量
u(i
=
1,
2,…,l)
是左奇異矩陣的列向量,向量vXi
=
1,
2,…,l)是右奇
異矩陣的行向量,標量亠稱為奇異值。假設{c”:”
=
1,2,
—,
T}是矩陣Yd
x
T的列向量,”
代表給定的m時刻D中所有空間單元的觀測值,YY'
表達了
D空間單元之間的相關性,這里假定Ydxt已
經去中心化為零均值矩陣。矩陣Ydxt的ui事實上是
相關矩陣YY'的特征向量,u
1表示相關矩陣YY'對應
特征值最大的特征向量,包含了空間相關性最多的
信息量,或被稱為“空間模態”,表征了空間相關性的
模式。u
i的第j個分量Uj表示第j地區對第i空間模
態的“貢獻”。類似地,假定{r”:”
=
1,鳥,…,。}是矩
陣Yd
x
t的行向量,”代表”位置在整個時間段的觀測
值向量,Y
'Y表達了不同時刻之間的相關性,矩陣
Yd
x
T的v:事實上是相關矩陣Y
'
Y的特征向量,1表示
相關矩陣Y'Y對應特征值最大的特征向量,包含了
時間相關性最多的信息量,或被稱為“時間模態”,表
征了時間相關性的模式。r;的第j個分量rj表示第
j時刻對第i時間模態的“貢獻”。時空矩陣Yd
x
T分解
后的S是奇異值矩陣,i表示模式i的重要程度,例
如,若s
1是最大的奇異值,則s
1對應的模式1具有表
征空間模式的最重要的特征。2.2基于SVD的時空序列模型給定歷史時空數據矩陣Yd
x(t
-1),對當前時刻t的
各個地理觀測點進行預測的具體步驟如下:步驟1通過SVD對中心化后的時空矩陣進行
分解。假定歷史時空數據矩陣Ydx(t-1)的秩為l,可利用
式(1)得到如下分解:YD
x
(t
-
1)
=
s 1
u 1
vj
+
s2
u
2 v2 +
…+
slu
l
v'l
(2)SVD有一個重要的性質,定義奇異值占比Er
=
還£r
=
si」,則當r
<<
l時,可達到85%以上的水平,剩余
£=
sii
=
1的可認為是噪聲。因此,通過選取前幾個奇異值與
對應的左奇異向量和右奇異向量進行重建,可以對
矩陣實現降噪,如下:YD
x
(t
-
1)
=
s 1
u 1
v1
+
s2
u
2 v2 +
…+
Sr
u
r
v'r
(3)步驟2通過ARIMA[251對時間模式進行建模預測。由于分解之后得到的右奇異向量v:可以看作時
間序列,因此本文利用時間序列中應用最廣泛、效果
最好的ARIMA模型進行建模。ARIMA的標準模型
如下:V"vi,
t
=
P
+
01V"vi,
t-1
+
…+
0p
V"vi,
t-p +
£t
-01
£t
-
1
Oq
£t
-
q
(4)其中,VdVi,,代表t時刻第i個向量的d階差分,t是t時
刻均值為0的隨機誤差,“、0(i
=
1,2,
—,p)=
1,2,
—,
q)為待估計參數。利用AIC、BIC信息準則和
最大似然法進行模型選擇和估計,當得到估計好的
模型后,利用該模型進行h步向前預測,如下:vi,
t+h
=
01V"vi,
t+h-1
+
…+
0p
V"vi,
t+h-p +
£t
-01
£t
+
h
- 1
----------0q
£t
+
h
-
q
(5)步驟3利用SVD進行重建得到h步向前預測
結果。當得到時間模式的估計值后,利用已經存儲的
奇異值和對應的左奇異向量重建時空矩陣,得到最
終預測結果:Yt
+
h
=
s
1
u
1
v1
t
+
h
+
s2
u
2
v2,
t
+
h
+
…+
sr
u
r
v'r.
t
+
h
(6)2.3模型優化模型優化包括奇異值選擇和ARIMA模型參數選
擇過程。針對奇異值選擇,不同的奇異值個數重建的
矩陣精度不同,通常情況下,利用前幾個較大奇異值即
可基本重構原始時空矩陣,剩余奇異值可理解為由數
據波動形成的噪音。本文通過遍歷的方式驗證了不同
的奇異值個數對最后效果的影響,最終設定對前2個
奇異值對應的時間模式進行建模。
針對時間模式
ARIMA模型的構建,首先需要對時間模式的平穩性進
行檢驗,若不平穩,需要將其轉化為平穩模式并在后續
模型中逆推回真實預測結果;當數據平穩性檢驗通過
后,利用ARIMA模型對平穩時間模式進行建模,并利
用ACF和PACF圖[251確定ARIMA模型中的p、d和q參
數取值;最后通過交叉驗證以及信息準則AIC、BIC[261
對模型有效性進行檢驗并選擇最優模型,在檢驗通過
后,利用得到的ARIMA模型完成預測。本文所提ST-
SVD算法描述如算法1所示,算法流程如圖1所示。算法1
ST-SVD算法輸入時空矩陣Yd
y_1),預測步長l輸出D個基站的l步預測值1.
給定奇異值分解的閾值thre(本文設定為85%)2.
對丫。*
“
-
1)進行奇異值分解,得到U、S和V3.
利用閾值thre(85%)選擇U、S和V中的有用成分4.
通過ARIMA模型對選定的V進行建模并根據AIC、
BIC選定最優ARIMA模型5.
利用最優ARIMA模型進行l步預測6.
將預測結果與選定的U、S進行乘積,重建D個基站的
預測值
56計算機工程2021年3月15日訓練集:前160
h數據測試集:后56
h數據模型訓練模型測試與性能比較根據訓練得到的ARIMA模型
對后續時間行為進行預測1訓練數據集~、奇異值分解右奇異矩陣F奇異值的累積
比重超過85%r|奇異值個數選擇|利用左奇異矩陣和選擇的
奇異值重構時空矩陣得到
預測結果K+i通過Bootstrap
提高預測精度模型評估,并與其他4種模型
進行比較(ARIMA、Lasso-VAR、
LSTM>
STARMA)利用
ARIMA
對右奇異
矩陣的每
一個時間
向量進行建模參數選擇方法:AIC、BIC信息準則I
ARIMA
模型
輸出模型評估結果
(指標為RMSE和MAE)圖1
ST-SVD算法流程Fig.1
Procedure of
the
ST-SVD
algorithm3案例分析3.1數據集描述本文利用中國某大型城市的2
333個基站在
216
h(共9天)內的流量數據對所提ST-SVD算法進
成訓練集和測試集,訓練集包含前160
h的數據,測試集包含剩余56
h的數據行驗證,數據的采集頻率為1次/ho圖2所示為
2
333個基站的相對位置布局,經緯度已經過處理,
—T表1所示為其中5個基站在13
h內的流量數據示例。
圖3所示為3個基站在216
h內的流量變化情況,從
圖3可以看出,基站3具有較明顯的9個峰,表明基
站流量的變化基本以一天為周期,雖然另外2個基
站中基站1也存在較類似的峰值,但是兩者的整體
變化有較大差異。本文將216
h內的流量數據拆分圖2
2 333個基站的布局Fig.2
Layout of
2
333
ba
stations
第47卷第3期楊立寧,李艷婷:基于SVD和ARIMA的時空序列分解與預測表1
5個基站的部分歷史流量數據片段Table 1
Partial
historical traffic data
fragments
of
five
ba
stations
57Kb日期時間13:00:0014:00:0015:00:0016:00:00基站
125
649基站
2262
041基站
3166
052206
333183 292基站
4223 005221
221235
454186
324基站
5469
4265
5852
91668126418
402312
000288
882206
590163
356677
779691
959559
721173 216136
5432014-03-0117:00:0018:00:0019:00:00109
47197
08154
12914
7258
119395
681356
533273
781125 79985
984117
155153
35217
87016
06620:00:0021:00:0010
1083
09033150
000流量的時空數據,距離越近相關性越大的假設并不
40
000§
30
000麗
20
00010
000成立。時間/h(a)基站1圖4時間相關性矩陣Fig.4
Time
correlation
matrix時間/h(b)基站2350
000300
0005
250
000益 200
000J!
150
000100
00050
000圖3
3個基站在9天內的流量情況Fig.3
Traffic
situation
of
three
ba stations
in nine
days圖5相關性與空間距離的散點圖Fig.5
Scatter
plot
of
correlation
and
spatial
distance3.2
ST-SVD模型構建ST-SVD模型構建步驟如下:步驟1通過奇異值分解對中心化后的時空矩
圖6所示為排序后的奇異值,一般而言,前幾個
奇異值即可涵蓋大部分信息。從圖6可以看出,前2個奇異值占據了奇異值之和的89%,因此,本文分
陣進行分解。在本案例中,時空矩陣Y的大小是
2
333x160,在進行數據預處理(異常值處理、平穩性
別構建一個奇異值的重建算法ST-SVD(1)和兩個奇
異值的重建算法ST-SVD(2)。1412處理)之后,通過對處理后的Y進行奇異值分解,得
到左奇異矩陣、右奇異矩陣和奇異值。圖4所示為
截取的時空矩陣Y的右奇異矩陣,即時空序列的時
o
10間模式,此處截取了一天內每個小時之間的相關性
情況,黃色區域表明相關性較強(彩色效果見《計算
機工程》官網HTML版),從圖4可以看出,時間相關
1
……““
”"M性具有較明顯的周期模式,并且可預測性較強。圖5
所示為時空矩陣Y中不同地點的皮爾遜相關系數與
索引圖6降序排列的奇異值距離之間的關系,從圖5可以看出,針對該區域基站
Fig.6
Singular values
of descending
order
58計算機工程2021年3月15日表2模型擬合程度指標Table
2圖7、圖8分別對應前2個奇異值的左奇異矩
陣(空間模式)和右奇異矩陣(時間模式)。從中可
以看出,空間模式較為復雜,沒有明顯規律,但是時
vIndex of
model
fitting
degreeMAE0.010.00
RMSE0.020.01AICBIC-771.60間模式顯示出
明顯的周期性和可預測性。
因此,
本
文利用ARIMA模型分別對2個時間序列進行建模
v1-780.81卩2-1
143.43-1
118.83并預測。RMSE和MAE[271的計算公式分別如下:RMSE
=
J
D
f
f
(幾
7)
it(9)MAE
=
D(10)步驟3利用境異值分解進行重建得到h步向
前預測結果。在得到t時刻時間模式的預測值v
1
t和
v,
t后,即可利用式(1)結合左奇異矩陣和奇異值重建
時空矩陣,得到t時刻空間各個位置的預測值。考慮
f
f
幾-幾
Fig.7
Left
singular
matrix0.2_0
2_____i______i______i_____i______i______i______i______i'0
20
40
60
80
100
120
140
160時間/h圖8右奇異矩陣Fig.8
Right
singular
matrix步驟2通過AIC和BIC信息準則(表2)選擇
ARIMA模型中的pd參數并得到下述結果:vit
=-0.072
6
+
1.635
1
v-0.5319
v、一2
-0.1964
V—
+
0.1509 e,
_
1
-0.545
0e一2
-
0.369
1
et-3
、、、(7)v2,
t
=
1.263
5
v2,
t-1
+
0.263
5
v?,t_2
+0.721
1
et
-1
-
0.721
1
et
-
2
(8)到流量的周期性一般為一天,因此,本文利用
ARIMA模型分別向前1步、向前6步、向前12步和向
前24步進行預測,并利用Bootstrap[281從2
333個基
站中抽取不同的樣本量,從100次實驗中取均值作
為最終結果,以評估算法在整個周期內不同預測長
度下的準確度和預測性能。3.3模型性能比較本文將ST-SVD(1)、ST-SVD(2)與現有常用的
ARIMA、Lasso-VAR,
LSTM
和
STARMA
4
種
模型進
行對比。其中,ARIMA模型并不是時空序列模型,
但是在不考慮空間觀測點的相關性時時空序列變成
獨立的多個時間序列,可以分別利用ARIMA進行建
模預測。ARIMA模型時間成本極高,但是可作為一
種基線模型進行對比。Lasso-VAR是帶有Lasso正
則化約束的VAR模型,其認為時空模型是時間序列
模型加空間維度,即增加一維,然后通過傳統的VAR
模型并添加Lasso正則化來降低過擬合風險。LSTM
是遞歸神經網絡的變體,適用于時間序列,其與VAR
類似,將時空數據集的空間維度疊加到時間序列中
進行訓練預測。STARMA模型是經典的時空分析模
型,本文采用歐氏距離定義模型中的空間權重矩陣。
實驗過程中使用的軟件、軟件依賴包信息以及模型
關鍵參數如表3所示。表3實驗過程中的軟件、軟件依賴包以及模型關鍵參數信息Table
3
The
software
‘software
dependency packages
and
key
parameters
information
of
the
model
during
the
experiment模型軟件R語言R語言R語言軟件依賴包forecastforecastforecast關鍵參數奇異值個數ST-SVD(1)ST-SVD(2)ARIMAARIMA模型參數p,q,ARIMA模型參數p,q,Lasso-VARMATLABPythoncvxkeras,tensorflow,pandas,numpy懲罰系數,模型階數,系數矩陣網絡層數,隱含層神經元個數LSTMSTARMAR語言starma空間權重矩陣,AR和MA階數利用10個、20個、50個和100個基站160
h內的
數據分別對上述6種模型進行訓練,并給出向前
1步、6步、12步和24步的預測結果,利用常見的預
測精度指標一均方根誤差RMSE和絕對值誤差
MAE對預測性能進行評估。由于本文案例中共有
2
333個基站,為了提高性能評估的準確性并降低
方差,通過Bootstrap在2
333個基站中隨機選取上
述10個、20個、50個和100個基站100次,并對
100次的實驗結果取平均值以作為最終的性能評估
結果。
第
47
卷
第
3
期楊立寧,李艷婷:基于SVD和ARIMA的時空序列分解與預測59表4所示為上述6種模型向前1步的部分預測
結果,加粗數字為最優預測結果,括號中的百分數表
示預測百分比誤差,計算公式如式(11)所示,表示
預測值,表示真實值。型需要足夠多的樣本來提高精度;STARMA模型優于
不添加空間信息的ARIMA模型;ST-SVD的2種模型
相較于其他4種模型預測準確率更優。具體地,利用
2個奇異值的ST-SVD(2)模型的預測誤差約為0.13,
y
-
y
error
=--------
11y()ARIMA丄asso-VAR丄STM和STARMA的誤差分別
約為
0.22、0.21、0.92和
0.19。ST-SVD(1)和
ST-SVD(2)
從表4可以看出:LSTM模型的預測精度最差,原
因是其數據量過少,模型欠擬合,這表明神經網絡模
明顯優于其他4種對比模型且ST-SVD(2)優于ST-
SVD(
1)。表4
6種模型的1步預測結果Table
4
One-step
prediction
results
of six
models序號真實數據ST-SVD(1)221
879(0.15)ST-SVD(2)218
495(0.17)150
575(0.09)ARIMALasso-VARLSTM24
386(0.91)STARMA12262
041166
052223
006469
427176
025(0.33)135
693(0.18)141 907(0.36)199
551(0.24)156
520(0.06)161
877(0.27)189
318(0.28)144
980(0.13)149
596(0.11)190
603(0.17)15
816(0.90)24
490(0.89)24
074(0.95)21
181(0.93)34193
918(0.15)401
761(0.14)159
213(0.29)403
218(0.14)258
275(0.19)708
781(0.23)564
155(0.16)1
056
788(0.13)826
613(0.21)360
880(0.23)225
828(0.27)377
502(0.20)239
820(0.22)708
834(0.23)509
532(0.24)372
671(0.21)237
912(0.23)830
233(0.10)610
391(0.09)1
034
435(0.15)567307
348915
579670
7361 212 8401
050
55526
273(0.17)745
144(0.19)626
856(0.07)811
109(0.11)35
440(0.96)30
228(0.95)22
153(0.98)26
960(0.97)27
723(0.80)599
095(0.11)1
085
398(0.11)886
153(0.16)98
968(0.30)89101
119
314(0.08)974
010(0.20)881
768(0.16)124
619(0.12)831
411(0.21)903
549(0.14)107
845(0.24)0.19141
078—123
028(0.13)0.16108
754(0.23)0.21平均誤差0.130.220.92表5所示為上述6種模型在4種不同基站個數以
及4種不同預測步長情況下的RMSE,括號中為MAE。
對比模型,而且ST-SVD(2)的重構結果稍優于ST-SVD(
1)
的重構結果。從圖9、圖10可以直觀地看出,2種ST-SVD
模型的誤差低于其余4種對比模型。從表5可以看出,ST-SVD模型的性能明顯優于其余4種
表5 6種模型在不同基站個數與預測步長情況下的實驗結果Table
5
Experimental
results
of
six
models under
different
number
of
ba
stations
and
different
prediction
step
size預測步長基站數ST-SVD(1)109.31(84.21)ST-SVD(2)85.63(70.38)ARIMALasso-VAR67.21(54.27)125.37(97.29)LSTMSTARMA102083.26(75.15)134.29(101.44)125.34(81.21)102.21(67.23)341.56(218.38)346.25(221.30)282.31(172.35)231.55(140.64)293.53(180.42)294.82(187.31)245.19(152.76)200.37(126.38)255.37(161.36)231.43(161.28)211.57(131.65)112.35(73.17)162.84(121
.07)92.41
(78.23)125.31
(86.57)117.28(63.85)97.34(71.11)76.31(61.35)60.21(41.80)55.73(33.48)1步5081.70(51.65)65.37(38.12)207.32(101.21)147.34(102.54)162.54(120.02)213.39(100.62)232.41(117.34)232.36(140.37)242.28(190.21)352.17(210.56)284.31(177.48)275.13(175.39)239.25(166.18)309.12(192.31)300.51(200.34)232.49(148.12)212.43(136.76)76.21
(51 .31
)98.53(66.21
)10096.32(56.29)10206步202.31(100.42)191.42(98.45)162.74(86.34)135.75(74.41)234.65(108.28)226.52(249.56)312.84(152.37)317.47(138.19)263.16(80.74)188.94(100.43)162.25(90.23)143.89(76.45)50195.62(108.54)103.43(75.48)100217.65(94.31
)1020180.17(101.21)176.34(103.45)151.32(86.23)126.18(73.23)143.25(80.21)135.66(76.12)118.15(68.19)101.32(57.38)173.23(102.34)163.41(95.37)146.25(84.38)120.34(67.89)132.71(75.19)127.25(73.27)114.28(63.15)414.35(232.54)412.35(248.21
)334.52(200.98)240.17(145.29)265.37(172.53)234.04(1
53.42)12步50253.49(137.68)215.91(113.18)273.48(145.81
)1001020390.21
(241
.52)431.21(282.49)365.18(231.06)245.10(151.25)253.65(132.18)228.63(117.35)192.31(108.73)24步5010095.12(55.31)174.67(109.21)
60計算機工程2021年3月15日(a)向前1步預測(b)向前6步預測基站數(c)向前12步預測(d)向前24步預測圖9
6種模型在不同基站個數與預測步長下的RMSEFig.9
RMSE
of
six
models under
different
number
of
ba stations
and
different
prediction
step
size-e-ST-SVD(l)模型
-B-ST-SVD(2)癮型
Y-ARIMA
檯型
-A-Lasso-VAR
模型
*LSTM模型
4STARMA模型-e-ST-SVD(l)模型
-B-ST-SVD(2)欖型
Y-ARIMA
癮麺
-A-Lasso-VAR
模型
*LSTM模型
ASTARMA
模型基站數(a)向前1步預測-e-ST-SVD(l)模型
-B-ST-SVD(2)欖型
Y-ARIMA
穰型
蟲-Lasso-VAR模
型
*LSTM模型
-b-STARMA模型基站數(b)向前6步預測-e-ST-SVD(l)模型
-B-ST-SVD(2)欖型
-0-ARIMA
癮型
蟲-Lasso-VAR模
型
*LSTM模型
4STARMA模型基站數
(c)向前12步預測
基站數(①向前24步預測圖10
6種模型在不同基站個數與預測步長情況下的MAEFig.10
MAE
of six
models under
different
number
of
ba stations
and
different
prediction
step
size4結束語時空序列模型STARMA通過構建空間權重矩陣
來表征數據的空間相關模式,但是空間權重的構建大
多依賴距離等主觀性因素,導致STARMA難以適用于
多數數據集。本文建立一種新的時空序列模型ST-SVD,
其利用SVD技術對時空數據集的時間模式和空間模
式進行自動分解,通過ARIMA模型擬合時間模式并建
模預測,最終重建出時空預測結果。ST-SVD模型不需
要對數據集的空間結構進行假設,只需對時間序列實
現建模,大幅降低了問題復雜度和模型訓練成本。實
驗結果表明,ST-SVD模型的預測效果優于LSTM、
第47卷第3期楊立寧,李艷婷:基于SVD和ARIMA的時空序列分解與預測61STARMA等時空序列模型。但是,本文研究尚存在一
定不足,一是ST-SVD認為空間模式是時不變的,即空
間作用和時間作用相互獨立,二是在奇異值分解后的
時間序列建模中利用了較為傳統的ARIMA模型,該模
型是一種線性模型,無法捕捉到時間序列中的非線性
模式。下一步將利用機器學習、深度學習等技術對時
間模式進行建模,然后通過奇異值分解重建時空序列,
以解決上述問題。參考文獻[1
]
CRESS
IE
N,
WIKLE
C
K.
Statistics
for
spatio-temporal
data[M].
[S.
l.
]:
John
Wiley &
Sons,2015.[2
]
HUANG
H
C,
CRESSIE
N.
Spatio-temporal
prediction
of
snow
water
equivalent
using
the
Kalman filter
[
J].
Computational
Statistics
&
Data
Analysis,
1996,22(2):
159-175.[3
]
CRESSIE
N. The
origins
of
kriging
[J].
Mathematical
Geology,1990,22(3):239-252.[4
]
JONES
R
H,
ZHANG
Y
M.
Models
for
continuous
stationary
space-time
process
[M]//GREGOIRE
T
G.
Modelling
longitudinal
and
spatially
correlated
data.
Berlin,
Germany
:
Springer ,
1997
:
289-298.[5
]
MONTERO
J,
FERNANDEZ-AVILES
G,
MATEU
J.
Spatial
and
spatio-temporal
geostatistical
modeling
and
kriging[M].
[S.
l.
]:John
Wiley &
Sons,2015.[6
]
HOOPER
P
M,
HEWINGS
G
J
D.
Some
properties
of
space-time
process
[J].
Geographical
Analysis,
2010,
13(
3):
203-223.[7
]
OLIVER
M
A,
WEBSTER
R.
Kriging:
a
method
of
interpolation
for
geographical
information
systems
[J].
International
Journal
of
Geographical
Information
Systems
,
1990,
4(
3):
313-332.[8
]
CRESSIE
N,
JOHANNESSON
G.
Fixed
rank
kriging
for
very
large
spatial
data
ts[
J].
Journal
of
the
Royal
Statistical
Society:
Series
B(
Statistical
Methodology)
,
2008,70(1):209-226.[9
]
CRESSIE
N,SHI
T,KANG
E L. Fixed
rank
filtering
for
spatio-temporal
data[
J].
Journal
of
Computational
and
Graphical
Statistics,2010,19(3):724-745.[10]
NGUYEN
H,
KATZFUSS
M,
CRESSIE
N,
et
al.
Spatio-temporal
data
fusion
for
very
large
remote
nsing
datat[s
J]. Technometrics,2014,56(2) :
174-185.[11]
CLIFF
A
D,
ORD
J
K.
Space-time
modelling
with
an
application
to
regional
forecasting
[
J].
Transactions
of
the
Institute
of
British
Geographers
,1975(64):
119-120.[12]
MARTIN
R
L,
OEPPEN
J
E.
The
identification
of
regional
forecasting
models
using
space
: time
correlation
functions
[J].
Transactions
of
the
Institute
of
British
Geographers,1975(
66):
95-98.[13]
PATRICK
J
D,
HARVILL
J
L,
HANSEN
C
W.
A
miparametric
spatio-temporal
model
for
solar
irradiance
data]
J].
Renewable
Energy,
2016,87:
15-30.[14]
ANDRE
M,
DABO-NIANG
S,
SOUBDHAN
T,
et
tive
spatio-temporal
model
for
spatially
spar
global
solar
radiation
dat[a
J].
Energy,
2016,
111:
599-608.15]
ZHAO
Youlin,
GE
Liang,
ZHOU
Yijun,
et
al.
A
new
asonal
difference
space-time
autoregressive
integrated
moving
average
model
and
spatiotemporal
trend prediction
analysis
for
hemorrhagic
fever
with
renal
syndrome[
J].
PLoS
One,2018,13(11):518-526.[16]
BESSA
R
J,
TRINDADE
A,
MIRANDA
V.
Spatial-
temporal
solar
power
forecasting
for
smart
grids]
J].
IEEE
Transactions
on
Industrial
Informatics,
2015,
11
(1):
232-241.[17]
MESSNER
J
W,
PINSON
P.
Online
adaptive
lasso
estimation
in
vector
autoregressive
models
for
high
dimensional
wind
power
forecasting
[J].
International
Journal
of
Forecasting,
2019,35(
4)
:
1485-1498.[18]
BAHADORI MT,YUQ
R,LIU
Y.
Fast
multivariate
spatio-temporal
analysis
via
low
rank
tensor
learning
[
C]//
Proceedings
of Advances
in
Neural
Information
Processing
Systems.
Washington
D.
C.
,
USA:
IEEE
Press,
2014:3491-
3499.[19] BAROCIO
E,
PAL
B
C,
THORNHILL
N
F,
et
al.
A
dynamic
mode
decomposition
framework
for
global
power system
oscillation
analysis
[J].
IEEE
Transactions
on
Power
Systems,2015,30(6):2902-2912.[20]
LI
Yexin,
ZHENG
Yu,
ZHANG
Huichu,
et
al.
Traffic
prediction
in
a
bike-sharing
system[C
]//Proceedings
of
the
23rd
SIGSPATIAL
International
Conference
on
Advances
in
Geographic
Information
Systems.
New
York,
USA:ACM
Press,2015:33-39.[21]
SHI
Xingjian,
CHEN
Zhourong,
WANG
Hao,
et
al.
Convolutional
LSTM
network:a
machine
learning
approach
for
precipitation
nowcasting[EB/OL].[2019-11-10].
arxiv.
org/abs/1506.
04214.22]
CHE
Z
P,PURUSHOTHAM
S,CHO K,et
al.
Recurrent
neural
networks
for
multivariate
time
ries
with
missing
values
J].
Scientific
Reports,2018,8:6085-6090.[23]
ZHANG
J
B,
ZHENG
Y,QI
D
K.
Deep
spatio-temporal
residual
networks
for
citywide
crowd
flows
prediction[EB/
OL].[2019-11-10].
https
://arxiv.
org/abs/1610.
0
0081.24]
HOWARD
J
P.
Data-driven
modeling
&
scientific
computation:methods
for
complex
systems
&
big
data
EB/
OL].[2019-11-10].
www.
amazon.
com/Data-
Driven-Modeling-Scientific-Computation-Methods/dp/019
9660344.[25 ]
BROCKWELL
P
J,
DAVIS
R
A.
Fowcasting
techniques
[
M
]
//
S
HANMUG
AM
R.
Introduction
to
time
ries
and
forecasting.
Berlin,Germany:Springer,2016:309-321.26]
BURNHAM
K
P,ANDERSON
D
R.
Multimodel
inferenc[e
J].
Sociological Methods
&
Rearch,2004,33(2):261-304.[27]
WILLMOTT
C
J,MATSUURA
K.
Advantages
of
the
mean
absolute
error over the
root
mean
square
error
in
asssing
average
model
performanc
[e
J].
Climate
Rearch,2005,30: 79-82.[28 ]
RUBIN
D
B.
The
Bayesian Bootstrap
[J].
The
Annals
of
Statistics,1981,9(1):130-134.編輯吳云芳
本文發布于:2024-02-15 20:02:35,感謝您對本站的認可!
本文鏈接:http://m.newhan.cn/zhishi/a/1707998555249199.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:基于SVD和ARIMA的時空序列分解與預測.doc
本文 PDF 下載地址:基于SVD和ARIMA的時空序列分解與預測.pdf
| 留言與評論(共有 0 條評論) |