一種地表覆蓋時空變化的知識圖譜構建方法、裝置及設備與流程
1.本技術涉及地表覆蓋時空變化數據及知識圖譜技術領域,特別是涉及一種地表覆蓋時空變化的知識圖譜構建方法、裝置及設備。
背景技術:
2.地表覆蓋是指地球表面各種物質類型及其自然屬性與特征的綜合體,反映著地球表面物質類型的分布狀況和演化過程,是自然資源調查和生態環境研究的重要基礎數據。地表覆蓋的空間分布直接影響著地球表面的物質和能量循環過程,而時間變化則可綜合地反映人類活動和氣候變化對自然環境的影響。
3.相關技術中,國內外雖已研制出多套全球地表覆蓋數據集,并開展了大量的變化分析,但尚缺乏高分辨率和多類型的時空變化信息,難以提供權威系統的科學資料與分析依據,并且隨著地表覆蓋知識量的持續增長,相關數據被存儲至不同的數據源中,以使目前的知識服務難以全面收錄有效的地表覆蓋知識。因此,亟需一種能系統地描述地表覆蓋地理分布、空間格局與演變過程等信息的地表覆蓋時空變化知識圖譜。
技術實現要素:
4.有鑒于此,本技術提供了一種地表覆蓋時空變化的知識圖譜構建方法、裝置及設備,主要目的在于解決目前缺乏高分辨率和多類型的時空變化信息,難以提供權威系統的科學資料與分析依據,并且隨著地表覆蓋知識量的持續增長,相關數據被存儲至不同的數據源中,以使目前的知識服務難以全面收錄有效的地表覆蓋知識的問題。
5.依據本技術第一方面,提供了一種地表覆蓋時空變化的知識圖譜構建方法,該方法包括:
6.定義目標知識結構,采用所述目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據,所述目標知識點用于描述地表覆蓋時空變化知識;
7.在所述多個元數據中提取目標層級對應的目標數據,依據所述目標數據,確定多個所述目標知識點在所述目標層級的關聯關系,所述目標層級包括時間層級、空間層級、語義層級和變化層級;
8.以所述關聯關系為基礎,構建所述地表覆蓋時空變化知識的知識圖譜,以使服務訂閱方觸發數據獲取請求,在圖形數據庫中獲取所述知識圖譜。
9.可選地,所述定義目標知識結構,包括:
10.根據知識領域劃分標準,將所述地表覆蓋時空變化知識劃分為多個子領域;
11.提取每個所述子領域的概念信息,得到每個所述子領域的分類標識,采用所述分類標識,標記第一結構樹中的每個樹節點,得到分類結構;
12.確定變化分類和變化指標;
13.定義第二結構樹,將所述變化分類、所述變化指標和所述分類結構添加至所述第二結構樹中,得到所述目標知識結構。
14.可選地,所述采用所述目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據,包括:
15.讀取所述多個數據源中存儲的知識數據,對所述知識數據進行識別,得到多個所述目標知識點;
16.對于每個所述目標知識點,依據所述目標知識結構中存儲節點的節點標識,在所述知識數據中,確定所述節點標識對應的指定數據,將所述指定數據存儲至所述節點標識指示的存儲節點中,得到所述目標知識點的元數據;
17.遍歷所述多個目標知識點,采用所述目標知識結構,獲取每個所述目標知識點對應的元數據,得到所述多個元數據。
18.可選地,所述確定所述節點標識對應的指定數據,將所述指定數據存儲至所述節點標識指示的存儲節點中,包括:
19.當所述節點標識為基礎信息標識時,在所述知識數據中獲取所述目標知識點的基礎數據作為所述指定數據,將所述指定數據以json文件和影像文件的形式存儲至所述基礎信息標識指示的存儲節點中;
20.當所述節點標識為空間特征統計計算結果標識時,在所述知識數據中獲取所述目標知識點的多個地表覆蓋類型在預設期間內的變化信息,將所述變化信息作為所述指定數據,將所述指定數據以json文件和影像文件的形式存儲至所述空間特征統計計算結果標識指示的存儲節點中,并在所述知識數據中獲取所述目標知識點的地表覆蓋演變特征,將所述地表覆蓋演變特征作為所述指定數據,將所述指定數據以json文件的形式存儲至所述存儲節點中;
21.當所述節點標識為地表覆蓋信息標識時,在所述知識數據中獲取第一地表覆蓋變化數據和第二地表覆蓋變化數據,將所述第一地表覆蓋變化數據和所述第二地表覆蓋變化數據作為所述指定數據,將所述指定數據以json文件和影像文件的形式存儲至所述地表覆蓋信息標識指示的存儲節點中,所述第一地表覆蓋變化數據為所述目標知識點對應的多個地表覆蓋類型在預設期間內產生的變化數據,所述第二地表覆蓋變化數據為所述目標知識點中的目標地表覆蓋類型在所述預設期間內產生的變化數據。
22.可選地,所述在所述多個元數據中提取目標層級對應的目標數據,依據所述目標數據,確定多個所述目標知識點在所述目標層級的關聯關系,包括:
23.在多個所述目標知識點中提取第一指定知識點和第二指定知識點,分別讀取所述第一指定知識點對應的第一元數據和所述第二指定知識點對應的第二元數據;
24.當所述目標層級為時間層級時,在所述第一元數據中讀取所述第一采集時間,在所述第二元數據中讀取第二采集時間,將所述第一采集時間和所述第二采集時間進行比對,得到所述第一指定知識點和所述第二指定知識點在所述時間層級的關聯關系;
25.當所述目標層級為空間層級時,在所述第一元數據中讀取第一空間數據,在所述第二元數據中讀取第二空間數據,采用所述第一空間數據和所述第二空間數據,計算所述第一指定知識點和所述第二指定知識點在所述空間層級的關聯關系,所述空間數據用于指示拓撲連接數據、方位數據和距離數據;
26.當所述目標層級為語義層級時,采用語義網建模工具構建地表覆蓋時空變化知識本體模型,并定義多個地表覆蓋分類之間的公理庫,基于所述公理庫,確定所述第一指定知
識點和所述第二指定知識點在所述語義層級的關聯關系;
27.當所述目標層級為變化層級時,在所述第一元數據中讀取第一變化矩陣,在所述第二元數據中讀取第二變化矩陣,將所述第一變化矩陣和所述第二變化矩陣進行比對,得到所述第一指定知識點和所述第二指定知識點在所述變化層級的關聯關系;
28.繼續在多個所述目標知識點中提取第三指定知識點,并分別確定所述第三知識點與所述第一知識點在所述目標層級的關聯關系、所述第三知識點與所述第二知識點在所述目標層級的關聯關系,直至遍歷多個所述目標知識點,得到多個所述目標知識點在所述目標層級的關聯關系。
29.可選地,所述以所述關聯關系為基礎,構建所述地表覆蓋時空變化知識的知識圖譜,包括:
30.采用三元組表達所述關聯關系,得到三元組數據;
31.基于圖形語言cypher,將所述三元組數據對應存儲至所述圖形數據庫中,得到所述知識圖譜。
32.可選地,所述方法還包括:
33.讀取所述知識圖譜中地表覆蓋實體、概念、關系和屬性知識,采用力導向圖的方式,對所述地表覆蓋實體、所述概念、所述關系和所述屬性知識進行數據可視化;
34.讀取所述知識圖譜中的空間數據,將所述空間數據渲染至電子地圖進行數據可視化;
35.讀取所述知識圖譜中的時空變化指標數據,將所述時空變化指標數據渲染為柱狀圖或折線圖進行數據可視化。
36.依據本技術第二方面,提供了一種地表覆蓋時空變化的知識圖譜構建裝置,該裝置包括:
37.獲取模塊,用于定義目標知識結構,采用所述目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據,所述目標知識點用于描述地表覆蓋時空變化知識;
38.確定模塊,用于在所述多個元數據中提取目標層級對應的目標數據,依據所述目標數據,確定多個所述目標知識點在所述目標層級的關聯關系,所述目標層級包括時間層級、空間層級、語義層級和變化層級;
39.構建模塊,用于以所述關聯關系為基礎,構建所述地表覆蓋時空變化知識的知識圖譜,以使服務訂閱方觸發數據獲取請求,在圖形數據庫中獲取所述知識圖譜。
40.可選地,所述獲取模塊,用于根據知識領域劃分標準,將所述地表覆蓋時空變化知識劃分為多個子領域;提取每個所述子領域的概念信息,得到每個所述子領域的分類標識,采用所述分類標識,標記第一結構樹中的每個樹節點,得到分類結構;確定變化分類和變化指標;定義第二結構樹,將所述變化分類、所述變化指標和所述分類結構添加至所述第二結構樹中,得到所述目標知識結構。
41.可選地,所述獲取模塊,用于讀取所述多個數據源中存儲的知識數據,對所述知識數據進行識別,得到多個所述目標知識點;對于每個所述目標知識點,依據所述目標知識結構中存儲節點的節點標識,在所述知識數據中,確定所述節點標識對應的指定數據,將所述指定數據存儲至所述節點標識指示的存儲節點中,得到所述目標知識點的元數據;遍歷所述多個目標知識點,采用所述目標知識結構,獲取每個所述目標知識點對應的元數據,得到
所述多個元數據。
42.可選地,所述獲取模塊,用于當所述節點標識為基礎信息標識時,在所述知識數據中獲取所述目標知識點的基礎數據作為所述指定數據,將所述指定數據以json文件和影像文件的形式存儲至所述基礎信息標識指示的存儲節點中;當所述節點標識為空間特征統計計算結果標識時,在所述知識數據中獲取所述目標知識點的多個地表覆蓋類型在預設期間內的變化信息,將所述變化信息作為所述指定數據,將所述指定數據以json文件和影像文件的形式存儲至所述空間特征統計計算結果標識指示的存儲節點中,并在所述知識數據中獲取所述目標知識點的地表覆蓋演變特征,將所述地表覆蓋演變特征作為所述指定數據,將所述指定數據以json文件的形式存儲至所述存儲節點中;當所述節點標識為地表覆蓋信息標識時,在所述知識數據中獲取第一地表覆蓋變化數據和第二地表覆蓋變化數據,將所述第一地表覆蓋變化數據和所述第二地表覆蓋變化數據作為所述指定數據,將所述指定數據以json文件和影像文件的形式存儲至所述地表覆蓋信息標識指示的存儲節點中,所述第一地表覆蓋變化數據為所述目標知識點對應的多個地表覆蓋類型在預設期間內產生的變化數據,所述第二地表覆蓋變化數據為所述目標知識點中的目標地表覆蓋類型在所述預設期間內產生的變化數據。
43.可選地,所述確定模塊,用于在多個所述目標知識點中提取第一指定知識點和第二指定知識點,分別讀取所述第一指定知識點對應的第一元數據和所述第二指定知識點對應的第二元數據;當所述目標層級為時間層級時,在所述第一元數據中讀取所述第一采集時間,在所述第二元數據中讀取第二采集時間,將所述第一采集時間和所述第二采集時間進行比對,得到所述第一指定知識點和所述第二指定知識點在所述時間層級的關聯關系;當所述目標層級為空間層級時,在所述第一元數據中讀取第一空間數據,在所述第二元數據中讀取第二空間數據,采用所述第一空間數據和所述第二空間數據,計算所述第一指定知識點和所述第二指定知識點在所述空間層級的關聯關系,所述空間數據用于指示拓撲連接數據、方位數據和距離數據;當所述目標層級為語義層級時,采用語義網建模工具構建地表覆蓋時空變化知識本體模型,并定義多個地表覆蓋分類之間的公理庫,基于所述公理庫,確定所述第一指定知識點和所述第二指定知識點在所述語義層級的關聯關系;當所述目標層級為變化層級時,在所述第一元數據中讀取第一變化矩陣,在所述第二元數據中讀取第二變化矩陣,將所述第一變化矩陣和所述第二變化矩陣進行比對,得到所述第一指定知識點和所述第二指定知識點在所述變化層級的關聯關系;繼續在多個所述目標知識點中提取第三指定知識點,并分別確定所述第三知識點與所述第一知識點在所述目標層級的關聯關系、所述第三知識點與所述第二知識點在所述目標層級的關聯關系,直至遍歷多個所述目標知識點,得到多個所述目標知識點在所述目標層級的關聯關系。
44.可選地,所述構建模塊,用于采用三元組表達所述關聯關系,得到三元組數據;基于圖形語言cypher,將所述三元組數據對應存儲至所述圖形數據庫中,得到所述知識圖譜。
45.可選地,所述裝置還包括:
46.讀取模塊,用于讀取所述知識圖譜中地表覆蓋實體、概念、關系和屬性知識,采用力導向圖的方式,對所述地表覆蓋實體、所述概念、所述關系和所述屬性知識進行數據可視化;
47.所述讀取模塊,還用于讀取所述知識圖譜中的空間數據,將所述空間數據渲染至
電子地圖進行數據可視化;
48.所述讀取模塊,還用于讀取所述知識圖譜中的時空變化指標數據,將所述時空變化指標數據渲染為柱狀圖或折線圖進行數據可視化。
49.依據本技術第三方面,提供了一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現上述第一方面中任一項所述方法的步驟。
50.依據本技術第四方面,提供了一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現上述第一方面中任一項所述的方法的步驟。
51.借由上述技術方案,本技術提供的一種地表覆蓋時空變化的知識圖譜構建方法、裝置及設備,本技術首先定義目標知識結構,采用目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據。隨后,在多個元數據中提取目標層級對應的目標數據,依據目標數據,確定多個目標知識點在目標層級的關聯關系,目標層級包括時間層級、空間層級、語義層級和變化層級。最后,以關聯關系為基礎,構建地表覆蓋時空變化知識的知識圖譜,以使服務訂閱方觸發數據獲取請求,在圖形數據庫中獲取知識圖譜。通過預設的知識結構,對多個數據源中存儲的海量知識數據進行知識挖掘,提取所需的知識元數據,同時設定多個目標層級,進行多類型、多因素的地表覆蓋知識關聯分析,最終構建知識圖譜,實現以結構化的方式描述全球地表覆蓋時空演變知識體系。
52.上述說明僅是本技術技術方案的概述,為了能夠更清楚了解本技術的技術手段,而可依照說明書的內容予以實施,并且為了讓本技術的上述和其它目的、特征和優點能夠更明顯易懂,以下特舉本技術的具體實施方式。
附圖說明
53.通過閱讀下文優選實施方式的詳細描述,各種其他的優點和益處對于本領域普通技術人員將變得清楚明了。附圖僅用于示出優選實施方式的目的,而并不認為是對本技術的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中:
54.圖1示出了本技術實施例提供的一種地表覆蓋時空變化的知識圖譜構建方法流程示意圖;
55.圖2a示出了本技術實施例提供的一種地表覆蓋時空變化的知識圖譜構建方法流程示意圖;
56.圖2b示出了本技術實施例提供的一種地表覆蓋時空變化的知識圖譜構建方法的知識結構圖;
57.圖2c示出了本技術實施例提供的一種地表覆蓋時空變化的知識圖譜構建方法的系統結構圖;
58.圖3示出了本技術實施例提供的一種地表覆蓋時空變化的知識圖譜構建裝置的結構示意圖;
59.圖4示出了本技術實施例提供的一種計算機設備的裝置結構示意圖。
具體實施方式
60.下面將參照附圖更詳細地描述本技術的示例性實施例。雖然附圖中顯示了本技術
的示例性實施例,然而應當理解,可以以各種形式實現本技術而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本技術,并且能夠將本技術的范圍完整的傳達給本領域的技術人員。
61.本技術實施例提供了一種地表覆蓋時空變化的知識圖譜構建方法,如圖1 所示,該方法包括:
62.101、定義目標知識結構,采用目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據,目標知識點用于描述地表覆蓋時空變化知識。
63.需要說明的是,地表覆蓋時空變化知識是關于地球表面的物質和現象有關的概念、分類、空間形態、地理特征、數量關系、演變時序、驅動變化機理、演變趨勢等表征的描述。在實際運行過程中,目標知識點可以是一個國家,也可以是一個自然景點,如北京市、黃河流域等,本技術對目標知識點的內容不進行具體限定。進一步地,本技術預設的知識結構定義了不同的知識層次,采用目標知識結構來獲取每個目標知識點的元數據,就相當于從不同的表達層次來反映目標知識點的知識內容。
64.102、在多個元數據中提取目標層級對應的目標數據,依據目標數據,確定多個目標知識點在目標層級的關聯關系,目標層級包括時間層級、空間層級、語義層級和變化層級。
65.接下來,本技術設置有四個目標層級,基于不同層級對應的數據內容,確定多個目標知識點在四個目標層級上分別對應的關聯關系,進而實現多層級的關聯地表覆蓋時空變化知識點。其中,四個目標層級分別是時間層級、空間層級、語義層級和變化層級。
66.103、以關聯關系為基礎,構建地表覆蓋時空變化知識的知識圖譜,以使服務訂閱方觸發數據獲取請求,在圖形數據庫中獲取知識圖譜。
67.最后,遵循定義的關聯關系,通過編寫圖形語言cypher語句,將各個知識點存儲到neo4j圖形數據庫中,構建地表覆蓋時空變化知識的知識圖譜,實現基于圖模型數據庫的地表覆蓋時空變化知識的存儲,為地表覆蓋時空變化知識的查詢分析與存儲奠定基礎。以使服務訂閱方通過對應的終端設備發起信息獲取請求,在圖形數據庫中獲取知識圖譜進行學習或研究。
68.本技術實施例提供的方法,首先定義目標知識結構,采用目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據。隨后,在多個元數據中提取目標層級對應的目標數據,依據目標數據,確定多個目標知識點在目標層級的關聯關系,目標層級包括時間層級、空間層級、語義層級和變化層級。最后,以關聯關系為基礎,構建地表覆蓋時空變化知識的知識圖譜,以使服務訂閱方觸發數據獲取請求,在圖形數據庫中獲取知識圖譜。通過預設的知識結構,對多個數據源中存儲的海量知識數據進行知識挖掘,提取所需的知識元數據,同時設定多個目標層級,進行多類型、多因素的地表覆蓋知識關聯分析,最終構建知識圖譜,實現以結構化的方式描述全球地表覆蓋時空演變知識體系。
69.本技術實施例提供了一種地表覆蓋時空變化的知識圖譜構建方法,如圖2a 所示,該方法包括:
70.201、定義目標知識結構。
71.在構建知識圖譜的過程中,系統會對全部能夠存儲知識數據的數據源進行識別,考慮到并不是全部知識數據都能夠用于構建知識圖譜。因此,為了能夠快速有效的在海量
的地表覆蓋時空變化知識中挖掘出所需的數據,系統會在進行數據挖掘前定義目標知識結構。需要說明的是,目標知識結構是以基礎信息、空間特征統計和地表覆蓋數據三個層次來表示地表覆蓋時空變化知識點,定義目標知識結構的具體過程如下:
72.一、定義第一結構樹,確定地表覆蓋時空變化知識的分類結構。
73.具體地,根據知識領域劃分標準,將地表覆蓋時空變化知識劃分為多個子領域。隨后,提取每個子領域的概念信息,如表1所示,得到每個子領域的分類標識,也就是地表覆蓋類型分類,其中,子領域為耕地、森林、草地、灌木地、濕地、水體、苔原、人造地表、裸地、冰川及永久冰雪10個大類。
74.表1、地表覆蓋類型分類
75.[0076][0077]
最后,采用分類標識,標記第一結構樹中的每個樹節點,得到分類結構。后續通過目標知識結構獲取變化空間分布等內容時,可以依據分類結構獲取各個分類對應的變化情況、演變特征等內容。
[0078]
二、定義變化指標及變化分類
[0079]
為了更好的表達地表覆蓋的演變特征,本技術定義了15個變化指標,進而實現在知識數據中提取目標知識點對應的指標數據進行地表覆蓋演變特征的分析,變化指標的具體內容如表2所示:
[0080]
表2、變化指標
[0081]
[0082][0083]
接下來,本技術定義了能夠反映地表覆蓋變化的變化分類,具體內容如表3 所示:
[0084]
表3、地表覆蓋變化分類
[0085][0086]
三、定義第二結構樹,確定目標知識結構。
[0087]
在本步驟中,系統首先定義第二結構樹。隨后,將變化分類、變化指標和分類結構
添加至第二結構樹中,得到目標知識結構。需要說明的是,目標知識結構中不僅包括變化分類、變化指標和分類結構,還包括基礎屬性等內容。
[0088]
具體地,如圖2b所示,第二結構樹以目標知識點為根節點進行展開,第二結構樹包括基礎信息、空間特征統計和地表覆蓋數據三個層次。需要說明的是,基礎信息包括知識點的名稱、類型、研究區域、空間幾何信息(知識點對應的空間數據坐標點,以自然、行政邊界或自定義區域形式展示)及典型地貌、地理特征描述等。空間特征統計包含變化空間分布和空間特征統計指標兩大類,其中,變化空間分布需要添加地表覆蓋時空變化知識的分類結構,具體可以依據分類結構獲取該目標知識點的地表覆蓋類型從2000至2010、2010至2020三期數據之間的變化情況。空間特征指標需要添加變化指標及變化分類,依據變化指標和變化分類獲取地表覆蓋演變特征數據,具體包含空間統計、空間格局和空間變化等信息。地表覆蓋數據同樣需要添加地表覆蓋時空變化知識的分類結構,具體可以依據分類結構獲取當前知識點所有類別的2000、2010和2020 年三期地表覆蓋數據,也就是后續獲取的第一地表覆蓋變化數據和某一類別的三期地表覆蓋數據,也就是后續獲取的第二地表覆蓋變化數據。
[0089]
202、采用目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據。
[0090]
進一步地,進入數據采集環節,系統根據目標知識結構中標識的內容,對多個數據源中的知識數據進行數據挖掘,從而提取出構建知識圖譜所需的元數據。具體地,系統先讀取多個數據源中存儲的知識數據,對知識數據進行識別,得到多個目標知識點,如河南省、上海市、黃河流域等。對于每個目標知識點,依據目標知識結構中存儲節點的節點標識,在知識數據中,確定節點標識對應的指定數據,將指定數據存儲至節點標識指示的存儲節點中,得到目標知識點的元數據。在實際運行過程中,每個存儲節點下還設置多個葉子節點,用于對知識數據進行分類存儲。
[0091]
當節點標識為基礎信息標識時,在知識數據中獲取目標知識點的基礎數據作為指定數據,將指定數據以json文件和影像文件的形式存儲至基礎信息標識指示的存儲節點中。需要說明的是,指定數據中的基本信息,如名稱、標識等內容可以存儲至基本信息葉子節點中,空間范圍等內容可以存儲至空間幾何信息葉子節點中,地形數據,如山體陰影、坡度、坡向、地形粗糙度索引、地形未知索引、粗糙度、彩浮雕、坡度等級等內容,可以存儲至地形數據葉子節點中。照片信息可以存儲至典型照片葉子節點中。
[0092]
當節點標識為空間特征統計計算結果標識時,在知識數據中獲取目標知識點的多個地表覆蓋類型在預設期間內的變化信息,如當前知識點的地表覆蓋類型在2000年至2010年總體變化信息,將變化信息作為指定數據,將指定數據以json文件和影像文件的形式存儲至空間特征統計計算結果標識指示的存儲節點中,并在知識數據中獲取目標知識點的地表覆蓋演變特征,如2000年至2010 年當前知識點的地表覆蓋類型的變化轉移矩陣、空間變化指標等等,將地表覆蓋演變特征作為指定數據,將指定數據以json文件的形式存儲至存儲節點中。
[0093]
當節點標識為地表覆蓋信息標識時,在知識數據中獲取第一地表覆蓋變化數據和第二地表覆蓋變化數據,將第一地表覆蓋變化數據和第二地表覆蓋變化數據作為指定數據,將指定數據以json文件和影像文件的形式存儲至地表覆蓋信息標識指示的存儲節點中。第一地表覆蓋變化數據為目標知識點對應的多個地表覆蓋類型在預設期間內產生的變
化數據。例如,目標知識點a包括上述10 個地表覆蓋分類(耕地、森林、草地、灌木地、濕地、水體、苔原、人造地表、裸地、冰川及永久冰雪),預設期間為2000年、2010年和2022年三期,則獲取目標知識點a的10個類別在2000年、2010年和2022年三期內產生的變化數據作為第一地表覆蓋變化數據。進一步地,第二地表覆蓋變化數據為目標知識點中的目標地表覆蓋類型在預設期間內產生的變化數據。依舊以目標知識點a 為例,將森林類別作為為目標地表覆蓋類型,獲取目標知識點a中的森林類別在2000年、2010年和2022年三期內產生的變化數據作為第二地表覆蓋變化數據。
[0094]
最后,遍歷多個目標知識點,采用目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據。
[0095]
203、在多個元數據中提取目標層級對應的目標數據,依據目標數據,確定多個目標知識點在目標層級的關聯關系。
[0096]
在本技術實施例中,為了能夠遍歷全部目標知識點,確定任意兩個目標知識點之間的多層級的關聯關系,系統首先在多個目標知識點中提取兩個知識點,即第一指定知識點和第二指定知識點,分別讀取第一指定知識點對應的第一元數據和第二指定知識點對應的第二元數據。例如,在多個目標知識點中提取知識點a作為第一指定知識點和知識點b作為第二指定知識點,依據第一指定知識點a對應的第一元數據以及第二指定知識點b對應的第二元數據,將第一指定知識點a和第二指定知識點b在四個層級上關聯。具體關聯過程如下:
[0097]
一、時間層級
[0098]
時間層級的關聯主要與地表覆蓋知識的遙感影像在不同時間下的空間特征統計計算結果的時間序列相關,因此,當目標層級為時間層級時,需要在第一元數據中讀取第一采集時間,在第二元數據中讀取第二采集時間,將第一采集時間和第二采集時間進行比對,得到第一指定知識點和第二指定知識點在時間層級的關聯關系。具體地,本技術劃分了13種的基本關系,分別是before(《)、 meets(m)、overlaps(o)、starts(s)、during(d)、ends(e),它們的逆關系 after(》)、met-by(m~)、overlapped-by(o~)、started-by(s~)、includes(i~)、 ended-by(e~)及相等關系equals(=)。進而通過對比2個知識點采集時間,確定命中的時間關系。
[0099]
二、空間層級
[0100]
空間層級主要設計拓撲、方位、距離三類,進而當目標層級為空間層級時,以知識點面狀空間范圍(wkt格式)為基礎進行計算,在第一元數據中讀取第一空間數據,在第二元數據中讀取第二空間數據,采用第一空間數據和第二空間數據從三個方面進行計算,確定空間層級上的關聯關系。
[0101]
1、拓撲關系
[0102]
在拓撲關系上,采用基于區域連接的rcc(region connection calculus)方法模型,主要拓撲關系如表4所示,主要有相離、鄰接、部分相交、相等、對象a包含于對象b且邊界相交、對象a包含對象b且邊界相交、對象a包含于對象b且邊界不相交、對象a包含對象b且邊界不相交等8種關系。
[0103]
表4、拓撲運算關系
[0104][0105]
2、方位關系
[0106]
對于空間實體的方位關系計算,通過提取面狀空間范圍的質心,采用點模型的方式開展計算,依據andrew frank的投影法(projection)和錐形法(cone) 兩種方向劃分方法,定義為確定n,ne,e,se,s,sw,w,nw等8個方向。
[0107]
3、距離關系
[0108]
歐式距離,以知識點面狀空間范圍的質心為起算原點。距離關系計算中,也是通過
質心計算出面狀空間實體之間的距離,
[0109]
三、語義層級
[0110]
進一步地,當目標層級為語義層級時,采用語義網建模工具構建地表覆蓋時空變化知識本體模型,并定義多個地表覆蓋分類之間的公理庫,基于公理庫,確定第一指定知識點和第二指定知識點在語義層級的關聯關系,如表5所示:
[0111]
表5、地表覆蓋變化知識語義
[0112]
關系分類關系名稱備注part-of類之間部分與整體的關系大清河、潮白河等組成海河流域kind-of類之間的繼承關系水田繼承耕地概念instance-of類的實例和類的關系呼倫貝爾是草地的實例attribute-of類是另外一個類的屬性 等同關系同級概念或實例之間等價關系潮白河、鮑丘水同一河流不同稱呼相似關系意思相近的概念或實例雨養旱地、灌溉旱地概念相近互斥關系同級概念或實例之間的互斥平原、山地
[0113]
四、變化層級
[0114]
當目標層級為變化層級時,在第一元數據中讀取第一變化矩陣,在第二元數據中讀取第二變化矩陣,將第一變化矩陣和第二變化矩陣進行比對,得到第一指定知識點和第二指定知識點在變化層級的關聯關系。需要說明的是,變化層級分類兩個方向的關聯,一是變化趨勢關聯,另一個是類型轉換關聯。
[0115]
1、變化趨勢關聯
[0116]
在本步驟中,系統會統計第一變化矩陣和第二變化矩陣的變化趨勢,將趨勢相同的知識點關聯起來,在本技術中,根據目前2000年到2020年的數據將變化趨勢分為9類,如表6所示:
[0117]
表6、變化趨勢
[0118]
編號2000-20102010-20201不變不變2不變增加3不變減少4增加不變5增加增加6增加減少7減少不變8減少增加8減少減少
[0119]
2、類型轉換關聯
[0120]
在本步驟中,根據第一變化矩陣和第二變化矩陣中的關聯關系,關聯不同知識點。需要說明的是,只有當空間范圍相同,但是地表覆蓋類型不同的第一指定知識點和第二指定知識點才能夠關聯,本技術定義的轉換關系具體如下述表7所示:
[0121]
表7、地表覆蓋數據轉換關系
[0122][0123][0124]
進一步地,繼續在多個目標知識點中提取第三指定知識點,并分別確定第三知識點與第一知識點在目標層級的關聯關系、第三知識點與第二知識點在目標層級的關聯關系,直至遍歷多個目標知識點,得到多個目標知識點在目標層級的關聯關系。例如,繼續在多個目標知識點中提取知識點c為第三指定知識點,將第三指定知識點c與第一指定知識點a在四個層級上進行關聯,將第三指定知識點c與第二指定知識點b在四個層級上進行關聯。不斷在多個目標知識點中提取待關聯的知識點,直至關聯全部目標知識點。
[0125]
204、以關聯關系為基礎,構建地表覆蓋時空變化知識的知識圖譜。
[0126]
通過rdf三元組表達地表覆蓋知識,增強知識間的語義關系,同時能夠清晰、準確的表達知識,盡可能減少歧義,并具有足夠的細節,同時便于理解知識。以海河流域地表覆蓋知識為例,對地表覆蓋知識實體或概念之間的關系采用三元組可以表示為:(海河流域,包含,大清河水系)、(流域,上下位關系,水系)等,表達實體的屬性和屬性值為:(海河流域,知識點名稱,海河流域知識點)、(海河流域,河流分類,華北型河流)等。
[0127]
在進行數據存儲時,首先通過編寫cypher語句,組織csv文件,定義實體和屬性,將實體和屬性批量添加到neo4j數據庫中。隨后,采用類似于創建節點的語法,在關系的方括號中定義關系的類型及其屬性,需要說明的是,管理方括號中有且只有唯一指定的關系類型。另外,在進行數據查詢是,可以使用 match關鍵字指定搜查模式,where為match模式增添謂詞,從而約束查詢結果,對其節點信息以及該層相關聯的節點實現查詢操作。
[0128]
205、將知識圖譜可視化。
[0129]
知識圖譜主要基于展示層進行可視化,展示層主要是地表覆蓋知識圖譜構建系統的交互界面,使用者通過瀏覽器可以便捷的訪問。在該層主要采用vue.js 與elementui相結合設計展示界面,對于地表覆蓋實體、概念、關系和屬性知識的展示采用d3.js力導向圖的方式進行關聯表達,對于空間知識采用mapboxgl.js,將數據渲染到地圖上,進行空間可
視化,對于具有長時間序列的時空變化指標數據如ndvi、npp等,采用echart.js將這些指標數據渲染為柱狀圖、折線圖進行可視化以分析其變化趨勢或強度。
[0130]
另外,如圖2c所示,整個系統還包括通訊層、應用層、服務層和數據層,在數據層選用圖模型數據庫neo4j用以知識的存儲、讀取和更新,通過將地表覆蓋知識表示為rdf三元組的方式,并將這些知識組織為csv實體屬性文件,此外還需要在數據層提供推理規則等,便于之后開展知識關聯。在服務層主要由數據服務和其他服務組成。其中數據服務包含有地表覆蓋學科知識、遙感影像指標知識等。其他服務為neo4jrestapi訪問服務,用以通過java語言訪問 neo4j數據庫,便捷的通過cypher語句查詢知識,同時也可以增加、修改或刪除實體、屬性等知識。jena推理引擎服務,主要通過讀取自定義規則,調用jena 推理機,為本體規則推理提供支撐。在通訊層采用axios的get請求和post 請求,將展示層和應用層連接起來。通過axios發送請求到應用層,應用層響應請求,獲取展示層傳遞的參數,如實體名稱、關系名稱等,之后應用層將展示層請求的結果進行返回,完成請求和響應。
[0131]
本技術實施例提供的方法,首先定義目標知識結構,采用目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據。隨后,在多個元數據中提取目標層級對應的目標數據,依據目標數據,確定多個目標知識點在目標層級的關聯關系,目標層級包括時間層級、空間層級、語義層級和變化層級。最后,以關聯關系為基礎,構建地表覆蓋時空變化知識的知識圖譜,以使服務訂閱方觸發數據獲取請求,在圖形數據庫中獲取知識圖譜。通過預設的知識結構,對多個數據源中存儲的海量知識數據進行知識挖掘,提取所需的知識元數據,同時設定多個目標層級,進行多類型、多因素的地表覆蓋知識關聯分析,最終構建知識圖譜,實現以結構化的方式描述全球地表覆蓋時空演變知識體系。
[0132]
進一步地,作為圖1所述方法的具體實現,本技術實施例提供了一種地表覆蓋時空變化的知識圖譜構建裝置,如圖3所示,所述裝置包括:獲取模塊301、確定模塊302、構建模塊303。
[0133]
該獲取模塊301,用于定義目標知識結構,采用所述目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據,所述目標知識點用于描述地表覆蓋時空變化知識;
[0134]
該確定模塊302,用于在所述多個元數據中提取目標層級對應的目標數據,依據所述目標數據,確定多個所述目標知識點在所述目標層級的關聯關系,所述目標層級包括時間層級、空間層級、語義層級和變化層級;
[0135]
該構建模塊303,用于以所述關聯關系為基礎,構建所述地表覆蓋時空變化知識的知識圖譜,以使服務訂閱方觸發數據獲取請求,在圖形數據庫中獲取所述知識圖譜。
[0136]
在具體的應用場景中,該獲取模塊301,用于根據知識領域劃分標準,將所述地表覆蓋時空變化知識劃分為多個子領域;提取每個所述子領域的概念信息,得到每個所述子領域的分類標識,采用所述分類標識,標記第一結構樹中的每個樹節點,得到分類結構;確定變化分類和變化指標;定義第二結構樹,將所述變化分類、所述變化指標和所述分類結構添加至所述第二結構樹中,得到所述目標知識結構。
[0137]
在具體的應用場景中,該獲取模塊301,用于讀取所述多個數據源中存儲的知識數據,對所述知識數據進行識別,得到多個所述目標知識點;對于每個所述目標知識點,依據所述目標知識結構中存儲節點的節點標識,在所述知識數據中,確定所述節點標識對應的指定數據,將所述指定數據存儲至所述節點標識指示的存儲節點中,得到所述目標知識點
的元數據;遍歷所述多個目標知識點,采用所述目標知識結構,獲取每個所述目標知識點對應的元數據,得到所述多個元數據。
[0138]
在具體的應用場景中,該獲取模塊301,還用于當所述節點標識為基礎信息標識時,在所述知識數據中獲取所述目標知識點的基礎數據作為所述指定數據,將所述指定數據以json文件和影像文件的形式存儲至所述基礎信息標識指示的存儲節點中;當所述節點標識為空間特征統計計算結果標識時,在所述知識數據中獲取所述目標知識點的多個地表覆蓋類型在預設期間內的變化信息,將所述變化信息作為所述指定數據,將所述指定數據以json文件和影像文件的形式存儲至所述空間特征統計計算結果標識指示的存儲節點中,并在所述知識數據中獲取所述目標知識點的地表覆蓋演變特征,將所述地表覆蓋演變特征作為所述指定數據,將所述指定數據以json文件的形式存儲至所述存儲節點中;當所述節點標識為地表覆蓋信息標識時,在所述知識數據中獲取第一地表覆蓋變化數據和第二地表覆蓋變化數據,將所述第一地表覆蓋變化數據和所述第二地表覆蓋變化數據作為所述指定數據,將所述指定數據以json文件和影像文件的形式存儲至所述地表覆蓋信息標識指示的存儲節點中,所述第一地表覆蓋變化數據為所述目標知識點對應的多個地表覆蓋類型在預設期間內產生的變化數據,所述第二地表覆蓋變化數據為所述目標知識點中的目標地表覆蓋類型在所述預設期間內產生的變化數據。
[0139]
在具體的應用場景中,該確定模塊302,用于在多個所述目標知識點中提取第一指定知識點和第二指定知識點,分別讀取所述第一指定知識點對應的第一元數據和所述第二指定知識點對應的第二元數據;當所述目標層級為時間層級時,在所述第一元數據中讀取所述第一采集時間,在所述第二元數據中讀取第二采集時間,將所述第一采集時間和所述第二采集時間進行比對,得到所述第一指定知識點和所述第二指定知識點在所述時間層級的關聯關系;當所述目標層級為空間層級時,在所述第一元數據中讀取第一空間數據,在所述第二元數據中讀取第二空間數據,采用所述第一空間數據和所述第二空間數據,計算所述第一指定知識點和所述第二指定知識點在所述空間層級的關聯關系,所述空間數據用于指示拓撲連接數據、方位數據和距離數據;當所述目標層級為語義層級時,采用語義網建模工具構建地表覆蓋時空變化知識本體模型,并定義多個地表覆蓋分類之間的公理庫,基于所述公理庫,確定所述第一指定知識點和所述第二指定知識點在所述語義層級的關聯關系;當所述目標層級為變化層級時,在所述第一元數據中讀取第一變化矩陣,在所述第二元數據中讀取第二變化矩陣,將所述第一變化矩陣和所述第二變化矩陣進行比對,得到所述第一指定知識點和所述第二指定知識點在所述變化層級的關聯關系;繼續在多個所述目標知識點中提取第三指定知識點,并分別確定所述第三知識點與所述第一知識點在所述目標層級的關聯關系、所述第三知識點與所述第二知識點在所述目標層級的關聯關系,直至遍歷多個所述目標知識點,得到多個所述目標知識點在所述目標層級的關聯關系。
[0140]
在具體的應用場景中,該構建模塊303,用于采用三元組表達所述關聯關系,得到三元組數據;基于圖形語言cypher,將所述三元組數據對應存儲至所述圖形數據庫中,得到所述知識圖譜。
[0141]
在具體的應用場景中,所述裝置還包括:讀取模塊304。
[0142]
該讀取模塊304,用于讀取所述知識圖譜中地表覆蓋實體、概念、關系和屬性知識,采用力導向圖的方式,對所述地表覆蓋實體、所述概念、所述關系和所述屬性知識進行數據
可視化;
[0143]
該讀取模塊304,還用于讀取所述知識圖譜中的空間數據,將所述空間數據渲染至電子地圖進行數據可視化;
[0144]
該讀取模塊304,還用于讀取所述知識圖譜中的時空變化指標數據,將所述時空變化指標數據渲染為柱狀圖或折線圖進行數據可視化。
[0145]
本技術實施例提供的裝置,首先定義目標知識結構,采用目標知識結構,獲取每個目標知識點對應的元數據,得到多個元數據。隨后,在多個元數據中提取目標層級對應的目標數據,依據目標數據,確定多個目標知識點在目標層級的關聯關系,目標層級包括時間層級、空間層級、語義層級和變化層級。最后,以關聯關系為基礎,構建地表覆蓋時空變化知識的知識圖譜,以使服務訂閱方觸發數據獲取請求,在圖形數據庫中獲取知識圖譜。通過預設的知識結構,對多個數據源中存儲的海量知識數據進行知識挖掘,提取所需的知識元數據,同時設定多個目標層級,進行多類型、多因素的地表覆蓋知識關聯分析,最終構建知識圖譜,實現以結構化的方式描述全球地表覆蓋時空演變知識體系。
[0146]
需要說明的是,本技術實施例提供的一種地表覆蓋時空變化的知識圖譜構建裝置所涉及各功能單元的其他相應描述,可以參考圖1和圖2a至圖2c中的對應描述,在此不再贅述。
[0147]
在示例性實施例中,參見圖4,還提供了一種設備,該設備包括通信總線、處理器、存儲器和通信接口,還可以包括輸入輸出接口和顯示設備,其中,各個功能單元之間可以通過總線完成相互間的通信。該存儲器存儲有計算機程序,處理器,用于執行存儲器上所存放的程序,執行上述實施例中的地表覆蓋時空變化的知識圖譜構建方法。
[0148]
一種計算機可讀存儲介質,其上存儲有計算機程序,所述計算機程序被處理器執行時實現所述的地表覆蓋時空變化的知識圖譜構建方法的步驟。
[0149]
通過以上的實施方式的描述,本領域的技術人員可以清楚地了解到本技術可以通過硬件實現,也可以借助軟件加必要的通用硬件平臺的方式來實現。基于這樣的理解,本技術的技術方案可以以軟件產品的形式體現出來,該軟件產品可以存儲在一個非易失性存儲介質(可以是cd-rom,u盤,移動硬盤等) 中,包括若干指令用以使得一臺計算機設備(可以是個人計算機,服務器,或者網絡設備等)執行本技術各個實施場景所述的方法。
[0150]
本領域技術人員可以理解附圖只是一個優選實施場景的示意圖,附圖中的模塊或流程并不一定是實施本技術所必須的。
[0151]
本領域技術人員可以理解實施場景中的裝置中的模塊可以按照實施場景描述進行分布于實施場景的裝置中,也可以進行相應變化位于不同于本實施場景的一個或多個裝置中。上述實施場景的模塊可以合并為一個模塊,也可以進一步拆分成多個子模塊。
[0152]
上述本技術序號僅僅為了描述,不代表實施場景的優劣。
[0153]
以上公開的僅為本技術的幾個具體實施場景,但是,本技術并非局限于此,任何本領域的技術人員能思之的變化都應落入本技術的保護范圍。
