本文作者:kaifamei

多域多物理耦合數值模擬負載均衡方法與流程

更新時間:2025-12-24 22:28:17 0條評論

多域多物理耦合數值模擬負載均衡方法與流程



1.本發明涉及一種負載均衡優化方法,尤其涉及一種多域多物理耦合數值模擬負載均衡方法。


背景技術:



2.多域多物理耦合是實現系統級高保真數值模擬的可行形式,現行工業仿真軟件由于歷史原因多采用較為封閉的體系架構,各個物理領域的軟件相互獨立無法順暢地進行耦合計算,難以滿足未來工業產品設計研發的需求。基于軟件通信和文件接口的耦合,除了在算法、穩定性方面存在一定問題外,也存在負載均衡等性能問題。傳統系統仿真在實施高保真數值模擬時,也通常采用邊界條件迭代匹配方法,計算浪費較多。多物理問題耦合計算,需要較高的性能支撐。美國阿貢國家實驗室調研《multiphysics simulations:challenges and opportunities》顯示,多物理耦合計算在科學和工程計算領域雖然有大量的實踐,但在e級超級計算機等高性能平臺上,實現高保真的多域多物理耦合,將是一個“1加1”遠大于“2”的挑戰,其并行擴展難度將超過預期。


技術實現要素:



3.為了滿足工業數字化創新需求,本發明提供了一種多域多物理耦合數值模擬負載均衡方法,能夠解決多域多物理模的多程序數據流(mpmd)計算過程中,由于過程依賴造成計算等待問題,即負載假均衡問題。
4.為實現上述目的,本發明提供的技術方案為:
5.本發明提供的一種多域多物理耦合數值模擬負載均衡方法,其特征在于,包括
6.步驟1:將沒有同步節點的計算域分配到不同的計算域組中;
7.步驟2:選擇計算域組中的特定同步流程節點,將該特定同步流程節點連接的計算域分解為2個以上沒有其他同步關系的多個計算域組;
8.步驟3:對子計算域組執行步驟2、步驟3,直至步驟2中無法再選擇特定同步流程節點,得到若干不可分解的計算域組;
9.步驟5:根據各個計算域組的計算量占全部計算域的總體計算量的比例,計算各個計算域組的資源組規模,給各個計算域組分配資源組;各個計算域組的資源組是互斥的,并集為全局資源組;
10.步驟6:根據各個計算域的計算量占所屬計算域組的計算量的比例,計算各個計算域的資源組規模,給各個計算域分配資源組;各個計算域的資源組是互斥的,并集為計算域組的資源組;
11.其中,特定同步流程節點需要滿足:取消該同步節點后,所連接的計算域可以分解為2個以上沒有同步關系的計算域組。
12.本發明提供的多域多物理耦合數值模擬負載均衡方法,其特征在于,步驟6還包括:根據各個計算域的資源組規模,分配計算域的運行時數據庫;
13.其中,運行時數據用于在各個計算階段,遷移存儲該階段計算流程必要數據,計算完畢后將數據更新回基礎計算域數據庫。
14.本發明提供的多域多物理耦合數值模擬負載均衡方法,優選地,還包括緩存機制:在不突破存儲的情況下,為各個計算階段緩存必要的數據副本。
15.本發明提供的多域多物理耦合數值模擬負載均衡方法,優選地,還包括平鋪機制:在計算時,若計算域組中的數據規模相對較大或者分配的資源組相對較小,將計算域組的數據進行平鋪。
16.本發明提供的多域多物理耦合數值模擬負載均衡方法,優選地,還包括通信計算重疊策略:在執行計算的過程中,各進程同步緩存后續計算流程的數據。
17.本發明提供的多域多物理耦合數值模擬負載均衡方法,優選地,還包括綜合開銷評估策略:通過開銷評估和運行時監測統計,確定每個計算階段的數據遷移的開銷和不進行數據遷移情況下計算不均衡的等待開銷,在保證計算綜合用時最短的前提下,確定某一計算階段是否執行數據遷移。
18.本發明提供的多域多物理耦合數值模擬負載均衡方法,優選地,所述步驟2中“選擇計算域組中的特定同步流程節點”具體為:
19.步驟201:通過統計原始流程圖,對計算域間的同步次數進行統計;
20.步驟202:按照域間同步次數由大到小進行計算域兩兩聚合,形成聚合樹;
21.步驟203:依次按照聚合樹廣度優先遍歷可以快速到所有的所需同步節點。
22.上述技術方案具有如下優點:
23.本發明提供的一種多域多物理耦合數值模擬負載均衡方法,對耦合度較低的計算域進行遞歸分解,形成不需要進行相互數據遷移就可以保持組間負載均衡的計算域組;根據各個計算域組的計算量占全部計算域的總體計算量的比例,計算各個計算域組的資源組規模,給各個計算域組分配資源組;各個計算域組的資源組是互斥的,并集為全局資源組;根據各個計算域的計算量占所屬計算域組的計算量的比例,計算各個計算域的資源組規模,給各個計算域分配資源組;各個計算域的資源組是互斥的,并集為計算域組的資源組。本發明能夠解決多域多物理模的多程序數據流計算過程中,由于過程依賴造成計算等待問題,提升負載均衡的效率。
附圖說明
24.通過閱讀參照以下附圖對非限制性實施例所作的詳細描述,本發明及其特征、外形和優點將會變得更加明顯。在全部附圖中相同的標記指示相同的部分。并未刻意按照比例繪制附圖,重點在于示出本發明的主旨。
25.圖1是本發明實施例1提供一種多域多物理耦合數值模擬負載均衡方法建模的流程圖;
26.圖2是本發明實施例1提供一種多域多物理耦合數值模擬負載均衡方法經過步驟2劃分后的流程圖;
27.圖3是本發明實施例1提供一種多域多物理耦合數值模擬負載均衡方法的一種無法分割的計算域組的流程圖;
28.圖4是本發明實施例1提供一種多域多物理耦合數值模擬負載均衡方法的流程示
意圖。
具體實施方式
29.下面結合本發明實施例中的附圖,對本發明實施例中的技術方案進行說明,顯然所描述的實施例僅僅是本發明的一部分實施例,而不是全部的實施例。因此,以下對附圖中提供的本發明實施例中的詳細描述并非旨在限制要求保護的本發明的范圍,而是僅僅表示本發明的選定實施例。基于本發明的實施例,本領域技術人員在沒有作出創造性勞動的前提下所獲得的所有其他實施例,都屬于本發明的保護范圍。
30.實施例1:
31.在面對多域多物理耦合數值模擬負載均衡問題時,為了便于理解,首先先對該問題進行建模:
32.計算域:計算域控制和存儲了計算域上所有計算所需要的數據,這些數據可以在運行時全部存儲在分布式內存中,或者通過內存緩沖機制,按需從外存讀入內存中。計算域是計算操作發生的數據主體,在計算域上定義的計算操作基本采用單程序多數據流模型(spmd)。
33.資源組:以進程或者線程為基本單位組成的分布式計算資源,這些資源可以按照重疊或不重疊的方式形成集合,即為資源組。如果這些資源都是進程,則資源組可以等同于進程組。下文中不再對線程和進程加以區分,統一以進程加以描述。
34.計算流程:有多個計算域參與計算,每個計算域上定義了多個計算流程。單個計算域上的某一個計算流程在開始到結束過程中需要與其它計算域進行通信和同步。計算流程的計算量表示為在某資源組規模下需要的計算時間,量綱為“進程數*時間”,具體數量跟計算硬件性能和并行規模有關系,需要在運行時進行迭代修正。
35.流程圖:完整的多域多物理耦合計算可以抽象為具有周期性的迭代過程,每一個迭代過程具有相似性。因此對于流程的抽象,主要是對一個迭代周期的抽象。一個迭代周期可以抽象為一個有向無環圖,示意如圖1所示。其中,regx為計算域,regx.x為周期中各個計算域上按序執行的計算流程,barx為同步通信節點。
36.負載均衡:通過為各個計算流程(包括同步流程),充分利用計算資源,最大化流程圖執行的并發度,從而最大限度降低完整流程的執行時間,提高mpmd并行的運行效率。
37.在對負載均衡進行建模的基礎,本發明實施例1提供一種多域多物理耦合數值模擬負載均衡方法,包括:
38.步驟1:將沒有同步節點的計算域分配到不同的計算域組中;
39.步驟2:選擇計算域組中的特定同步流程節點,將該特定同步流程節點連接的計算域分解為2個以上沒有其他同步關系的多個計算域組;
40.步驟3:對子計算域組執行步驟2、步驟3,直至步驟2中無法再選擇特定同步流程節點,得到若干不可分解的計算域組;
41.步驟5:根據各個計算域組的計算量占全部計算域的總體計算量的比例,計算各個計算域組的資源組規模,給各個計算域組分配資源組;各個計算域組的資源組是互斥的,并集為全局資源組;
42.步驟6:根據各個計算域的計算量占所屬計算域組的計算量的比例,計算各個計算
域的資源組規模,給各個計算域分配資源組;各個計算域的資源組是互斥的,并集為計算域組的資源組;
43.其中,特定同步流程節點需要滿足:取消該同步節點后,所連接的計算域可以分解為2個以上沒有同步關系的計算域組。如圖1、圖2所示,將圖1所示的計算流程圖,按照bar3同步節點分割,可以得兩個計算域組,如圖2。
44.步驟2中“選擇計算域組中的特定同步流程節點”具體為:
45.步驟201:通過統計原始流程圖,對計算域間的同步次數進行統計;
46.步驟202:按照域間同步次數由大到小進行計算域兩兩聚合,形成聚合樹;
47.步驟203:依次按照聚合樹廣度優先遍歷可以快速到所有的所需同步節點。
48.在經過計算域分組后,計算域組內部形成子流程圖讓任意組內的兩個計算域之間有兩個以上同步流程節點,因此無法繼續進行劃分,例如圖3所示。(圖3僅為用于此處說明,與圖1、圖2無關)
49.根據流程圖特點可以知道,如需達到完美平衡,分解流程圖中每個節點應有完備的連接關系:
50.1)任何同步節點前后任意一側,所有計算流程節點的執行時間(計算流程的計算量除以資源組規模),按照計算域加和應當相等;
51.2)執行過程任意階段所有計算域占有的資源組規模應當等于總體資源總和(按進程數量計)。
52.可以歸納證明,以計算流程的資源組規模為未知量,這個樣的關系組成了封閉的非線性方程組,可以通過求解方程組得到每一個計算流程的資源組規模。同步節點除了本身是一個跨計算域的計算流程,其計算開銷應該主要是數據遷移開銷。
53.在本實施例中,為了降低計算過程中數據遷移的成本,步驟6還包括:根據各個計算域的資源組規模,分配計算域的運行時數據庫;其中,運行時數據用于在各個計算階段,遷移存儲該階段計算流程必要數據,計算完畢后將數據更新回基礎計算域數據庫。
54.為了減少計算過程中需要遷移的數據量,還包括緩存機制:在不突破存儲的情況下,為各個計算階段緩存必要的數據副本。
55.在本實施例中,還包括平鋪機制:在計算時,若計算域組中的數據規模相對較大或者分配的資源組相對較小,將計算域組的數據進行平鋪,即每個計算域都分配計算域組的資源組,各計算域的資源組相互重疊。無論流程圖結構如何,平鋪情況下始終不需要進行負載均衡和遷移數據。
56.計算域上定義的多個計算流程依賴的數據,并不一定具有嚴格的順序依賴關系,因此,在本實施例中,還包括通信計算重疊策略:在執行計算的過程中,各進程同步緩存后續計算流程的數據。
57.本發明實施例中還包括綜合開銷評估策略:通過開銷評估和運行時監測統計,確定每個計算階段的數據遷移的開銷和不進行數據遷移情況下計算不均衡的等待開銷,在保證計算綜合用時最短的前提下,確定某一計算階段是否執行數據遷移。
58.以上所述僅為本發明的優選實施例,并非因此限制本發明的專利范圍,凡是利用本發明說明書及附圖內容所作的等效結構變換,或直接或間接運用在其他相關的技術領域,均同理包括在本發明的專利保護范圍內。

技術特征:


1.一種多域多物理耦合數值模擬負載均衡方法,其特征在于,包括步驟1:將沒有同步節點的計算域分配到不同的計算域組中;步驟2:選擇計算域組中的特定同步流程節點,將該特定同步流程節點連接的計算域分解為2個以上沒有其他同步關系的多個計算域組;步驟3:對子計算域組執行步驟2、步驟3,直至步驟2中無法再選擇特定同步流程節點,得到若干不可分解的計算域組;步驟5:根據各個計算域組的計算量占全部計算域的總體計算量的比例,計算各個計算域組的資源組規模,給各個計算域組分配資源組;各個計算域組的資源組是互斥的,并集為全局資源組;步驟6:根據各個計算域的計算量占所屬計算域組的計算量的比例,計算各個計算域的資源組規模,給各個計算域分配資源組;各個計算域的資源組是互斥的,并集為計算域組的資源組;其中,特定同步流程節點需要滿足:取消該同步節點后,所連接的計算域可以分解為2個以上沒有同步關系的計算域組。2.如權利要求1所述的多域多物理耦合數值模擬負載均衡方法,其特征在于,步驟6還包括:根據各個計算域的資源組規模,分配計算域的運行時數據庫;其中,運行時數據用于在各個計算階段,遷移存儲該階段計算流程必要數據,計算完畢后將數據更新回基礎計算域數據庫。3.如權利要求2所述的多域多物理耦合數值模擬負載均衡方法,其特征在于,還包括緩存機制:在不突破存儲的情況下,為各個計算階段緩存必要的數據副本。4.如權利要求1所述的多域多物理耦合數值模擬負載均衡方法,其特征在于,還包括平鋪機制:在計算時,若計算域組中的數據規模相對較大或者分配的資源組相對較小,將計算域組的數據進行平鋪。5.如權利要求1所述的多域多物理耦合數值模擬負載均衡方法,其特征在于,還包括通信計算重疊策略:在執行計算的過程中,各進程同步緩存后續計算流程的數據。6.如權利要求1所述的多域多物理耦合數值模擬負載均衡方法,其特征在于,還包括綜合開銷評估策略:通過開銷評估和運行時監測統計,確定每個計算階段的數據遷移的開銷和不進行數據遷移情況下計算不均衡的等待開銷,在保證計算綜合用時最短的前提下,確定某一計算階段是否執行數據遷移。7.如權利要求1所述的多域多物理耦合數值模擬負載均衡方法,其特征在于,所述步驟2中“選擇計算域組中的特定同步流程節點”具體為:步驟201:通過統計原始流程圖,對計算域間的同步次數進行統計;步驟202:按照域間同步次數由大到小進行計算域兩兩聚合,形成聚合樹;步驟203:依次按照聚合樹廣度優先遍歷可以快速到所有的所需同步節點。

技術總結


本發明提供的一種多域多物理耦合數值模擬負載均衡方法,對耦合度較低的計算域進行遞歸分解,形成不需要進行相互數據遷移就可以保持組間負載均衡的計算域組;根據各個計算域組的計算量占全部計算域的總體計算量的比例,計算各個計算域組的資源組規模,給各個計算域組分配資源組;各個計算域組的資源組是互斥的,并集為全局資源組;根據各個計算域的計算量占所屬計算域組的計算量的比例,計算各個計算域的資源組規模,給各個計算域分配資源組;各個計算域的資源組是互斥的,并集為計算域組的資源組。本發明能夠解決多域多物理模的多程序數據流計算過程中,由于過程依賴造成計算等待問題,提升負載均衡的效率。提升負載均衡的效率。提升負載均衡的效率。


技術研發人員:

任虎

受保護的技術使用者:

任虎

技術研發日:

2022.07.15

技術公布日:

2023/1/19


文章投稿或轉載聲明

本文鏈接:http://m.newhan.cn/zhuanli/patent-1-76778-0.html

來源:專利查詢檢索下載-實用文體寫作網版權所有,轉載請保留出處。本站文章發布于 2023-01-25 08:34:48

發表評論

驗證碼:
用戶名: 密碼: 匿名發表
評論列表 (有 條評論
2人圍觀
參與討論