本文作者:kaifamei

一種基于增量主動學習的電費異常檢測方法及其裝置與流程

更新時間:2025-12-25 15:49:21 0條評論

一種基于增量主動學習的電費異常檢測方法及其裝置與流程



1.本發明涉及信息處理和電力營銷技術領域,尤其涉及一種基于增量主動學習的電費異常檢測方法及一種基于增量主動學習的電費異常檢測裝置。


背景技術:



2.現有的電費異常檢測方法主要包括兩類:一類是基于簡單規則的異常檢測方法,另一類是基于數據驅動的異常檢測算法。
3.基于簡單規則的異常檢測算法主要依賴業務專家對業務中的常見問題進行歸納總結,形成形式化的語言描述,并通過程序語言中的邏輯運算對規則進行實現;基于數據驅動的異常檢測算法往往不依賴于業務知識,通過引入各類歸納偏置構建有參或無參的算法模型,并依賴應用的數據實現模型的訓練和調優,從而達到異常檢測的目的,常見的異常檢測算法包括基于樣本距離度量的knn、ocsvm等,基于樣本統計量的hbos、mcd等,基于集成方法的,如iforest,以及神經網絡模型的算法,如autoencoder,vae等。
4.雖然現有的異常檢測算法已經深入應用在電力營銷的業務環節中,但現有的方法都存在著一定的不足?;诤唵我巹t的異常檢測方法主要應用于核算過程中的問題發現,此類方法不依賴于復雜的模型設計,通過簡單的邏輯判定實現異常問題的挖掘,比如通過設計閾值策略來篩選出電量突增減的用戶,具有高效研判、實現簡單的特點,但此類方法的靈活性和可擴展性不高,比如當用戶的算費數據受到季節性或地域性因素的影響時,規則無法自適應地根據當月數據進行調整,導致出現大量誤報或漏報問題;并且基于規則的檢測方法往往直接內嵌在算費代碼中,更新和維護的成本高,迭代優化的風險成本高?;跀祿寗拥漠惓z測算法雖然可以基于數據實現模型的自適應調整,但不少算費模型的計算復雜度高,無法滿足算費時間效率上的要求,更多地應用在事后的問題核查和歸因。并且這類算法需要面臨數據質量問題的影響,當用于訓練的數據質量不高時,模型的檢測性能往往無法滿足實際應用要求。此外,無論是基于過程問題發現的核算規則還是基于事后核查的算法模型,其構建和維護都依賴大量的人力成本,比如核算規則的迭代優化需要業務人員針對每月的異常數據進行分析歸因,總結提煉規則優化內容,而對于數據驅動的算法模型,數據的獲取和處理也占用了極大的人力成本,這些條件限制了現有的檢測模型的性能,也難以滿足愈加復雜多變的業務應用場景。


技術實現要素:



5.針對現有技術中的缺陷和不足,本發明提供了一種基于增量主動學習的電費異常檢測方法,以解決現有技術中存在的現有電費異常檢測算法靈活性低、構建及維護成本高、數據質量受限的問題。
6.作為本發明的第一個方面,提供一種基于增量主動學習的電費異常檢測方法,所述基于增量主動學習的電費異常檢測方法包括:步驟s1:獲取多個目標用戶的當前電費數據,每一所述目標用戶的當前電費數據
包括檔案數據、業務變更數據以及量價費數據;步驟s2:基于核算規則體系對所述目標用戶的當前電費數據進行初次異常檢測,如果所述目標用戶的當前電費數據不觸發異常規則,則直接輸出目標用戶無異常的檢測結果;如果所述目標用戶的當前電費數據觸發所述異常規則,則輸出多個目標用戶中的疑似異常用戶;步驟s3:基于svdd異常檢測模型對所述疑似異常用戶的電費數據進行二次異常檢測,以得到疑似異常用戶檢測結果,并對所述疑似異常用戶檢測結果的不確定度進行判斷,以確定是否輸出所述疑似異常用戶檢測結果;步驟s4:如果所述疑似異常用戶檢測結果的不確定度低于預設閾值,則直接輸出所述疑似異常用戶的檢測結果;如果所述疑似異常用戶檢測結果的不確定度高于所述預設閾值,則對該不確定度高的疑似異常用戶的電費數據進行最終異常研判,輸出該不確定度高的疑似異常用戶中的正常用戶。
7.進一步地,所述基于核算規則體系對所述目標用戶的當前電費數據進行初次異常檢測,如果所述目標用戶的當前電費數據不觸發異常規則,則直接輸出目標用戶無異常的檢測結果;如果所述目標用戶的當前電費數據觸發所述異常規則,則輸出多個目標用戶中的疑似異常用戶,還包括:根據所述核算規則體系中的每一條異常規則的定義,判定該條異常規則是否被所述目標用戶的當前電費數據觸發;對于所述目標用戶的每一個當前電費數據,計算其觸發異常規則的情況,將觸發至少一條異常規則的目標用戶,計入疑似異常用戶,等待二次異常檢測。
8.進一步地,還包括:選取所述核算規則體系中的多條異常規則開展驗證;如果,則表示所述目標用戶的當前電費數據x觸發了第k條異常規則;如果則表示所述目標用戶的當前電費數據x未觸發第條異常規則;則每個所述目標用戶的當前電費數據x的初步檢測結果表示為,其中p表示所述核算規則體系中異常規則的數目。
9.進一步地,所述基于svdd異常檢測模型對所述疑似異常用戶的電費數據進行二次異常檢測,以得到疑似異常用戶檢測結果,并對所述疑似異常用戶檢測結果的不確定度進行判斷,以確定是否輸出所述疑似異常用戶檢測結果,還包括:根據所述疑似異常用戶所觸發的異常規則,采用對應的svdd異常檢測模型,計算所述疑似異常用戶的電費數據與支持向量描述模型中心點之間的距離度量,并根據度量值對所述疑似異常用戶進行二次研判,得到疑似異常用戶檢測結果;根據所述疑似異常用戶的電費數據的異常分布特點,確定所述疑似異常用戶檢測結果的不確定度,對于該不確定度高的疑似異常用戶的電費數據,需要進行人工再研判。
10.進一步地,還包括:對于每個所述目標用戶的當前電費數據x的初步檢測結果,如果,則表示多個目標用戶中存在疑似異常用戶,然后對所述疑似異常用戶的電費數據進行二次
異常檢測;根據每條異常規則對應的異常類別,實現了一個svdd異常檢測模型表示第條異常規則對應的svdd異常檢測模型,一共有p個svdd異常檢測模型;假定所有正常電費數據在高維空間中被最小邊界包圍,位于最小邊界上的電費數據被稱為支持向量,通過svdd異常檢測模型檢測所述疑似異常用戶的電費數據是否位于最小邊界內來判定異常用戶;基于信息熵公式計算svdd模型檢測結果的不確定度。
11.進一步地,還包括:基于所述正常用戶的電費數據,對所述svdd異常檢測模型進行增量訓練。
12.進一步地,所述檔案數據包括用戶的用電類型、市場化屬性、電壓等級、計量方式、運行容量、合同容量、定價策略類型、功率因數考核方式、基本電費計算方式、電源數量、電量計算方式、參與功率因數計算方式、臨時用電標志、行業類別、用能類別和分時用電標志。
13.進一步地,所述業務變更數據包括新裝增容、暫停、減容、改類、計量設備故障處理、改壓、計量設備更換、暫?;謴?、減容恢復和受電設施改造。
14.進一步地,所述量價費數據包括電價類型、輸配電價、電度電價、加收電價、上次抄表示數、本次抄表示數、有功電量、需量示數、無功電量、基本電費、電度電費和力調電費。
15.作為本發明的第二個方面,提供一種基于增量主動學習的電費異常檢測裝置,所述基于增量主動學習的電費異常檢測裝置包括:獲取模塊,用于獲取多個目標用戶的當前電費數據,每一所述目標用戶的當前電費數據包括檔案數據、業務變更數據以及量價費數據;第一異常檢測模塊,用于基于核算規則體系對所述目標用戶的當前電費數據進行初次異常檢測,如果所述目標用戶的當前電費數據不觸發異常規則,則直接輸出目標用戶無異常的檢測結果;如果所述目標用戶的當前電費數據觸發所述異常規則,則輸出多個目標用戶中的疑似異常用戶;第二異常檢測模塊,用于基于svdd異常檢測模型對所述疑似異常用戶的電費數據進行二次異常檢測,以得到疑似異常用戶檢測結果,并對所述疑似異常用戶檢測結果的不確定度進行判斷,以確定是否輸出所述疑似異常用戶檢測結果;第三異常檢測模塊,用于如果所述疑似異常用戶檢測結果的不確定度低于預設閾值,則直接輸出所述本次疑似異常用戶的檢測結果;如果所述疑似異常用戶檢測結果的不確定度高于所述預設閾值,則對該不確定度高的疑似異常用戶的電費數據進行最終異常研判,輸出該不確定度高的疑似異常用戶中的正常用戶。
16.本發明提供的基于增量主動學習的電費異常檢測方法具有以下優點:(1)將異常檢測模型與現有的核算體系相結合,保留現有核算規則異常研判方式,通過引入數據驅動的異常檢測模型突破了現有核算規則對于電費異常難以實現精準研判的性能瓶頸;(2)拓展了現有的異常研判模式,不同于單純依賴規則研判或模型研判,而是提出了一種新方法將兩者結合,既保證了模型可以通過數據實現自動迭代更新,拓展了模型的靈活性,又保證了模型在主動學習技術下,可以獲取業務專家知識的支撐,拓展了模型的穩定性;
(3)通過增量學習策略,避免了檢測模型在迭代更新過程中需要重新訓練的弊端,每次模型更新僅需從每月的業務工作中獲取增量數據,且數據選擇過程由模型自主完成,免去了人工挑選數據的工作量。
附圖說明
17.附圖是用來提供對本發明的進一步理解,并且構成說明書的一部分,與下面的具體實施方式一起用于解釋本發明,但并不構成對本發明的限制。
18.圖1為本發明提供的基于增量主動學習的電費異常檢測方法的流程圖。
19.圖2為本發明提供的基于增量主動學習的電費異常檢測方法的具體實施方式流程圖。
具體實施方式
20.需要說明的是,在不沖突的情況下,本發明中的實施例及實施例中的特征可以相互結合。下面將參考附圖并結合實施例來詳細說明本發明。
21.為了使本領域技術人員更好地理解本發明方案,下面將結合本發明實施例中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發明一部分的實施例,而不是全部的實施例?;诒景l明中的實施例,本領域普通技術人員在沒有做出創造性勞動前提下所獲得的所有其他實施例,都應當屬于本發明保護的范圍。
22.需要說明的是,本發明的說明書和權利要求書及上述附圖中的術語“第一”、“第二”等是用于區別類似的對象,而不必用于描述特定的順序或先后次序。應該理解這樣使用的數據在適當情況下可以互換,以便這里描述的本發明的實施例。此外,術語“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包括,例如,包含了一系列步驟或單元的過程、方法、系統、產品或設備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對于這些過程、方法、產品或設備固有的其它步驟或單元。
23.在本實施例中提供了一種基于增量主動學習的電費異常檢測方法,圖1為本發明提供的基于增量主動學習的電費異常檢測方法的流程圖。如圖1所示,所述基于增量主動學習的電費異常檢測方法,包括:步驟s1:獲取多個目標用戶的當前電費數據,每一所述目標用戶的當前電費數據包括檔案數據、業務變更數據以及量價費數據;步驟s2:基于核算規則體系對所述目標用戶的當前電費數據進行初次異常檢測,如果所述目標用戶的當前電費數據不觸發異常規則,則直接輸出目標用戶無異常的檢測結果;如果所述目標用戶的當前電費數據觸發所述異常規則,則輸出多個目標用戶中的疑似異常用戶;需要說明的是,不觸發異常規則指的是不觸發所述核算規則體系中的任意一個異常規則,觸發所述異常規則指的是觸發所述核算規則體系中的任意一個或多個異常規則。
24.步驟s3:基于svdd異常檢測模型對所述疑似異常用戶的電費數據進行二次異常檢測,以得到疑似異常用戶檢測結果,并對所述疑似異常用戶檢測結果的不確定度進行判斷,以確定是否輸出所述疑似異常用戶檢測結果;步驟s4:如果所述疑似異常用戶檢測結果的不確定度低于預設閾值,則直接輸出
所述疑似異常用戶的檢測結果;如果所述疑似異常用戶檢測結果的不確定度高于所述預設閾值,則對該不確定度高的疑似異常用戶的電費數據進行最終異常研判,輸出該不確定度高的疑似異常用戶中的正常用戶。
25.需要說明的是,基于主動學習策略,對該不確定度高的異常用戶進一步開展人工研判(根據專家經驗運行的一套研判機制),得到最終異常用戶。
26.下面結合圖2對本發明提供的基于增量主動學習的電費異常檢測方法的具體實施過程進行詳細說明。
27.優選地,所述基于核算規則體系對所述目標用戶的當前電費數據進行初次異常檢測,如果所述目標用戶的當前電費數據不觸發異常規則,則直接輸出目標用戶無異常的檢測結果;如果所述目標用戶的當前電費數據觸發所述異常規則,則輸出多個目標用戶中的疑似異常用戶,還包括:根據所述核算規則體系中的每一條異常規則的定義,判定該條異常規則是否被所述目標用戶的當前電費數據觸發;對于所述目標用戶的每一個當前電費數據,計算其觸發異常規則的情況,將觸發至少一條異常規則的目標用戶,計入疑似異常用戶,等待二次異常檢測。
28.優選地,還包括:選取所述核算規則體系中的多條異常規則開展驗證;需要說明的是,選取現有核算規則體系中每月觸發次數排名靠前的12條異常規則開展算法驗證。
29.如果,則表示所述目標用戶的當前電費數據x觸發了第k條異常規則;如果則表示所述目標用戶的當前電費數據x未觸發第k條異常規則;則每個所述目標用戶的當前電費數據x的初步檢測結果表示為,其中p表示所述核算規則體系中異常規則的數目。
30.優選地,所述基于svdd異常檢測模型對所述疑似異常用戶的電費數據進行二次異常檢測,以得到疑似異常用戶檢測結果,并對所述疑似異常用戶檢測結果的不確定度進行判斷,以確定是否輸出所述疑似異常用戶檢測結果,還包括:根據所述疑似異常用戶所觸發的異常規則,采用對應的svdd異常檢測模型,計算所述疑似異常用戶的電費數據與支持向量描述模型中心點之間的距離度量,并根據度量值對所述疑似異常用戶進行二次研判,得到疑似異常用戶檢測結果;同時,為了保證異常用戶不被誤判,即使異常用戶已經被模型研判為異常,仍需根據所述疑似異常用戶的電費數據的異常分布特點,確定所述疑似異常用戶檢測結果的不確定度,對于該不確定度高的疑似異常用戶的電費數據,需要進行人工再研判。
31.由于模型研判過程伴隨著實際業務工作,因此異常樣本的人工再研判的模式與當前基于核算規則的業務人員再研判模式保持一致,其優點在于引入的不確定度度量進一步削減了需要人工研判的異常量,同時伴隨模型的擴充完善,未知異常分布的樣本會被模型通過添加到支持向量集合的方式完成模型記憶,因此,人工研判的工作量會不斷降低。
32.優選地,還包括:
對于每個所述目標用戶的當前電費數據x的初步檢測結果,如果,則表示多個目標用戶中存在疑似異常用戶,然后對所述疑似異常用戶的電費數據進行二次異常檢測;根據每條異常規則對應的異常類別,實現了一個svdd異常檢測模型,用fk表示第k條異常規則對應的svdd異常檢測模型,一共有p個svdd異常檢測模型,svdd異常檢測模型包含一組支持向量集合和模型參數;假定所有正常電費數據在高維空間中被最小邊界包圍,位于最小邊界上的電費數據被稱為支持向量,通過svdd異常檢測模型檢測所述疑似異常用戶的電費數據是否位于最小邊界內來判定異常用戶;上述過程形式化描述為,其中z指代用于訓練的電費數據樣本,如果,則所述疑似異常用戶的電費數據是異常點,其中表示在高維空間中所述疑似異常用戶的電費數據最小邊界包圍中心之間的平方和距離度量,表示最小邊界包圍空間的半徑度量,r2可以根據支持向量求解獲得;p個檢測模型對應輸出的異常用戶檢測結果可以得到一個向量集合,其中,之后基于信息熵公式計算檢測結果的不確定度,其中;如果不確定度h(q)大于設定的經驗閾值,則通過人工研判環節來進行最終研判,研判結果記為,其中。如果則表示最終異常用戶的電費數據確實不存在第k類規則下的異常,將正常用戶的電費數據加入到集合xk中。在每次完成一批新用戶檢測后,將得到p個樣本集合{}。xk指的是不觸發第k類異常規則的所有正常用戶的電費數據。
33.優選地,還包括:基于所述正常用戶的電費數據,對所述svdd異常檢測模型進行增量訓練。
34.具體地,根據集合xk對p個svdd異常檢測模型進行增量訓練,訓練方式采用fisvdd算法,對于單個svdd模型,假定原模型的特征向量集合為s
tk
,其構成的相似度矩陣記為a
t
,其中t為訓練輪次的指代,參數向量記為,對于每個來自樣本集合xk的新增樣本z,svdd異常檢測模型的訓練過程如下:(1)根據判定當前樣本z是否在當前檢測模型參數下被判定為異常樣本,如果,則樣本z是異常樣本,則進入步驟(2),如果,則直接繼續考察
下一個樣本;(2)將當前異常樣本z加入到支持向量集合中,并更新相似度矩陣:,同時更新模型參數,更新公式為,其中表示全1向量。為了簡化計算過程,可以通過和實現增量計算:,其中,而,和為用于簡化模型表示的中間變量。
35.(3)如果,則表示當前的參數不符合模型最小包圍的假設,至少有一個支持向量在當前包圍內部,需要對模型進行調整,將不符合要求的支持向量剔除支持向量集,并重新計算步驟(2)中的模型參數。
36.詳細訓練流程如下:輸入:svdd模型參數α
tk,
支持向量集s
tk
,增量訓練樣本集tk;輸出:更新后的模型參數α
t+1k
和支持向量集s
t+1k
;step 1: 按樣本存儲順序依次獲取訓練樣本集合中的單個樣例z;step 2: 根據支持向量集s
tk
計算訓練樣例z是否位于支持向量集所構成的樣本空間內;step 3: 根據步驟2的判定結果生成擴充樣本集:如果樣例z落入在樣本空間中,則舍棄該樣本,否則將該樣本與原有的支持向量集合形成擴充樣本集;step 4: 根據擴充樣本集形成的相似度矩陣計算模型參數α
t+1k
,并通過對模型參數的數值約束完成對擴充樣本集的修正,將擴充樣本集劃分成新的支持向量集合和保留集合;step 5: 對保留集合中的樣本開展二次數據校核,將滿足條件的樣本重新加入到支持向量集合,形成最終的支持向量集s
t+1k
,并依據最新的支持向量集合更新對應的模型參數α
t+1k

37.優選地,所述檔案數據包括用戶的用電類型、市場化屬性、電壓等級、計量方式、運行容量、合同容量、定價策略類型、功率因數考核方式、基本電費計算方式、電源數量、電量計算方式、參與功率因數計算方式、臨時用電標志、行業類別、用能類別、分時用電標志等。
38.優選地,所述業務變更數據包括新裝增容、暫停、減容、改類、計量設備故障處理、改壓、計量設備更換、暫?;謴汀p容恢復、受電設施改造等。
39.優選地,所述量價費數據包括電價類型、輸配電價、電度電價、加收電價、上次抄表示數、本次抄表示數、有功電量(總)、有功電量(尖峰)、有功電量(峰)、有功電量(平)、有功電量(谷)、需量示數、無功電量(總)、基本電費、電度電費、力調電費等。
40.作為本發明的另一個實施例,提出了一種基于增量主動學習的電費異常檢測裝置,所述基于增量主動學習的電費異常檢測裝置包括:獲取模塊,用于獲取多個目標用戶的當前電費數據,每一所述目標用戶的當前電費數據包括檔案數據、業務變更數據以及量價費數據;第一異常檢測模塊,用于基于核算規則體系對所述目標用戶的當前電費數據進行
初次異常檢測,如果所述目標用戶的當前電費數據不觸發異常規則,則直接輸出目標用戶無異常的檢測結果;如果所述目標用戶的當前電費數據觸發所述異常規則,則輸出多個目標用戶中的疑似異常用戶;第二異常檢測模塊,用于基于svdd異常檢測模型對所述疑似異常用戶的電費數據進行二次異常檢測,以得到疑似異常用戶檢測結果,并對所述疑似異常用戶檢測結果的不確定度進行判斷,以確定是否輸出所述疑似異常用戶檢測結果;第三異常檢測模塊,用于如果所述疑似異常用戶檢測結果的不確定度低于預設閾值,則直接輸出所述本次疑似異常用戶的檢測結果;如果所述疑似異常用戶檢測結果的不確定度高于所述預設閾值,則對該不確定度高的疑似異常用戶的電費數據進行最終異常研判,輸出該不確定度高的疑似異常用戶中的正常用戶。
41.綜上所述,本發明提供的基于增量主動學習的電費異常檢測方法,結合了現有核算規則體系和主流的異常檢測模型svdd,解決當前核算規則體系命中率低、無法應用業務數據自主完成模型迭代更新的問題。
42.可以理解的是,以上實施方式僅僅是為了說明本發明的原理而采用的示例性實施方式,然而本發明并不局限于此。對于本領域內的普通技術人員而言,在不脫離本發明的精神和實質的情況下,可以做出各種變型和改進,這些變型和改進也視為本發明的保護范圍。

技術特征:


1.一種基于增量主動學習的電費異常檢測方法,其特征在于,所述基于增量主動學習的電費異常檢測方法包括:步驟s1:獲取多個目標用戶的當前電費數據,每一所述目標用戶的當前電費數據包括檔案數據、業務變更數據以及量價費數據;步驟s2:基于核算規則體系對所述目標用戶的當前電費數據進行初次異常檢測,如果所述目標用戶的當前電費數據不觸發異常規則,則直接輸出目標用戶無異常的檢測結果;如果所述目標用戶的當前電費數據觸發所述異常規則,則輸出多個目標用戶中的疑似異常用戶;步驟s3:基于svdd異常檢測模型對所述疑似異常用戶的電費數據進行二次異常檢測,以得到疑似異常用戶檢測結果,并對所述疑似異常用戶檢測結果的不確定度進行判斷,以確定是否輸出所述疑似異常用戶檢測結果;步驟s4:如果所述疑似異常用戶檢測結果的不確定度低于預設閾值,則直接輸出所述疑似異常用戶的檢測結果;如果所述疑似異常用戶檢測結果的不確定度高于所述預設閾值,則對該不確定度高的疑似異常用戶的電費數據進行最終異常研判,輸出該不確定度高的疑似異常用戶中的正常用戶。2.根據權利要求1所述的基于增量主動學習的電費異常檢測方法,其特征在于,所述基于核算規則體系對所述目標用戶的當前電費數據進行初次異常檢測,如果所述目標用戶的當前電費數據不觸發異常規則,則直接輸出目標用戶無異常的檢測結果;如果所述目標用戶的當前電費數據觸發所述異常規則,則輸出多個目標用戶中的疑似異常用戶,還包括:根據所述核算規則體系中的每一條異常規則的定義,判定該條異常規則是否被所述目標用戶的當前電費數據觸發;對于所述目標用戶的每一個當前電費數據,計算其觸發異常規則的情況,將觸發至少一條異常規則的目標用戶,計入疑似異常用戶,等待二次異常檢測。3.根據權利要求2所述的基于增量主動學習的電費異常檢測方法,其特征在于,還包括:選取所述核算規則體系中的多條異常規則開展驗證;如果,則表示所述目標用戶的當前電費數據x觸發了第k條異常規則;如果則表示所述目標用戶的當前電費數據x未觸發第k條異常規則;則每個所述目標用戶的當前電費數據x的初步檢測結果表示為,其中p表示所述核算規則體系中異常規則的數目。4.根據權利要求3所述的基于增量主動學習的電費異常檢測方法,其特征在于,所述基于svdd異常檢測模型對所述疑似異常用戶的電費數據進行二次異常檢測,以得到疑似異常用戶檢測結果,并對所述疑似異常用戶檢測結果的不確定度進行判斷,以確定是否輸出所述疑似異常用戶檢測結果,還包括:根據所述疑似異常用戶所觸發的異常規則,采用對應的svdd異常檢測模型,計算所述疑似異常用戶的電費數據與支持向量描述模型中心點之間的距離度量,并根據度量值對所述疑似異常用戶進行二次研判,得到疑似異常用戶檢測結果;
根據所述疑似異常用戶的電費數據的異常分布特點,確定所述疑似異常用戶檢測結果的不確定度,對于該不確定度高的疑似異常用戶的電費數據,需要進行人工再研判。5.根據權利要求4所述的基于增量主動學習的電費異常檢測方法,其特征在于,還包括:對于每個所述目標用戶的當前電費數據x的初步檢測結果r,如果,則表示多個目標用戶中存在疑似異常用戶,然后對所述疑似異常用戶的電費數據進行二次異常檢測;根據每條異常規則對應的異常類別,實現了一個svdd異常檢測模型,用f
k
表示第k條異常規則對應的svdd異常檢測模型,一共有p個svdd異常檢測模型;假定所有正常電費數據在高維空間中被最小邊界包圍,位于最小邊界上的電費數據被稱為支持向量,通過svdd異常檢測模型檢測所述疑似異常用戶的電費數據是否位于最小邊界內來判定異常用戶;基于信息熵公式計算所述疑似異常用戶的電費數據的不確定度。6.根據權利要求1所述的基于增量主動學習的電費異常檢測方法,其特征在于,還包括:基于所述正常用戶的電費數據,對所述svdd異常檢測模型進行增量訓練。7.根據權利要求1所述的基于增量主動學習的電費異常檢測方法,其特征在于,所述檔案數據包括用戶的用電類型、市場化屬性、電壓等級、計量方式、運行容量、合同容量、定價策略類型、功率因數考核方式、基本電費計算方式、電源數量、電量計算方式、參與功率因數計算方式、臨時用電標志、行業類別、用能類別和分時用電標志。8.根據權利要求1所述的基于增量主動學習的電費異常檢測方法,其特征在于,所述業務變更數據包括新裝增容、暫停、減容、改類、計量設備故障處理、改壓、計量設備更換、暫?;謴汀p容恢復和受電設施改造。9.根據權利要求1所述的基于增量主動學習的電費異常檢測方法,其特征在于,所述量價費數據包括電價類型、輸配電價、電度電價、加收電價、上次抄表示數、本次抄表示數、有功電量、需量示數、無功電量、基本電費、電度電費和力調電費。10.一種基于增量主動學習的電費異常檢測方法裝置,其特征在于,所述基于增量主動學習的電費異常檢測裝置包括:獲取模塊,用于獲取多個目標用戶的當前電費數據,每一所述目標用戶的當前電費數據包括檔案數據、業務變更數據以及量價費數據;第一異常檢測模塊,用于基于核算規則體系對所述目標用戶的當前電費數據進行初次異常檢測,如果所述目標用戶的當前電費數據不觸發異常規則,則直接輸出目標用戶無異常的檢測結果;如果所述目標用戶的當前電費數據觸發所述異常規則,則輸出多個目標用戶中的疑似異常用戶;第二異常檢測模塊,用于基于svdd異常檢測模型對所述疑似異常用戶的電費數據進行二次異常檢測,以得到疑似異常用戶檢測結果,并對所述疑似異常用戶檢測結果的不確定度進行判斷,以確定是否輸出所述疑似異常用戶檢測結果;第三異常檢測模塊,用于如果所述疑似異常用戶檢測結果的不確定度低于預設閾值,則直接輸出所述本次疑似異常用戶的檢測結果;如果所述疑似異常用戶檢測結果的不確定度高于所述預設閾值,則對該不確定度高的疑似異常用戶的電費數據進行最終異常研判,
輸出該不確定度高的疑似異常用戶中的正常用戶。

技術總結


本發明涉及信息處理和電力營銷技術領域,具體公開了基于增量主動學習的電費異常檢測方法,包括:對獲取到的多個目標用戶的當前電費數據進行初次異常檢測,如果觸發異常規則,則輸出多個目標用戶中的疑似異常用戶;對疑似異常用戶的電費數據進行二次異常檢測,以得到疑似異常用戶檢測結果,如果疑似異常用戶檢測結果的不確定度低于預設閾值,則直接輸出疑似異常用戶檢測結果;如果高于預設閾值,則對不確定度高的疑似異常用戶的電費數據進行最終研判,輸出該不確定度高的疑似異常用戶中的正常用戶。本發明還公開了基于增量主動學習的電費異常檢測裝置。本發明能夠解決當前核算規則體系命中率低、無法應用業務數據自主完成模型迭代更新的問題。迭代更新的問題。迭代更新的問題。


技術研發人員:

潘熙 祝宇楠 黃奇峰 劉云鵬 左強 蔡奇新 殷勇 江明

受保護的技術使用者:

國網江蘇省電力有限公司營銷服務中心

技術研發日:

2022.11.24

技術公布日:

2022/12/23


文章投稿或轉載聲明

本文鏈接:http://m.newhan.cn/zhuanli/patent-1-60730-0.html

來源:專利查詢檢索下載-實用文體寫作網版權所有,轉載請保留出處。本站文章發布于 2022-12-25 09:19:19

發表評論

驗證碼:
用戶名: 密碼: 匿名發表
評論列表 (有 條評論
2人圍觀
參與討論