一種圖像檢測模型的確定方法及裝置與流程
1.本技術涉及圖像檢測技術領域,尤其涉及一種圖像檢測模型的確定方法及裝置。
背景技術:
2.隨著智能攝像頭以及視覺分析技術的普及,視頻幀和單張圖像的檢測方法變得越來越重要。相關技術中提出了創建以及預訓練圖像檢測模型,來實現對圖像的檢測。目前創建圖像檢測模型一般是通過神經結構搜索(neural architecture search,nas)技術實現的。主要分為兩個階段:第一階段,基于用于訓練的圖像集,通過權重共享技術對搜索空間中所有的子網絡的參數進行訓練優化,提升所有子網絡的性能。第二階段,利用典型的搜索算法,比如進化算法,在各種資源約束下確定最佳的圖像檢測模型架構。
3.但是目前第一階段的采樣和訓練過程采用的是均勻采樣策略,也就是說,針對搜索空間中所有的子網絡均采用用于預訓練的圖像集進行同等方式的訓練,無法保證訓練精度,并且如果在圖像集中的圖像較少的情況下,訓練后的子網絡還可能會出現過擬合的問題。從而也導致了在第二階段搜索出的圖像檢測模型架構仍需要再次訓練,增加了訓練成本。
技術實現要素:
4.本技術提供一種圖像檢測模型的確定方法及裝置,用以提升圖像檢測模型的準確度。
5.第一方面,本技術提供了一種圖像檢測模型的確定方法,包括:
6.獲取用于預訓練的第一圖像集以及用于構建圖像檢測模型的多個候選子網絡;
7.根據所述多個候選子網絡的訓練損失,確定所述多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式;所述多個候選子網絡的訓練損失是基于所述第一圖像集確定的;
8.采用所述每個集合對應的訓練方式對所述每個集合包括的候選子網絡進行訓練,得到訓練后的多個候選子網絡;
9.根據所述訓練后的多個候選子網絡的準確率,確定所述圖像檢測模型包括的子網絡。
10.在一些實施例中,所述方法還包括:
11.獲取用于預訓練的第二圖像集;所述第一圖像集和所述第二圖像集包括的訓練樣本不同;
12.所述根據所述訓練后的多個候選子網絡的準確率,確定所述圖像檢測模型中包括的子網絡,具體包括:
13.通過所述第二圖像集對所述訓練后的多個候選子網絡中的目標子網絡進行訓練,確定所述目標子網絡的各參數;所述目標子網絡為所述訓練后的多個子候選網絡中包含最優解數量大于設定閾值的任意一個子網絡;
14.將所述訓練后的多個候選子網絡中除所述目標子網絡外的任一候選子網絡的參數替換為所述各參數;
15.通過所述第一圖像集和所述第二圖像集確定替換參數后的所述任一候選子網絡的準確率;
16.將準確率高于預設值的候選子網絡組成所述圖像檢測模型。
17.在一些實施例中,所述將準確率高于預設值的候選子網絡組成所述神經網絡模型,包括:
18.根據所述準確率高于預設值的候選子網絡的多種組合方式,確定多個候選檢測模型;
19.采用所述第一圖像集和所述第二圖像集確定所述多個候選檢測模型的準確率;
20.將準確率最高的候選檢測模型作為所述圖像檢測模型。
21.在一些實施例中,所述根據所述多個候選子網絡的訓練損失,確定所述多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式,包括:
22.采用所述第一圖像集對所述多個候選子網絡進行訓練,確定每個子網絡的訓練損失;
23.根據所述每個候選子網絡的訓練損失,確定所述每個候選子網絡所屬的集合;
24.基于任一集合包括的候選子網絡的訓練損失,根據所述第一圖像集生成所述任一集合對應的訓練方式。
25.第二方面,本技術提供了一種圖像檢測模型的確定裝置,所述裝置包括:
26.獲取單元,用于獲取用于預訓練的第一圖像集以及用于構建圖像檢測模型的多個候選子網絡;
27.處理單元,被配置為執行:
28.根據所述多個候選子網絡的訓練損失,確定所述多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式;所述多個候選子網絡的訓練損失是基于所述第一圖像集確定的;
29.采用所述每個集合對應的訓練方式對所述每個集合包括的候選子網絡進行訓練,得到訓練后的多個候選子網絡;
30.根據所述訓練后的多個候選子網絡的準確率,確定所述圖像檢測模型包括的子網絡。
31.在一些實施例中,所述獲取單元,還用于獲取用于預訓練的第二圖像集;所述第一圖像集和所述第二圖像集包括的訓練樣本不同;
32.所述處理單元,具體執行:
33.通過所述第二圖像集對所述訓練后的多個候選子網絡中的目標子網絡進行訓練,確定所述目標子網絡的各參數;所述目標子網絡為所述訓練后的多個子候選網絡中包含最優解數量大于設定閾值的任意一個子網絡;
34.將所述訓練后的多個候選子網絡中除所述目標子網絡外的任一候選子網絡的參數替換為所述各參數;
35.通過所述第一圖像集和所述第二圖像集確定替換參數后的所述任一候選子網絡的準確率;
36.將準確率高于預設值的候選子網絡組成所述圖像檢測模型。
37.在一些實施例中,所述處理單元,在將準確率高于預設值的候選子網絡組成所述神經網絡模型時,具體用于:
38.根據所述準確率高于預設值的候選子網絡的多種組合方式,確定多個候選檢測模型;
39.采用所述第一圖像集和所述第二圖像集確定所述多個候選檢測模型的準確率;
40.將準確率最高的候選檢測模型作為所述圖像檢測模型。
41.在一些實施例中,所述處理單元,在根據所述多個候選子網絡的訓練損失,確定所述多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式時,具體用于:
42.采用所述第一圖像集對所述多個候選子網絡進行訓練,確定每個子網絡的訓練損失;
43.根據所述每個候選子網絡的訓練損失,確定所述每個候選子網絡所屬的集合;
44.基于任一集合包括的候選子網絡的訓練損失,根據所述第一圖像集生成所述任一集合對應的訓練方式。
45.第三方面,提供了一種電子設備,所述電子設備包括控制器和存儲器。存儲器用于存儲計算機執行指令,控制器執行存儲器中的計算機執行指令以利用控制器中的硬件資源執行第一方面任一種可能實現的方法的操作步驟。
46.第四方面,提供一種計算機可讀存儲介質,計算機可讀存儲介質中存儲有指令,當其在計算機上運行時,使得計算機執行上述各方面的方法。
47.本技術提出的圖像檢測模型的確定方法中,不再采用均勻采樣策略從搜索空間中獲取候選子網絡以及訓練候選子網絡,而是根據候選子網絡的訓練損失將候選子網絡分為多個集合,為每個集合配置不同的訓練方式,最后再根據訓練后的多個候選子網絡的準確率確定所要創建的圖像檢測模型包括的子網絡。本技術提出的方案優化了創建圖像檢測模型的過程,從根本上提升了圖像檢測模型的準確率。
附圖說明
48.為了更清楚地說明本發明實施例中的技術方案,下面將對實施例描述中所需要使用的附圖作簡要介紹,顯而易見地,下面描述中的附圖僅僅是本發明的一些實施例,對于本領域的普通技術人員來講,在不付出創造性勞動的前提下,還可以根據這些附圖獲得其他的附圖。
49.圖1為本技術實施例提供的一種圖像檢測模型的確定方法流程圖;
50.圖2為本技術實施例提供的一種帕累托約束下樣本分布示意圖;
51.圖3為本技術實施例提供的另一種圖像檢測模型的確定方法流程圖;
52.圖4為本技術實施例提供的一種圖像檢測模型的確定裝置的結構示意圖;
53.圖5為本技術實施例提供的一種電子設備的結構示意圖。
具體實施方式
54.為使本發明實施例的目的、技術方案和優點更加清楚,下面將結合本發明實施例
中的附圖,對本發明實施例中的技術方案進行清楚、完整地描述。
55.需要說明的是,本技術中的術語“第一”、“第二”等是用于區別類似的對象,而不必用于描述特定的順序或先后次序。應所述理解這樣使用的數據在適當情況下可以互換,以便這里描述的本公開的實施例能夠以除了在這里圖示或描述的那些以外的順序實施。以下示例性實施例中所描述的實施方式并不代表與本技術相一致的所有實施方式。相反,它們僅是與如所附權利要求書中所詳述的、本技術的一些方面相一致的裝置和方法的例子。
56.圖像檢測技術包括分析單張圖像中包括的目標,還包括對視頻流中包括的目標進行檢測。具體通過預先訓練好的圖像檢測模型對圖像進行特征識別,提取目標位置和目標特征,確定目標的標簽。可以看出,為了保證圖像檢測技術的準確性,提升圖像檢測模型的精度就變得尤為重要了。提升模型的精度主要分為兩種方式,第一種是在創建模型時能夠精準地選擇合適的子網絡進行模型的構建,第二種是在模型使用之前的預訓練過程,增大預訓練的圖像集數量和種類,以提升模型的精度。其中第一種方式可以從根本上解決模型精度的問題,并且采用合適的子網絡創建模型也可以節約預訓練的成本。因此,創建模型的過程是比較重要的。
57.目前常見的圖像檢測模型的創建方式是通過nas技術實現的。nas數據為高效的神經網絡設計提供了一種強大的自動化工具,傳統的nas技是基于進化算法和強化學習,給定一個稱為搜索空間的候選子網絡集合,用某種策略從中搜索出最優網絡結構。神經網絡結構的優劣即性能用某些指標如精度、速度等來度量,也可以稱為性能評估。在搜索過程的每次迭代中,將從搜索空間中獲取的候選子網絡組成一個候選神經網絡結構。在訓練樣本集上訓練候選神經網絡結構,然后在驗證集上評估其性能。逐步優化網絡結構,直至到最優的候選神經網絡結構,作為所要創建的神經網絡模型。但是由于每秒百萬個浮點操作(million floating-point operations per second,mflops),導致生成模型的成本比較高。
58.因此,在相關技術中提出了將nas技術解耦為兩個階段:第一階段,基于用于訓練的圖像集,通過權重共享技術對搜索空間中所有的子網絡的參數進行訓練優化。第二階段,利用典型的搜索算法,比如進化算法,在各種資源約束下確定最佳的圖像檢測模型架構。其中第一階段采用的是均勻采樣策略,具體包括兩個步驟,一是將搜索空間中概率相同的子網絡組成集合,二是對所有的子網絡進行同等程度的訓練。
59.可以看出,第一階段的兩個步驟中第一個步驟關注了區分準確性和推理效率不同的子網絡,將不同概率的子網絡組成不同的集合。但是第二個步驟采用均勻采樣策略并未針對不同的集合設置不同的訓練方式,因此并不能充分訓練各個子網絡。簡單來說,采用均勻采樣策略無法保障生成的圖像檢測模型的帕累托(pareto)前沿,若后續用于訓練的圖像數量不足,則無法保障圖像檢測模型的精度。
60.為了解決上述問題,本技術提出了一種圖像檢測模型的確定方法及裝置,通過用于預訓練的圖像集確定搜索空間中所有候選子網絡的訓練損失,基于訓練損失將候選子網絡分類,對于屬于不同類別的候選子網絡采用不同的訓練方式,最后基于訓練后的候選子網絡的準確率確定生成的圖像檢測模型中包括的子網絡。
61.下面,對本技術提出的圖像檢測模型的確定方法進行具體介紹。本技術下述實施例中,“和/或”,描述關聯對象的關聯關系,表示可以存在三種關系,例如,a和/或b,可以表
示:單獨存在a,同時存在a和b,單獨存在b的情況,其中a,b可以是單數或者復數。字符“/”一般表示前后關聯對象是一種“或”的關系。“以下至少一項(個)”或其類似表達,是指的這些項中的任意組合,包括單項(個)或復數項(個)的任意組合。例如,a,b或c中的至少一項(個),可以表示:a,b,c,a-b,a-c,b-c,或a-b-c,其中a,b,c可以是單個,也可以是多個。單數表達形式“一個”、“一種”、“所述”、“上述”、“該”和“這一”旨在也包括例如“一個或多個”這種表達形式,除非其上下文中明確地有相反指示。以及,除非有相反的說明,本技術實施例提及“第一”、“第二”等序數詞是用于對多個對象進行區分,不用于限定多個對象的順序、時序、優先級或者重要程度。例如,第一任務執行設備和第二任務執行設備,只是為了區分不同的任務執行設備,而并不是表示這兩種任務執行設備的優先級或者重要程度等的不同。
62.在本技術說明書中描述的參考“一個實施例”或“一些實施例”等意味著在本技術的一個或多個實施例中包括結合該實施例描述的特定特征、結構或特點。由此,在本說明書中的不同之處出現的語句“在一個實施例中”、“在一些實施例中”、“在其他一些實施例中”、“在另外一些實施例中”等不是必然都參考相同的實施例,而是意味著“一個或多個但不是所有的實施例”,除非是以其他方式另外特別強調。術語“包括”、“包含”、“具有”及它們的變形都意味著“包括但不限于”,除非是以其他方式另外特別強調。
63.下面,具體介紹本技術提供的方案,參見圖1,為本技術實施例提供的一種圖像檢測模型的確定方法流程圖。需要說明的是,本技術對于圖1所示的圖像檢測模型的確定方法流程的執行主體不作限定,比如可以由電腦、手機等終端設備來執行,也可以由服務器、服務器集、處理器或者處理芯片等具有計算功能的電子設備來執行,還可以由云端的計算平臺來執行。圖1所示的方法流程具體包括:
64.101,獲取用于預訓練的第一圖像集以及用于構建圖像檢測模型的多個候選子網絡。
65.可選地,候選子網絡可以采用nas技術中涉及的搜索空間中包括的子網絡。可選地,第一圖像集中可以包括多張圖像,以及每張圖像的標簽。
66.作為一種示例,任意一張圖像的標簽可以用于表征該圖像中是否包括目標或者該圖像中包括的目標的位置、數量等特征,具體的圖像和標簽的對應關系以及標簽的表征意義可以根據需求設定,不同的需求對應所要創建的圖像檢測模型的作用不相同。
67.102,根據多個候選子網絡的訓練損失,確定多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式。
68.其中,多個候選子網絡的訓練損失是基于第一圖像集確定的。可選地,可以采用第一圖像集中包括的各個圖像及對應標簽對獲取到的候選子網絡進行訓練,確定每個候選子網絡的訓練損失,根據訓練損失將候選子網絡進行分類,使得分類后得到的每一個集合中的候選子網絡的訓練損失相同或者相差小于閾值。
69.在一種可能實現的方式中,在確定多個候選子網絡所述的至少一個集合之后,可以進一步根據每個集合中包括的候選子網絡的訓練損失確定每個集合對應的訓練方式。可選地,針對訓練損失較小的候選子網絡組成的集合,可以配置包含更多訓練樣本以及更多訓練迭代次數的訓練方式,更進一步地增加訓練損失小的候選子網絡的準確度。針對訓練損失較大的候選子網絡組成的集合,可以通過訓練損失提升訓練樣本中難樣本所占比例。
70.103,采用每個集合對應的訓練方式對每個集合包括的候選子網絡進行訓練,得到
訓練后的多個候選子網絡。
71.104,根據訓練后的多個候選子網絡的準確率,確定圖像檢測模型包括的子網絡。
72.可選地,可以根據用于預訓練的第一圖像集確定多個候選子網絡的準確率,也可以采用不同于第一圖像集的其他圖像和對應標簽驗證多個候選子網絡的準確率。進一步地,可以將準確率高于預設值的候選子網絡組成圖像檢測模型。
73.基于上述方案,本技術提出的圖像檢測模型的確定方法中,不再采用均勻采樣策略從搜索空間中獲取候選子網絡以及訓練候選子網絡,而是根據候選子網絡的訓練損失將候選子網絡分為多個集合,為每個集合配置不同的訓練方式,最后再根據訓練后的多個候選子網絡的準確率確定所要創建的圖像檢測模型包括的子網絡。本技術提出的方案優化了創建圖像檢測模型的過程,從根本上提升了圖像檢測模型的準確率。
74.可選地,在確定所要生成的圖像檢測模型之后,可以獲取該圖像檢測模型的第一圖像集,第一圖像集包括多張圖像以及每張圖像對應的標簽。
75.在一些實施例中,可以采用第一圖像集對多個候選子網絡進行訓練,確定每個候選子網絡的訓練損失,將訓練損失相同或者相差較小的候選子網絡組成一個集合,得到多個候選子網絡組成的至少一個集合。進一步地,可以基于每個集合中包括的候選子網絡的訓練損失,根據第一圖像集生成任一集合對應的訓練方式。已知目前的nas技術目標是在不同的計算約束下到具有更加準確性的網絡體系結構,作為一種示例,參見圖2,展示了帕累托最佳和帕累托最差約束條件下的樣本分布情況。基于此,本技術提出可以設置不同的集合有不用的訓練方式。
76.作為一種可選的方式,可以為包含訓練損失小的候選子網絡的集合配置更多的訓練樣本以及訓練迭代次數。比如,可以將訓練損失小的集合看作最佳帕累托集合,針對這類集合的訓練方式可以投入更多的訓練預算以改進當前的帕累托最佳前沿。作為另一種可選的方式,可以為包含訓練損失大的候選子網絡的集合配置包含難樣本更多的訓練方式,改變原有的訓練樣本中正負樣本的比例,通過集合中候選子網絡的訓練損失提升難樣本所占的比例。比如,類似難例挖掘技術,通過改變最差帕累托模型帶來更多的信息梯度,從而提升訓練損失大的候選子網絡的精度。
77.在一個或多個實施例中,在確定最佳帕累托集合和最差帕累托集合時,還可以采用性能評估器計算每個候選子網絡的訓練損失。作為一種示例,可以采用mini-batch損失的性能評估器,可以將第一圖像集分為90%的訓練樣本和10%的驗證樣本,可以采用訓練樣本對多個候選子網絡進行無約束預訓練,然后采用驗證樣本評估這些候選子網絡的性能。
78.可選地,在對多個候選子網絡進行無約束預訓練時,可以確定多個候選子網絡的共享權重,并基于確定的共享權重確定構建圖像檢測模型的子網絡。具體地,可以采用如下公式(1)-公式(2)確定共享權重:
[0079][0080][0081]
其中,w為共享權重,a為任意一個候選子網絡,a為候選子網絡集合,wa為候選子網絡a的權重,為正則項,為as訓練損失最小的候選子網絡,a
l
為訓練損失最小的候選
子網絡,為候選子網絡as的權重,為候選子網絡a
l
的權重,η為重量衰減系數。
[0082]
在一個或多個實施例中,在根據每個集合對應的訓練方式對每個集合訓練之后,可以根據訓練后的多個候選子網絡的準確率確定創建的圖像檢測模型包括的子網絡。比如,可以采用如下公式(3)確定圖像檢測模型包括的子網絡:
[0083][0084]
其中,為圖像檢測模型包括的第i個子網絡,a為候選子網絡集合,是通過公式(1)和公式(2)學習得到第i個子網絡的權重共享參數。
[0085]
作為一種可能實現的方式,可以獲取用于預訓練的第二圖像集。其中第一圖像集和第二圖像集包括的訓練樣本不相同。在創建圖像檢測模型時,可以從上述采用第一圖像集訓練后的多個候選子網絡中確定目標子網絡。其中目標子網絡可以看作是過度參數化的子網絡,即包含最優解數量大于設定閾值的子網絡。進一步地,可以采用第二圖像集對目標子網絡進行訓練,確定目標子網絡包括的各個參數,將多個候選子網絡中除目標子網絡之外的其他候選子網絡的參數替換為目標子網絡的參數。再進一步地,可以通過第一圖像集和第二圖像集確定替換參數后的各個候選子網絡的準確率,并將準確率高于預設值的候選子網絡組成圖像檢測模型。
[0086]
可選地,還可以在確定準確率高于預設值的候選子網絡之后,根據這些子網絡的多種組合方式確定多個候選檢測模型,采用第一圖像集和第二圖像集確定多個候選檢測模型的準確率,將準確率最高的候選檢測模型作為圖像檢測模型。
[0087]
下面,為了更進一步的理解本技術的方案,結合具體的實施例進行介紹。參見圖3,為本技術實施例提供的一種圖像檢測模型的確定方法流程圖,具體包括:
[0088]
301,確定所要創建的圖像檢測模型對應的第一圖像集和第二圖像集。
[0089]
302,采用第一圖像集確定搜索空間中包括的候選子網絡的訓練損失。
[0090]
303,根據每個候選子網絡的訓練損失,確定每個候選子網絡所屬的集合以及確定每個集合對應的訓練方式。
[0091]
具體的分集合以及確定集合對應的訓練方式的過程可以參見上述實施例中的介紹,在此不再進行贅述。
[0092]
304,采用每個集合對應的訓練方式對每個集合中包括的候選子網絡進行訓練,確定訓練后的多個候選子網絡中的目標子網絡。
[0093]
305,采用第二圖像集對目標子網絡進行訓練,確定目標子網絡包括的各參數。
[0094]
306,將多個候選子網絡中除目標子網絡外的其他候選子網絡的參數替換為目標子網絡的參數。
[0095]
307,采用第一圖像集和第二圖像集確定替換參數后的候選子網絡的準確率,根據準確率高于預設值的候選子網絡的不同組合方式確定多個候選檢測模型。
[0096]
308,將多個候選檢測模型中準確率最高的檢測模型作為所要創建的圖像檢測模型。
[0097]
基于與上述方法的同一構思,參見圖4,為本技術實施例提供的一種圖像檢測模型的確定裝置400。裝置400用于執行上述方法中的各個步驟,為了避免重復,此處不再進行贅述。裝置400包括:獲取單元401和處理單元402。
[0098]
獲取單元401,用于獲取用于預訓練的第一圖像集以及用于構建圖像檢測模型的多個候選子網絡;
[0099]
處理單元402,被配置為執行:
[0100]
根據所述多個候選子網絡的訓練損失,確定所述多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式;所述多個候選子網絡的訓練損失是基于所述第一圖像集確定的;
[0101]
采用所述每個集合對應的訓練方式對所述每個集合包括的候選子網絡進行訓練,得到訓練后的多個候選子網絡;
[0102]
根據所述訓練后的多個候選子網絡的準確率,確定所述圖像檢測模型包括的子網絡。
[0103]
在一些實施例中,所述獲取單元401,還用于獲取用于預訓練的第二圖像集;所述第一圖像集和所述第二圖像集包括的訓練樣本不同;
[0104]
所述處理單元402,具體執行:
[0105]
通過所述第二圖像集對所述訓練后的多個候選子網絡中的目標子網絡進行訓練,確定所述目標子網絡的各參數;所述目標子網絡為所述訓練后的多個子候選網絡中包含最優解數量大于設定閾值的任意一個子網絡;
[0106]
將所述訓練后的多個候選子網絡中除所述目標子網絡外的任一候選子網絡的參數替換為所述各參數;
[0107]
通過所述第一圖像集和所述第二圖像集確定替換參數后的所述任一候選子網絡的準確率;
[0108]
將準確率高于預設值的候選子網絡組成所述圖像檢測模型。
[0109]
在一些實施例中,所述處理單元402,在將準確率高于預設值的候選子網絡組成所述神經網絡模型時,具體用于:
[0110]
根據所述準確率高于預設值的候選子網絡的多種組合方式,確定多個候選檢測模型;
[0111]
采用所述第一圖像集和所述第二圖像集確定所述多個候選檢測模型的準確率;
[0112]
將準確率最高的候選檢測模型作為所述圖像檢測模型。
[0113]
在一些實施例中,所述處理單元402,在根據所述多個候選子網絡的訓練損失,確定所述多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式時,具體用于:
[0114]
采用所述第一圖像集對所述多個候選子網絡進行訓練,確定每個子網絡的訓練損失;
[0115]
根據所述每個候選子網絡的訓練損失,確定所述每個候選子網絡所屬的集合;
[0116]
基于任一集合包括的候選子網絡的訓練損失,根據所述第一圖像集生成所述任一集合對應的訓練方式。
[0117]
圖5示出了本技術實施例提供的電子設備500結構示意圖。本技術實施例中的電子設備500還可以包括通信接口503,該通信接口503例如是網口,電子設備可以通過該通信接口503傳輸數據。
[0118]
在本技術實施例中,存儲器502存儲有可被至少一個控制器501執行的指令,至少
一個控制器501通過執行存儲器502存儲的指令,可以用于執行上述方法中的各個步驟,例如,控制器501可以實現上述圖4中的獲取單元401和處理單元402的功能。
[0119]
其中,控制器501是電子設備的控制中心,可以利用各種接口和線路連接整個電子設備的各個部分,通過運行或執行存儲在存儲器502內的指令以及調用存儲在存儲器502內的數據。可選的,控制器501可包括一個或多個處理單元,控制器501可集成應用控制器和調制解調控制器,其中,應用控制器主要處理操作系統和應用程序等,調制解調控制器主要處理無線通信。可以理解的是,上述調制解調控制器也可以不集成到控制器501中。在一些實施例中,控制器501和存儲器502可以在同一芯片上實現,在一些實施例中,它們也可以在獨立的芯片上分別實現。
[0120]
控制器501可以是通用控制器,例如中央控制器(英文:central processing unit,簡稱:cpu)、數字信號控制器、專用集成電路、現場可編程門陣列或者其他可編程邏輯器件、分立門或者晶體管邏輯器件、分立硬件組件,可以實現或者執行本技術實施例中公開的各方法、步驟及邏輯框圖。通用控制器可以是微控制器或者任何常規的控制器等。結合本技術實施例所公開的數據統計平臺所執行的步驟可以直接由硬件控制器執行完成,或者用控制器中的硬件及軟件模塊組合執行完成。
[0121]
存儲器502作為一種非易失性計算機可讀存儲介質,可用于存儲非易失性軟件程序、非易失性計算機可執行程序以及模塊。存儲器502可以包括至少一種類型的存儲介質,例如可以包括閃存、硬盤、多媒體卡、卡型存儲器、隨機訪問存儲器(英文:random access memory,簡稱:ram)、靜態隨機訪問存儲器(英文:static random access memory,簡稱:sram)、可編程只讀存儲器(英文:programmable read only memory,簡稱:prom)、只讀存儲器(英文:read only memory,簡稱:rom)、帶電可擦除可編程只讀存儲器(英文:electrically erasable programmable read-only memory,簡稱:eeprom)、磁性存儲器、磁盤、光盤等等。存儲器502是能夠用于攜帶或存儲具有指令或數據結構形式的期望的程序代碼并能夠由計算機存取的任何其他介質,但不限于此。本技術實施例中的存儲器502還可以是電路或者其它任意能夠實現存儲功能的裝置,用于存儲程序指令和/或數據。
[0122]
通過對控制器501進行設計編程,例如,可以將前述實施例中介紹的神經網絡模型的訓練方法所對應的代碼固化到芯片內,從而使芯片在運行時能夠執行前述的神經網絡模型訓練方法的步驟,如何對控制器501進行設計編程為本領域技術人員所公知的技術,這里不再贅述。
[0123]
本領域內的技術人員應明白,本技術的實施例可提供為方法、系統、或計算機程序產品。因此,本技術可采用完全硬件實施例、完全軟件實施例、或結合軟件和硬件方面的實施例的形式。而且,本技術可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(包括但不限于磁盤存儲器、cd-rom、光學存儲器等)上實施的計算機程序產品的形式。
[0124]
本技術是參照根據本技術的方法、設備(系統)、和計算機程序產品的流程圖和/或方框圖來描述的。應理解可由計算機程序指令實現流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其它可編程數據處理設備的控制器以產生一個機器,使得通過計算機或其它可編程數據處理設備的控制器執行的指令產生用于實現在流
程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0125]
這些計算機程序指令也可存儲在能引導計算機或其它可編程數據處理設備以特定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產生包括指令裝置的制造品,該指令裝置實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0126]
這些計算機程序指令也可裝載到計算機或其它可編程數據處理設備上,使得在計算機或其它可編程設備上執行一系列操作步驟以產生計算機實現的處理,從而在計算機或其它可編程設備上執行的指令提供用于實現在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0127]
盡管已描述了本技術的優選實施例,但本領域內的技術人員一旦得知了基本創造性概念,則可對這些實施例做出另外的變更和修改。所以,所附權利要求意欲解釋為包括優選實施例以及落入本技術范圍的所有變更和修改。
[0128]
顯然,本領域的技術人員可以對本技術進行各種改動和變型而不脫離本技術的精神和范圍。這樣,倘若本技術的這些修改和變型屬于本技術權利要求及其等同技術的范圍之內,則本技術也意圖包含這些改動和變型在內。
技術特征:
1.一種圖像檢測模型的確定方法,其特征在于,所述方法包括:獲取用于預訓練的第一圖像集以及用于構建圖像檢測模型的多個候選子網絡;根據所述多個候選子網絡的訓練損失,確定所述多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式;所述多個候選子網絡的訓練損失是基于所述第一圖像集確定的;采用所述每個集合對應的訓練方式對所述每個集合包括的候選子網絡進行訓練,得到訓練后的多個候選子網絡;根據所述訓練后的多個候選子網絡的準確率,確定所述圖像檢測模型包括的子網絡。2.根據權利要求1所述的方法,其特征在于,所述方法還包括:獲取用于預訓練的第二圖像集;所述第一圖像集和所述第二圖像集包括的訓練樣本不同;所述根據所述訓練后的多個候選子網絡的準確率,確定所述圖像檢測模型中包括的子網絡,具體包括:通過所述第二圖像集對所述訓練后的多個候選子網絡中的目標子網絡進行訓練,確定所述目標子網絡的各參數;所述目標子網絡為所述訓練后的多個子候選網絡中包含最優解數量大于設定閾值的任意一個子網絡;將所述訓練后的多個候選子網絡中除所述目標子網絡外的任一候選子網絡的參數替換為所述各參數;通過所述第一圖像集和所述第二圖像集確定替換參數后的所述任一候選子網絡的準確率;將準確率高于預設值的候選子網絡組成所述圖像檢測模型。3.根據權利要求2所述的方法,其特征在于,所述將準確率高于預設值的候選子網絡組成所述神經網絡模型,包括:根據所述準確率高于預設值的候選子網絡的多種組合方式,確定多個候選檢測模型;采用所述第一圖像集和所述第二圖像集確定所述多個候選檢測模型的準確率;將準確率最高的候選檢測模型作為所述圖像檢測模型。4.根據權利要求1-3任一項所述的方法,其特征在于,所述根據所述多個候選子網絡的訓練損失,確定所述多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式,包括:采用所述第一圖像集對所述多個候選子網絡進行訓練,確定每個子網絡的訓練損失;根據所述每個候選子網絡的訓練損失,確定所述每個候選子網絡所屬的集合;基于任一集合包括的候選子網絡的訓練損失,根據所述第一圖像集生成所述任一集合對應的訓練方式。5.一種圖像檢測模型的確定裝置,其特征在于,所述裝置包括:獲取單元,用于獲取用于預訓練的第一圖像集以及用于構建圖像檢測模型的多個候選子網絡;處理單元,被配置為執行:根據所述多個候選子網絡的訓練損失,確定所述多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式;所述多個候選子網絡的訓練損失是基于所述第
一圖像集確定的;采用所述每個集合對應的訓練方式對所述每個集合包括的候選子網絡進行訓練,得到訓練后的多個候選子網絡;根據所述訓練后的多個候選子網絡的準確率,確定所述圖像檢測模型包括的子網絡。6.根據權利要求5所述的裝置,其特征在于,所述獲取單元,還用于獲取用于預訓練的第二圖像集;所述第一圖像集和所述第二圖像集包括的訓練樣本不同;所述處理單元,具體執行:通過所述第二圖像集對所述訓練后的多個候選子網絡中的目標子網絡進行訓練,確定所述目標子網絡的各參數;所述目標子網絡為所述訓練后的多個子候選網絡中包含最優解數量大于設定閾值的任意一個子網絡;將所述訓練后的多個候選子網絡中除所述目標子網絡外的任一候選子網絡的參數替換為所述各參數;通過所述第一圖像集和所述第二圖像集確定替換參數后的所述任一候選子網絡的準確率;將準確率高于預設值的候選子網絡組成所述圖像檢測模型。7.根據權利要求6所述的裝置,其特征在于,所述處理單元,在將準確率高于預設值的候選子網絡組成所述神經網絡模型時,具體用于:根據所述準確率高于預設值的候選子網絡的多種組合方式,確定多個候選檢測模型;采用所述第一圖像集和所述第二圖像集確定所述多個候選檢測模型的準確率;將準確率最高的候選檢測模型作為所述圖像檢測模型。8.根據權利要求5-7任一項所述的裝置,其特征在于,所述處理單元,在根據所述多個候選子網絡的訓練損失,確定所述多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式時,具體用于:采用所述第一圖像集對所述多個候選子網絡進行訓練,確定每個子網絡的訓練損失;根據所述每個候選子網絡的訓練損失,確定所述每個候選子網絡所屬的集合;基于任一集合包括的候選子網絡的訓練損失,根據所述第一圖像集生成所述任一集合對應的訓練方式。9.一種電子設備,其特征在于,包括:存儲器,用于存儲計算機指令;控制器,與所述存儲器連接,用于執行所述存儲器中的計算機指令,且在執行所述計算機指令時實現如權利要求1~4中任一項所述的方法。10.一種計算機可讀存儲介質,其特征在于,包括:所述計算機可讀存儲介質存儲有計算機指令,當所述計算機指令在計算機上運行時,使得所述計算機執行如權利要求1~4中任一項所述的方法。
技術總結
本申請公開了一種圖像檢測模型的確定方法及裝置,用以從根本上提升圖像檢測模型的準確率。該方法包括:獲取用于預訓練的第一圖像集以及用于構建圖像檢測模型的多個候選子網絡;根據多個候選子網絡的訓練損失,確定多個候選子網絡分別所屬的至少一個集合,以及確定每個集合對應的訓練方式;多個候選子網絡的訓練損失是基于第一圖像集確定的;采用每個集合對應的訓練方式對每個集合包括的候選子網絡進行訓練,得到訓練后的多個候選子網絡;根據訓練后的多個候選子網絡的準確率,確定圖像檢測模型包括的子網絡。測模型包括的子網絡。測模型包括的子網絡。
