本文作者:kaifamei

一種活體檢測方法和系統(tǒng)與流程

更新時(shí)間:2025-12-28 04:58:33 0條評論

一種活體檢測方法和系統(tǒng)與流程



1.本公開涉及生物識別技術(shù)領(lǐng)域,特別涉及一種活體檢測方法和系統(tǒng)。


背景技術(shù):



2.活體攻擊檢測是指在生活識別中,判斷用戶刷臉過程中的真人與攻擊,攻擊類型主要包括如照片、手機(jī)、屏幕、面具等攻擊的技術(shù)。隨著近年來人臉識別系統(tǒng)的不斷發(fā)展,活體攻擊檢測成為人臉識別系統(tǒng)中不可缺少的一環(huán)。利用活體攻擊檢測可以有效的攔截非活體類型的攻擊樣本。人臉識別系統(tǒng)會布置于各種設(shè)備上,這些設(shè)備包括手機(jī)、電腦等私人設(shè)備,以及一些專用的人臉識別設(shè)備。刷臉支付設(shè)備對于人臉識別系統(tǒng)的安全能力極為嚴(yán)格,為了能適配高等級的安全能力,需要充分利用刷臉過程中的時(shí)序信息,例如,從視頻中提取的眨眼、表情、動作及背景變化等信息,從而輔助活體攻擊檢測算法進(jìn)行最終的分類判斷。
3.與單幀圖像的活體攻擊檢測方法不同,以視頻為輸入的活體攻擊檢測方法可以包含時(shí)間維度的信息,雖然視頻片段不會很長,但會包含包括眨眼、表情、動作及背景變化等時(shí)序信息,從而對于活體攻擊檢測提供更多維度的辨識信息。目前的以視頻為輸入的活體攻擊檢測方法主要包括基于關(guān)鍵幀的活體攻擊檢測方法和基于雙流網(wǎng)絡(luò)的活體攻擊檢測方法。
4.其中,基于關(guān)鍵幀的視頻活體攻擊檢測方法首先通過關(guān)鍵幀提取網(wǎng)絡(luò)提取視頻中的關(guān)鍵幀(往往是內(nèi)容變化較大的幀),再通過二維圖像活體攻擊檢測的方式進(jìn)行分類。該方法整體上還是基于二維圖像的方法,關(guān)鍵幀無法充分表征時(shí)序信息?;陔p流網(wǎng)絡(luò)的視頻活體攻擊檢測方法是將視頻的特征提取拆成兩個(gè)并行部分(分別為基于單幀rgb的空間特征提取、以及基于光流的時(shí)間特征提取),再通過融合的特征進(jìn)行活體攻擊檢測。該方法中的空間特征僅來自于其中一幀,同時(shí)時(shí)序特征僅來自這一幀前后的光流信息,無法充分利用視頻中全部的時(shí)空信息。


技術(shù)實(shí)現(xiàn)要素:



5.本公開的主要目的是提供一種活體檢測方法和系統(tǒng),通過模仿人視覺系統(tǒng)的時(shí)序信息提取方式,構(gòu)建動、靜信息提取與融合的視頻活體攻擊檢測模型,從而提高活體攻擊檢測的特征魯棒性,為人臉識別系統(tǒng)建立堅(jiān)實(shí)的安全底盤。
6.本公開一方面提供一種活體檢測方法,包括:獲取目標(biāo)視頻,所述目標(biāo)視頻包括至少一幀圖像,所述目標(biāo)視頻中包括至少一個(gè)目標(biāo)對象;對所述目標(biāo)視頻進(jìn)行視頻拆幀,得到第一視頻幀子集和第二視頻幀子集,所述第一視頻幀子集對應(yīng)第一幀率,所述第二視頻幀子集對應(yīng)第二幀率,所述第一幀率小于所述第二幀率;基于所述第一視頻幀子集和所述第二視頻幀子集,確定所述目標(biāo)視頻的特征信息;以及基于所述特征信息,確定所述目標(biāo)對象的活體概率。
7.在一些實(shí)施例中,所述確定所述目標(biāo)視頻的特征信息,包括:采用第一檢測模型對所述第一視頻幀子集進(jìn)行特征提取,得到靜態(tài)特征信息;采用第二檢測模型對所述第二視
頻幀子集進(jìn)行特征提取,得到動態(tài)特征信息;以及基于所述靜態(tài)特征信息和所述動態(tài)特征信息,確定所述特征信息。
8.在一些實(shí)施例中,所述第一檢測模型和所述第二檢測模型中包含相同數(shù)量的特征提取模塊。
9.在一些實(shí)施例中,所述第一檢測模型中包含第一級靜態(tài)特征提取模塊、第二級靜態(tài)特征提取模塊和第三級靜態(tài)特征提取模塊;以及所述采用第一檢測模型對所述第一視頻幀子集進(jìn)行特征提取,得到靜態(tài)特征信息,包括:采用第一級靜態(tài)特征提取模塊對所述第一視頻幀子集進(jìn)行特征提取,得到第一級靜態(tài)特征信息;采用第二級靜態(tài)特征提取模塊對所述第一級靜態(tài)特征信息進(jìn)行特征提取,得到第二級靜態(tài)特征信息;以及采用第三級靜態(tài)特征提取模塊對所述第二級靜態(tài)特征信息進(jìn)行特征提取,得到第三級靜態(tài)特征信息。
10.在一些實(shí)施例中,所述第二檢測模型中包含第一級動態(tài)特征提取模塊、第二級動態(tài)特征提取模塊和第三級動態(tài)特征提取模塊;以及所述采用第二檢測模型對所述第二視頻幀子集進(jìn)行特征提取,得到動態(tài)特征信息,包括:采用第一級動態(tài)特征提取模塊對所述第二視頻幀子集進(jìn)行特征提取,得到第一級動態(tài)特征信息;采用第二級動態(tài)特征提取模塊對所述第一級動態(tài)特征信息進(jìn)行特征提取,得到第二級動態(tài)特征信息;以及采用第三級動態(tài)特征提取模塊對所述第二級動態(tài)特征信息進(jìn)行特征提取,得到第三級動態(tài)特征信息。
11.在一些實(shí)施例中,所述第一檢測模型中的靜態(tài)特征提取模塊的卷積核數(shù)大于所述第二檢測模型中對應(yīng)層級的動態(tài)特征提取模塊的卷積核數(shù)。
12.在一些實(shí)施例中,每個(gè)所述靜態(tài)特征提取模塊的卷積核數(shù)同與其對應(yīng)的所述動態(tài)特征提取模塊的卷積核數(shù)之比與所述第二幀率同所述第一幀率之比正相關(guān)。
13.在一些實(shí)施例中,所述第二幀率為所述第一幀率的n倍;以及每個(gè)所述靜態(tài)特征提取模塊的卷積核數(shù)為與其對應(yīng)層級的動態(tài)特征提取模塊的卷積核數(shù)的n倍,其中,n為大于1的自然數(shù)。
14.在一些實(shí)施例中,所述基于所述靜態(tài)特征信息和所述動態(tài)特征信息,確定所述特征信息,包括:將所述動態(tài)特征信息融合到所述靜態(tài)特征信息中,得到融合后的靜態(tài)特征信息;以及基于所述融合后的靜態(tài)特征信息和所述動態(tài)特征信息,確定所述特征信息。
15.在一些實(shí)施例中,所述將所述動態(tài)特征信息融合到所述靜態(tài)特征信息中,得到融合后的靜態(tài)特征信息,包括:將所述第一級動態(tài)特征信息與所述第一級靜態(tài)特征信息進(jìn)行特征融合,得到融合后的第一級特征信息;將所述融合后的第一級特征信息經(jīng)過所述第二級靜態(tài)特征提取模塊后,得到第二級特征信息;將所述第二級動態(tài)特征信息與所述第二級特征信息進(jìn)行特征融合,得到融合后的第二級特征信息;將所述融合后的第二級特征信息經(jīng)過所述第三級靜態(tài)特征提取模塊后,得到第三級特征信息;以及將所述第三級特征信息作為所述融合后的靜態(tài)特征信息。
16.在一些實(shí)施例中,所述基于所述融合后的靜態(tài)特征信息和所述動態(tài)特征信息,確定所述特征信息,包括:將所述第三級動態(tài)特征信息作為所述動態(tài)特征信息;以及將所述融合后的靜態(tài)特征信息和所述第三級動態(tài)特征信息共同作為所述特征信息。
17.在一些實(shí)施例中,所述基于所述特征信息,確定所述目標(biāo)對象的活體概率,包括:基于所述融合后的靜態(tài)特征信息,確定所述目標(biāo)對象的第一活體概率;基于所述動態(tài)特征信息,確定所述目標(biāo)對象的第二活體概率;以及基于所述第一活體概率和所述第二活體概
率,確定所述目標(biāo)對象的所述活體概率,所述活體概率用于指示所述目標(biāo)對象為活體對象的概率。
18.在一些實(shí)施例中,所述基于所述第一活體概率和所述第二活體概率,確定所述目標(biāo)對象的所述活體概率,包括:獲取所述第一活體概率和所述第二活體概率的權(quán)重比;以及基于所述權(quán)重比、所述第一活體概率和所述第二活體概率,確定所述目標(biāo)對象的活體概率。
19.在一些實(shí)施例中,在所述確定所述目標(biāo)對象的活體概率之后,還包括:將所述活體概率與預(yù)設(shè)概率閾值進(jìn)行對比;以及確定所述活體概率超過所述預(yù)設(shè)概率閾值,確定所述目標(biāo)對象為活體對象。
20.本公開另一方面提供一種活體檢測系統(tǒng),包括:
21.至少一個(gè)存儲介質(zhì),包括至少一個(gè)指令集,用于活體檢測方法的實(shí)施分析;以及
22.至少一個(gè)處理器,同所述至少一個(gè)存儲介質(zhì)通訊連接,
23.其中,當(dāng)所述系統(tǒng)運(yùn)行時(shí),所述至少一個(gè)處理器讀取所述至少一個(gè)指令集,并且根據(jù)所述至少一個(gè)指令集的指示執(zhí)行上述任一項(xiàng)所述的活體檢測方法。
24.由以上技術(shù)方案可知,本公開提供的活體檢測方法、執(zhí)行此方法的系統(tǒng)。所述方法和系統(tǒng)通過獲取目標(biāo)視頻,所述目標(biāo)視頻包括至少一幀圖像,所述目標(biāo)視頻中包括至少一個(gè)目標(biāo)對象;對所述目標(biāo)視頻進(jìn)行視頻拆幀,得到第一視頻幀子集和第二視頻幀子集,所述第一視頻幀子集對應(yīng)第一幀率,所述第二視頻幀子集對應(yīng)第二幀率,所述第一幀率小于所述第二幀率;基于所述第一視頻幀子集和所述第二視頻幀子集,確定所述目標(biāo)視頻的特征信息;以及基于所述特征信息,確定所述目標(biāo)對象的活體概率。本公開提供的上述方法通過模仿人視覺系統(tǒng)的時(shí)序信息提取方式,從目標(biāo)視頻中提取具有不同特征(動態(tài)特征信息、靜態(tài)特征信息)的視頻幀子集,并基于兩個(gè)不同的視頻幀子集確定目標(biāo)視頻的特征信息,從而提高活體攻擊檢測的特征魯棒性,為人臉識別系統(tǒng)建立堅(jiān)實(shí)的安全底盤。
25.本公開提供的活體檢測方法和系統(tǒng)的其他功能將在以下說明書中部分列出。根據(jù)描述,以下數(shù)字和實(shí)例介紹的內(nèi)容將對那些本領(lǐng)域的普通技術(shù)人員顯而易見。本公開提供的活體檢測方法和系統(tǒng)的創(chuàng)造性方面可以通過實(shí)踐或使用下面詳細(xì)實(shí)例中所述的方法、裝置和組合得到充分解釋。
附圖說明
26.為了更清楚地說明本公開實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要的使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本公開的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
27.圖1示出了根據(jù)本公開的一些實(shí)施例提供的一種活體檢測方法的系統(tǒng)的應(yīng)用場景示意圖;
28.圖2示出了根據(jù)本公開的一些實(shí)施例提供的一種計(jì)算設(shè)備的結(jié)構(gòu)示意圖;
29.圖3示出了根據(jù)本公開的一些實(shí)施例提供的一種活體檢測方法的方法流程圖;
30.圖4示出了根據(jù)本公開的一些實(shí)施例提供的一種活體檢測方法的整體示意圖;以及
31.圖5示出了根據(jù)本公開的一些實(shí)施例提供的一種步驟s300的流程圖。
具體實(shí)施方式
32.以下描述提供了本公開的特定應(yīng)用場景和要求,目的是使本領(lǐng)域技術(shù)人員能夠制造和使用本公開中的內(nèi)容。對于本領(lǐng)域技術(shù)人員來說,對所公開的實(shí)施例的各種局部修改是顯而易見的,并且在不脫離本公開的精神和范圍的情況下,可以將這里定義的一般原理應(yīng)用于其他實(shí)施例和應(yīng)用。因此,本公開不限于所示的實(shí)施例,而是與權(quán)利要求一致的最寬范圍。
33.這里使用的術(shù)語僅用于描述特定示例實(shí)施例的目的,而不是限制性的。比如,除非上下文另有明確說明,這里所使用的,單數(shù)形式“一”,“一個(gè)”和“該”也可以包括復(fù)數(shù)形式。當(dāng)在本公開中使用時(shí),術(shù)語“包括”、“包含”和/或“含有”意思是指所關(guān)聯(lián)的整數(shù),步驟、操作、元素和/或組件存在,但不排除一個(gè)或多個(gè)其他特征、整數(shù)、步驟、操作、元素、組件和/或組的存在或在該系統(tǒng)/方法中可以添加其他特征、整數(shù)、步驟、操作、元素、組件和/或組。
34.考慮到以下描述,本公開的這些特征和其他特征、以及結(jié)構(gòu)的相關(guān)元件的操作和功能、以及部件的組合和制造的經(jīng)濟(jì)性可以得到明顯提高。參考附圖,所有這些形成本公開的一部分。然而,應(yīng)該清楚地理解,附圖僅用于說明和描述的目的,并不旨在限制本公開的范圍。還應(yīng)理解,附圖未按比例繪制。
35.人眼視覺系統(tǒng)中包含80%的p細(xì)胞處理靜態(tài)圖像,以及20%的m細(xì)胞處理動態(tài)圖像。而計(jì)算機(jī)視覺技術(shù)(computer vision,cv)是一門研究如何使機(jī)器“看”的科學(xué),更進(jìn)一步的說,就是指通過計(jì)算機(jī)代替人眼對目標(biāo)進(jìn)行識別、測量等的機(jī)器視覺,并進(jìn)一步進(jìn)行圖像處理,使圖像經(jīng)過計(jì)算機(jī)處理成為更適合人眼觀察或傳送給儀器檢測的圖像。作為一個(gè)科學(xué)學(xué)科,計(jì)算機(jī)視覺研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取信息的人工智能系統(tǒng)。計(jì)算機(jī)視覺技術(shù)通常包括圖像處理、圖像識別等技術(shù),還包括常見的人臉識別、人體姿態(tài)識別等生物特征識別技術(shù)。本公開所披露的活體檢測方法和系統(tǒng)就是模仿了人眼視覺系統(tǒng)p、m細(xì)胞。
36.本公開中使用的流程圖示出了根據(jù)本公開中的一些實(shí)施例的系統(tǒng)實(shí)現(xiàn)的操作。應(yīng)該清楚地理解,流程圖的操作可以不按順序?qū)崿F(xiàn)。相反,操作可以以反轉(zhuǎn)順序或同時(shí)實(shí)現(xiàn)。此外,可以向流程圖添加一個(gè)或多個(gè)其他操作??梢詮牧鞒虉D中移除一個(gè)或多個(gè)操作。
37.圖1示出了根據(jù)本公開中一些實(shí)施例中的一種活體檢測系統(tǒng)100的示意圖。系統(tǒng)100可以包括客戶端110、網(wǎng)絡(luò)120、服務(wù)器130以及數(shù)據(jù)庫140。
38.客戶端110可以用于采集視頻數(shù)據(jù)(即目標(biāo)視頻),目標(biāo)視頻包括連續(xù)的圖像序列,其實(shí)質(zhì)是由一幀幀連續(xù)的圖像構(gòu)成。在一些實(shí)施例中,客戶端110可以包括電腦110a、手機(jī)110b、相機(jī)110c、攝像機(jī)110d、多功能設(shè)備110e等具有圖像采集功能或視頻錄制功能的設(shè)備。視頻數(shù)據(jù)除了可以通過客戶端進(jìn)行實(shí)時(shí)采集,還可以預(yù)先存儲于系統(tǒng)100的客戶端110或數(shù)據(jù)庫140中,在需要進(jìn)行活體檢測時(shí)直接使用。
39.網(wǎng)絡(luò)120可以促進(jìn)信息和/或數(shù)據(jù)的交換。如圖1所示,客戶端110、服務(wù)器130以及數(shù)據(jù)庫140可以同網(wǎng)絡(luò)120連接,并且通過網(wǎng)絡(luò)120互相傳輸信息和/或數(shù)據(jù)。在一些實(shí)施例中,網(wǎng)絡(luò)120可以是任何類型的有線或無線網(wǎng)絡(luò),也可以是其組合。比如,網(wǎng)絡(luò)120可以包括電纜網(wǎng)絡(luò)、有線網(wǎng)絡(luò)、光纖網(wǎng)絡(luò)、電信通信網(wǎng)絡(luò)、內(nèi)聯(lián)網(wǎng)、互聯(lián)網(wǎng)、局域網(wǎng)(lan)、廣域網(wǎng)(wan)、無線局域網(wǎng)(wlan)、大都市市區(qū)網(wǎng)(man)、廣域網(wǎng)(wan)、公用電話交換網(wǎng)(pstn)、藍(lán)牙網(wǎng)絡(luò)、zigbee網(wǎng)絡(luò)、近場通信(nfc)網(wǎng)絡(luò)或類似網(wǎng)絡(luò)。在一些實(shí)施例中,網(wǎng)絡(luò)120可以包括
一個(gè)或多個(gè)網(wǎng)絡(luò)接入點(diǎn)。例如,網(wǎng)絡(luò)120可以包括一個(gè)或多個(gè)有線或無線網(wǎng)絡(luò)接入點(diǎn),通過該接入點(diǎn),目標(biāo)物聯(lián)網(wǎng)設(shè)備100、服務(wù)器130以及數(shù)據(jù)庫140的一個(gè)或多個(gè)組件可以連接到網(wǎng)絡(luò)120以交換數(shù)據(jù)和/或信息。
40.服務(wù)器130可以是活體檢測系統(tǒng)100中專門用來處理程序中的活體檢測的計(jì)算設(shè)備。服務(wù)器130可以存儲有執(zhí)行本公開描述的活體檢測方法的數(shù)據(jù)或指令,并可以執(zhí)行或用于執(zhí)行所述數(shù)據(jù)和/或指令。服務(wù)器130可以包括具有數(shù)據(jù)信息處理能力的硬件設(shè)備和驅(qū)動該硬件設(shè)備工作所需必要的程序。當(dāng)然,服務(wù)器130也可以僅為具有數(shù)據(jù)處理能力的硬件設(shè)備,或者,僅為運(yùn)行在硬件設(shè)備中的程序。在一些實(shí)施例中,服務(wù)器130也可以作為插件,并部署在客戶端110。
41.數(shù)據(jù)庫140可以存儲數(shù)據(jù)和/或指令。在一些實(shí)施例中,數(shù)據(jù)庫140可以存儲服務(wù)器130執(zhí)行或用于執(zhí)行本公開中描述的活體檢測方法的數(shù)據(jù)和/或指令。客戶端110和服務(wù)器130可能具有訪問數(shù)據(jù)庫140的權(quán)限,客戶端110和服務(wù)器130可以通過網(wǎng)絡(luò)訪問存儲在數(shù)據(jù)庫140中的數(shù)據(jù)或指令。在一些實(shí)施例中,數(shù)據(jù)庫140可以直接連接到客戶端110和服務(wù)器130。在一些實(shí)施例中,數(shù)據(jù)庫110可以是服務(wù)器130的一部分。在一些實(shí)施例中,數(shù)據(jù)庫140可以包括大容量存儲、可移動存儲、易失性讀寫存儲器、只讀存儲器(rom)或類似內(nèi)容,或其任意組合。示例性大容量存儲可能包括磁盤、光盤、固態(tài)驅(qū)動器等非暫時(shí)性存儲介質(zhì)(non-transitory storage medium)。示例可移動存儲可能包括閃存驅(qū)動器、軟盤、光盤、存儲卡、zip磁盤、磁帶等。典型的易失性讀寫內(nèi)存可能包括隨機(jī)存取存儲器(ram)。示例ram可能包括動態(tài)ram(dram)、雙日期速率同步動態(tài)ram(ddrsdram)、靜態(tài)ram(sram)、晶閘管ram(t-ram)和零電容ram(z-ram)等。示例性rom可包括掩碼rom(mrom)、可編程rom(prom)、可虛擬可編程rom(perom)、電子可編程rom(eeprom)、光盤(cd-rom)和數(shù)字多功能磁盤rom等。
42.應(yīng)該理解,圖1中的客戶端110、服務(wù)器130的數(shù)目僅僅是示意性的。根據(jù)實(shí)現(xiàn)需要,可以具有任意數(shù)目的客戶端110和服務(wù)器130。
43.需要說明的是,所述活體檢測方法可以完全在客戶端110上執(zhí)行,也可以完全在服務(wù)器130上執(zhí)行,還可以部分在客戶端110上執(zhí)行,部分在服務(wù)器130上執(zhí)行。
44.為了方便描述,本公開后面的說明均將以在服務(wù)器130上執(zhí)行所述活體檢測方法為例對本公開涉及的技術(shù)方案進(jìn)行描述。
45.圖2是根據(jù)本公開的一些實(shí)施例提供的一種計(jì)算設(shè)備200的結(jié)構(gòu)示意圖。所述計(jì)算設(shè)備200可以是通用計(jì)算機(jī)或?qū)S糜?jì)算機(jī)。比如,所述計(jì)算設(shè)備200可以是服務(wù)器、個(gè)人電腦、便攜式電腦(比如筆記本計(jì)算機(jī)、平板電腦等),也可以是有其他計(jì)算能力的電子設(shè)備。當(dāng)然,所述計(jì)算設(shè)備可以是圖1中服務(wù)器130,也可以是多個(gè)開發(fā)人員110a、110b、110c(客戶端110)用來在網(wǎng)絡(luò)上進(jìn)行程序開發(fā)的終端設(shè)備。
46.如圖2所示,所述計(jì)算設(shè)備200可以包括內(nèi)部通信總線210。內(nèi)部通信總線210可以連接不同的系統(tǒng)組件,實(shí)現(xiàn)計(jì)算設(shè)備200中各組件間的數(shù)據(jù)通信,包括存儲介質(zhì)230、處理器220、通信端口250以及i/o組件260。例如,處理器220可以通過內(nèi)部通信總線210將數(shù)據(jù)發(fā)送到存儲介質(zhì)230或i/o組件260等其它硬件中。在一些實(shí)施例中,內(nèi)部通信總線210可以為工業(yè)標(biāo)準(zhǔn)(isa)總線、擴(kuò)展工業(yè)標(biāo)準(zhǔn)(eisa)總線、視頻電子標(biāo)準(zhǔn)(vesa)總線、外部部件互聯(lián)標(biāo)準(zhǔn)(pci)總線等。
47.所述計(jì)算設(shè)備200可以包括通信(com)端口250,該可以連接到網(wǎng)絡(luò)以便計(jì)算設(shè)備
200同外界的數(shù)據(jù)通信。所述連接可以是有線連接、無線連接或兩者的組合。有線連接可以包括電纜、光纜或電話線等或其任意組合。無線連接可以包括藍(lán)牙、wi-fi、wimax、wlan、zigbee、移動網(wǎng)絡(luò)(例如,3g、4g或5g等)等或其任意組合。在一些實(shí)施例中,通信端口250可以是標(biāo)準(zhǔn)化端口,如rs232、rs485等。在一些實(shí)施例中,通信端口250可以是專門設(shè)計(jì)的端口。
48.所述計(jì)算設(shè)備200可以包括i/o組件260來支持同所述活體檢測系統(tǒng)100中其他計(jì)算設(shè)備之間的數(shù)據(jù)通信。在一些實(shí)施例中,i/o組件260可以包括輸入裝置和輸出裝置。示例性輸入裝置可以包括攝像頭、鍵盤、鼠標(biāo)、顯示屏和麥克風(fēng)等,或其任意組合。示例性輸出裝置可以包括顯示裝置、語音播放裝置(比如,揚(yáng)聲器等等)、打印機(jī)、投影儀等或其任意組合。示例性顯示裝置可以包括液晶顯示器(lcd)、基于發(fā)光二極管(led)的顯示器、平板顯示器、曲面顯示器、電視設(shè)備、陰極射線管(crt)等或其任意組合。
49.所述計(jì)算設(shè)備200可以包括存儲介質(zhì)230,存儲介質(zhì)230可以包括數(shù)據(jù)存儲裝置。所述數(shù)據(jù)存儲裝置可以是非暫時(shí)性存儲介質(zhì),也可以是暫時(shí)性存儲介質(zhì)。比如,所述數(shù)據(jù)存儲裝置可以包括磁盤232、只讀存儲介質(zhì)(rom)234或隨機(jī)存取存儲介質(zhì)(ram)336中的一種或多種。存儲介質(zhì)230還可包括存儲在所述數(shù)據(jù)存儲裝置中的至少一個(gè)指令集。所述指令是計(jì)算機(jī)程序代碼,所述計(jì)算機(jī)程序代碼可以包括執(zhí)行本公開提供的活體檢測方法的程序、例程、對象、組件、數(shù)據(jù)結(jié)構(gòu)、過程、模塊等等。
50.計(jì)算設(shè)備200還可以包括以一個(gè)或多個(gè)處理器的形式的處理器220,至少一個(gè)處理器220可以同至少一個(gè)存儲介質(zhì)230以及通信端口250通過內(nèi)部通信總線210通信連接。至少一個(gè)處理器220用以執(zhí)行上述至少一個(gè)指令集。當(dāng)活體檢測系統(tǒng)001運(yùn)行時(shí),至少一個(gè)處理器220讀取所述至少一個(gè)指令集,并且根據(jù)所述至少一個(gè)指令集的指示執(zhí)行本公開提供的活體檢測方法。處理器220可以執(zhí)行活體檢測方法包含的所有步驟。處理器220可以是一個(gè)或多個(gè)處理器的形式,在一些實(shí)施例中,處理器220可以包括一個(gè)或多個(gè)硬件處理器,例如微控制器,微處理器,精簡指令集計(jì)算機(jī)(risc),專用集成電路(asic),特定于應(yīng)用的指令集處理器(asip),中央處理單元(cpu),圖形處理單元(gpu),物理處理單元(ppu),微控制器單元,數(shù)字信號處理器(dsp),現(xiàn)場可編程門陣列(fpga),高級risc機(jī)器(arm),可編程邏輯器件(pld),能夠執(zhí)行一個(gè)或多個(gè)功能的任何電路或處理器等,或其任何組合。僅出于說明的目的,在所述計(jì)算設(shè)備200中僅描述了一個(gè)處理器220。然而,本領(lǐng)域普通技術(shù)人員可以理解的是,本公開中的計(jì)算設(shè)備200還可以包括多個(gè)處理器。因此本公開中所述的由一個(gè)處理器執(zhí)行的方法/步驟/操作也可以由多個(gè)處理器共同或分別執(zhí)行。例如,如果在本公開中,所述計(jì)算設(shè)備200的處理器可以同時(shí)執(zhí)行步驟a和步驟b。應(yīng)當(dāng)理解的是,步驟a和步驟b也可以由兩個(gè)不同的處理器共同執(zhí)行。例如,第一處理器執(zhí)行步驟a,第二處理器執(zhí)行步驟b,或者第一處理器和第二處理器共同執(zhí)行步驟a和b。
51.圖3示出了根據(jù)本公開的一些實(shí)施例提供的一種活體檢測方法的方法流程圖300;圖4示出了根據(jù)本公開的一些實(shí)施例提供的一種活體檢測方法的整體示意圖。
52.下面將結(jié)合圖3和圖4描述本公開的技術(shù)方案。實(shí)施所述技術(shù)方案的主體可以是圖1中的客戶端110、網(wǎng)絡(luò)120、服務(wù)器130中的至少一種。具體地,所述客戶端110、網(wǎng)絡(luò)120和/或服務(wù)器130可以具有如圖2所述的結(jié)構(gòu),即所述客戶端110、網(wǎng)絡(luò)120和/或服務(wù)器130可以是一種用于活體檢測的設(shè)備,包括:至少一個(gè)存儲介質(zhì),和至少一個(gè)處理器。所述至少一個(gè)
存儲介質(zhì)中包括至少一個(gè)指令集,用于程序中的活體檢測。所述至少一個(gè)處理器,同所述至少一個(gè)存儲介質(zhì)通信連接。當(dāng)所述系統(tǒng)運(yùn)行時(shí),所述至少一個(gè)處理器可以讀取所述至少一個(gè)指令集,并且根據(jù)所述至少一個(gè)指令集的指示執(zhí)行圖3所述的方法300。
53.僅僅為了說明的需要,本公開將以服務(wù)器130執(zhí)行所述方法300為例進(jìn)行描述。所述方法300可以包括:
54.s310,獲取目標(biāo)視頻,所述目標(biāo)視頻包括至少一幀圖像,所述目標(biāo)視頻中包括至少一個(gè)目標(biāo)對象。
55.本公開中,服務(wù)器130獲取的目標(biāo)視頻包括連續(xù)的圖像序列,比如,所述目標(biāo)視頻可以由一幀幀連續(xù)的圖像構(gòu)成的視頻數(shù)據(jù)。目標(biāo)視頻可以通過具有圖形采集功能或視頻錄制功能的客戶端110進(jìn)行實(shí)時(shí)采集。目標(biāo)視頻也可以是預(yù)先存儲在系統(tǒng)100的客戶端110或數(shù)據(jù)庫140中的視頻數(shù)據(jù),當(dāng)需要進(jìn)行活體檢測時(shí),被系統(tǒng)100中的相關(guān)設(shè)備(例如服務(wù)器130)直接調(diào)用。
56.目標(biāo)視頻中包括至少一幀圖像,例如,目標(biāo)視頻中圖像的數(shù)量(幀數(shù))可以是幾十、幾百、幾千、幾萬或是更多。一般情況下,活體檢測時(shí)拍攝的時(shí)間只需幾秒甚至更短,對應(yīng)拍攝到的圖像幀數(shù)較少。本公開中,目標(biāo)視頻所包含的幀數(shù)為幾十幀即可進(jìn)行準(zhǔn)確的活體檢測識別。由于本公開的技術(shù)方案是針對于活體檢測,因而用于活體檢測的目標(biāo)視頻中包括至少一個(gè)目標(biāo)對象,即所述目標(biāo)視頻的每一幀圖像中包括至少一個(gè)目標(biāo)對象。一般情況下,目標(biāo)對象的數(shù)量為一個(gè),少數(shù)情況下,也可以大于一個(gè)。
57.s320,對所述目標(biāo)視頻進(jìn)行視頻拆幀,得到第一視頻幀子集和第二視頻幀子集,所述第一視頻幀子集對應(yīng)第一幀率,所述第二視頻幀子集對應(yīng)第二幀率,所述第一幀率小于所述第二幀率。
58.在獲取到所述目標(biāo)視頻后,服務(wù)器130可以根據(jù)具體的需求將目標(biāo)視頻拆分成一幀一幀的圖片(即圖像幀),并從拆分出來的圖片中抽取部分圖片,從而得到具有不同幀率的視頻幀子集,這個(gè)操作可以稱之為對目標(biāo)視頻進(jìn)行拆幀。比如,服務(wù)器可以基于所述目標(biāo)視頻提取出具有不同幀率的第一視頻幀子集和第二視頻幀子集。其中,第一視頻幀子集對應(yīng)第一幀率,第二視頻幀子集對應(yīng)第二幀率,且第一幀率小于所述第二幀率。因此,第一視頻幀子集中所包含的圖像幀數(shù)小于第二視頻幀子集中所包含的圖像幀數(shù)。在一些實(shí)施例中,第一視頻幀子集和第二視頻幀子集中可以包含相同的圖像幀。相應(yīng)地,目標(biāo)視頻中的某一圖像幀既可以被提取到第一視頻幀子集中,也可以被提取到第二視頻幀子集中。需要注意的是,本公開中,服務(wù)器130基于目標(biāo)視頻提取的第一視頻幀子集中的圖像幀并不局限于目標(biāo)視頻中的關(guān)鍵幀,服務(wù)器130基于目標(biāo)視頻提取的第二視頻幀子集中的圖像幀也不局限于目標(biāo)視頻中的關(guān)鍵幀。由于第一幀率小于第二幀率,因此,可以將第一視頻幀子集稱為低幀率視頻幀子集,將第二視頻幀子集稱為高幀率視頻幀子集。并且,由于幀率對應(yīng)每秒顯示的幀數(shù),則相對于第一視頻幀子集,第二視頻幀子集由于幀率更大,其更能反映目標(biāo)視頻中所包含的動態(tài)信息,例如眨眼、表情、動作變化、背景變化等時(shí)序信息。而相對于第二視頻幀子集,第一視頻幀子集由于幀率較小,其主要反映目標(biāo)視頻中所包含的靜態(tài)信息,例如人臉紋理信息、手機(jī)攻擊邊框、紙張攻擊材質(zhì)等空間信息。
59.在一些實(shí)施例中,服務(wù)器130可以通過視頻拆幀的方式,從所述目標(biāo)視頻中提取得到第一視頻幀子集和第二視頻幀子集。本公開中,視頻拆幀的方式可以是按時(shí)間拆幀、按幀
數(shù)拆幀等。應(yīng)當(dāng)理解,服務(wù)器130還可以通過其它方式(如分幀、抽幀等)從所述目標(biāo)視頻中提取得到第一視頻幀子集和第二視頻幀子集,只需要滿足第一視頻幀子集對應(yīng)第一幀率同第二視頻幀子集對應(yīng)第二幀率不同即可。
60.如圖3所示,服務(wù)器130提取到第一視頻幀子集和第二視頻幀子集后,可以繼續(xù)執(zhí)行步驟s330,基于所述第一視頻幀子集和所述第二視頻幀子集,確定所述目標(biāo)視頻的特征信息。
61.具體地,如圖5所示,所述步驟s330包括:
62.s331,采用第一檢測模型對所述第一視頻幀子集進(jìn)行特征提取,得到靜態(tài)特征信息;
63.s332,采用第二檢測模型對所述第二視頻幀子集進(jìn)行特征提取,得到動態(tài)特征信息;
64.本公開中,第一檢測模型和第二檢測模型均為系統(tǒng)100中預(yù)設(shè)的信息提取網(wǎng)絡(luò)。如圖4所示,所述第一檢測模型和所述第二檢測模型可以為兩個(gè)并行的信息提取網(wǎng)絡(luò)。其中,第一檢測模型可以是靜態(tài)信息提取網(wǎng)絡(luò),通過靜態(tài)信息提取網(wǎng)絡(luò)可以提取第一視頻幀子集中所包含的靜態(tài)特征信息。第二檢測模型可以是動態(tài)信息提取網(wǎng)絡(luò),通過動態(tài)信息提取網(wǎng)絡(luò)可以提取第二視頻幀子集中所包含的動態(tài)特征信息。由于第一視頻幀子集所包含的圖像幀數(shù)小于第二視頻幀子集所包含的圖像幀數(shù),因而第一檢測模型所需處理的數(shù)據(jù)量小于第二檢測模型所需處理的數(shù)據(jù)量。
65.這樣的設(shè)置模擬了人眼視覺系統(tǒng)對圖像的處理。如前所述,人眼視覺系統(tǒng)中包含80%的p細(xì)胞處理靜態(tài)圖像,以及20%的m細(xì)胞處理動態(tài)圖像。本公開中所采用的兩個(gè)不同的檢測模型可以模仿人眼視覺系統(tǒng)p、m細(xì)胞,分別用于提取靜態(tài)特征信息和動態(tài)特征信息。
66.本公開中,所述第一檢測模型和所述第二檢測模型中可以包含不同數(shù)量的特征提取模塊,也可以包含相同數(shù)量的特征提取模塊。其中,第一檢測模型中所包含的特征提取模塊為靜態(tài)信息提取模塊,第二檢測模型中所包含的特征提取模塊為動態(tài)信息提取模塊。上述靜態(tài)信息提取網(wǎng)絡(luò)和動態(tài)信息提取網(wǎng)絡(luò)為卷積神經(jīng)網(wǎng)絡(luò)中的一種,例如,可以是殘差網(wǎng)絡(luò)。對應(yīng)的,特征提取模塊為殘差模塊。
67.本公開中,特征提取模塊的數(shù)量可以是1個(gè)、2個(gè)、3個(gè)、4個(gè)、5個(gè)或是更多個(gè)。例如,所述第一檢測模型、所述第二檢測模型中均包含2個(gè)、3個(gè)、4個(gè)或是其它數(shù)量的特征提取模塊。應(yīng)當(dāng)理解,圖4中示出的第一檢測模型和第二檢測模型中均包含3個(gè)特征提取模塊,圖4中的特征提取模塊數(shù)量不對第一檢測模型和第二檢測模型中實(shí)際包含的特征提取模塊數(shù)量具有限制作用。
68.此外,本公開中所述第一檢測模型中的靜態(tài)特征提取模塊的卷積核數(shù)大于所述第二檢測模型中對應(yīng)層級的動態(tài)特征提取模塊的卷積核數(shù)。卷積核的數(shù)量決定了特征提取網(wǎng)絡(luò)模型的計(jì)算復(fù)雜度,在卷積核的其他條件相同或相似的情況下,卷積核的數(shù)量越多,對應(yīng)的特征提取網(wǎng)絡(luò)的計(jì)算復(fù)雜度越高。本公開中,采用第一檢測模型提取第一視頻幀子集中的靜態(tài)特征信息,采用第二檢測模型提取第二視頻幀子集中的動態(tài)特征信息,雖然第一視頻幀子集對應(yīng)的第一幀率小于第二視頻幀子集對應(yīng)的第二幀率。但是,對于視頻采集時(shí)間較短的場景而言,第二視頻幀子集中所包含的幀間變化(如眨眼、表情、動作變化、背景變化等)并不十分明顯,因此,本公開還是以第一檢測模型從第一視頻幀子集中提取的靜態(tài)特征
信息作為活體檢測的主要判斷依據(jù),以第二檢測模型從第二視頻幀子集中提取的動態(tài)特征信息作為活體檢測的輔助判斷依據(jù)。因此,對于層級相同的靜態(tài)特征提取模塊和動態(tài)特征提取模塊而言,本公開的技術(shù)方案中,靜態(tài)特征提取模塊中所包含的卷積核數(shù)大于動態(tài)特征提取模塊中所包含的卷積核數(shù)。
69.在此基礎(chǔ)上,本公開提供的第一檢測模型為一個(gè)小輸入(對應(yīng)第一視頻幀子集的圖像幀數(shù)較少)、大網(wǎng)絡(luò)(對應(yīng)第一檢測模型中的靜態(tài)特征提取模塊的卷積核數(shù)較多)的模型結(jié)構(gòu)。相應(yīng)地,本公開中提供的第二檢測模型為一個(gè)大輸入(對應(yīng)第二視頻幀子集的圖像幀數(shù)較多)、小網(wǎng)絡(luò)(對應(yīng)第二檢測模型中的動態(tài)特征提取模塊的卷積核數(shù)較少)。也就是說,相比而言,第一檢測模型的輸入幀數(shù)要小于第二檢測模型,而第一檢測模型中靜態(tài)特征提取模塊的卷積核的數(shù)量要多于第二檢測模型中動態(tài)提取模塊的卷積核數(shù)。
70.在一些實(shí)施例中,每個(gè)所述靜態(tài)特征提取模塊的卷積核數(shù)同與其對應(yīng)的所述動態(tài)特征提取模塊的卷積核數(shù)之比與所述第二幀率同所述第一幀率之比正相關(guān)。
71.如前所述,由于本公開中所述的第一視頻幀子集所包含的圖像幀數(shù)小于第二視頻幀子集所包含的圖像幀數(shù),且所述第一檢測模型和所述第二檢測模型中包含相同數(shù)量的特征提取模塊。在此基礎(chǔ)上,對于層級相同的靜態(tài)特征提取模塊和動態(tài)特征提取模塊而言,當(dāng)靜態(tài)特征提取模塊中所包含的卷積核數(shù)大于動態(tài)特征提取模塊中所包含的卷積核數(shù),且每個(gè)靜態(tài)特征提取模塊的卷積核數(shù)同與其對應(yīng)的動態(tài)特征提取模塊的卷積核數(shù)之比與第二幀率同第一幀率之比正相關(guān)時(shí),可以保證第一檢測模型和第二檢測模型具有一致的計(jì)算復(fù)雜度,從而使第一檢測模型對靜態(tài)特征信息的提取效率同第二檢測模型對動態(tài)特征的提取效率保持一致。
72.具體地,若所述第二幀率為所述第一幀率的n倍,則每個(gè)所述靜態(tài)特征提取模塊的卷積核數(shù)為與其對應(yīng)層級的動態(tài)特征提取模塊的卷積核數(shù)的n倍,其中,n為大于1的自然數(shù)。例如,對于層級相同的靜態(tài)特征提取模塊和動態(tài)特征提取模塊而言,當(dāng)?shù)诙蕿榈谝粠实?倍,則每個(gè)靜態(tài)特征提取模塊的卷積核數(shù)為動態(tài)特征提取模塊的卷積核數(shù)的2倍。應(yīng)當(dāng)理解,n還可以是3、4、5等自然數(shù),為了節(jié)省篇幅,在此不一一例舉。
73.在一些實(shí)施例中,以所述第一檢測模型和所述第二檢測模型中均包含3個(gè)特征提取模塊為例進(jìn)行說明。即所述第一檢測模型中包含第一級靜態(tài)特征提取模塊、第二級靜態(tài)特征提取模塊和第三級靜態(tài)特征提取模塊。相應(yīng)地,所述第二檢測模型中包含第一級動態(tài)特征提取模塊、第二級動態(tài)特征提取模塊和第三級動態(tài)特征提取模塊。當(dāng)?shù)诙蕿榈谝粠实?倍時(shí),第一級靜態(tài)特征提取模塊所包含的卷積核數(shù)為第一級動態(tài)特征提取模塊所包含的卷積核數(shù)的2倍;同理,第二級靜態(tài)特征提取模塊所包含的卷積核數(shù)為第二級動態(tài)特征提取模塊所包含的卷積核數(shù)的2倍;第三級靜態(tài)特征提取模塊所包含的卷積核數(shù)為第三級動態(tài)特征提取模塊所包含的卷積核數(shù)的2倍。
74.此時(shí),所述第一檢測模型(靜態(tài)信息提取網(wǎng)絡(luò))和所述第二檢測模型(動態(tài)信息提取網(wǎng)絡(luò))之間可以并行地提取靜態(tài)特征信息和動態(tài)特征信息,且第一檢測模型和第二檢測模型具有一致的計(jì)算復(fù)雜度和提取效率。
75.在此基礎(chǔ)上,步驟s331,采用第一檢測模型對所述第一視頻幀子集進(jìn)行特征提取,得到靜態(tài)特征信息,具體可以包括如下步驟:
76.s331-1,采用第一級靜態(tài)特征提取模塊對所述第一視頻幀子集進(jìn)行特征提取,得
到第一級靜態(tài)特征信息;
77.s331-2,采用第二級靜態(tài)特征提取模塊對所述第一級靜態(tài)特征信息進(jìn)行特征提取,得到第二級靜態(tài)特征信息;
78.s331-3,采用第三級靜態(tài)特征提取模塊對所述第二級靜態(tài)特征信息進(jìn)行特征提取,得到第三級靜態(tài)特征信息。
79.服務(wù)器130將第一視頻幀子集中所包含的多個(gè)圖像幀首先通過第一級靜態(tài)特征提取模塊進(jìn)行特征提取,得到第一級靜態(tài)特征信息;再依次經(jīng)過第二級靜態(tài)特征提取模塊得到第二級靜態(tài)特征信息;經(jīng)過第三級靜態(tài)特征提取模塊得到第三級靜態(tài)特征信息。
80.相應(yīng)地,s332,采用第二檢測模型對所述第二視頻幀子集進(jìn)行特征提取,得到動態(tài)特征信息,可以包括:
81.s332-1,采用第一級動態(tài)特征提取模塊對所述第二視頻幀子集進(jìn)行特征提取,得到第一級動態(tài)特征信息;
82.s332-2,采用第二級動態(tài)特征提取模塊對所述第一級動態(tài)特征信息進(jìn)行特征提取,得到第二級動態(tài)特征信息;以及
83.s332-3,采用第三級動態(tài)特征提取模塊對所述第二級動態(tài)特征信息進(jìn)行特征提取,得到第三級動態(tài)特征信息。
84.服務(wù)器130可以將第二視頻幀子集中所包含的多個(gè)圖像幀首先通過第一級動態(tài)特征提取模塊進(jìn)行特征提取,得到第一級動態(tài)特征信息;再依次經(jīng)過第二級動態(tài)特征提取模塊得到第二級動態(tài)特征信息;經(jīng)過第三級動態(tài)特征提取模塊得到第三級動態(tài)特征信息。
85.s333,基于所述靜態(tài)特征信息和所述動態(tài)特征信息,確定所述特征信息。
86.本公開中,所述特征信息是最終作為活體檢測預(yù)測的依據(jù)。由于本公開采用兩個(gè)并行的特征提取網(wǎng)絡(luò)(包括靜態(tài)信息提取網(wǎng)絡(luò)和動態(tài)信息提取網(wǎng)絡(luò))分別提取目標(biāo)視頻的靜態(tài)特征信息和動態(tài)特征信息。因此,服務(wù)器130可以綜合考慮靜態(tài)特征信息和動態(tài)特征信息,以確定最終進(jìn)行活體檢測的特征信息。采用上述方法可以充分利用目標(biāo)視頻的動態(tài)特征信息和靜態(tài)特征信息,從而提高活體檢測的特征魯棒性。
87.具體地,如圖4所示,以第一檢測模型和第二檢測模型中均包含3個(gè)特征提取模塊為例,所述步驟s333可以包括:
88.s333-1,將所述動態(tài)特征信息融合到所述靜態(tài)特征信息中,得到融合后的靜態(tài)特征信息;
89.在一些實(shí)施例中,步驟s333-1具體包括:將所述第一級動態(tài)特征信息與所述第一級靜態(tài)特征信息進(jìn)行特征融合,得到融合后的第一級特征信息;不同層次特征包含不同信息的分布,本公開中,所述第一級動態(tài)特征信息和所述第一級靜態(tài)特征信息為淺層特征,淺層特征包含豐富的空間結(jié)構(gòu)信息、分辨率較高,其具有局部的、精細(xì)的特點(diǎn),因而所述第一級動態(tài)特征信息與所述第一級靜態(tài)特征信息的融合為淺層融合。
90.本公開中,上述將第一級動態(tài)特征信息與第一級靜態(tài)特征信息進(jìn)行特征融合的方式可以采用加權(quán)融合、特征拼接、特征之間對應(yīng)元素相乘、反卷積、跳躍連接(skip)等方式。以加權(quán)融合為例,服務(wù)器130分別確定所述第一級動態(tài)特征信息的權(quán)重值和所述第一級靜態(tài)特征信息的權(quán)重值,再將所述第一級動態(tài)特征信息和所述第一級靜態(tài)特征信息分別乘以各自的權(quán)重值后相加,得到融合后的第一級特征信息。應(yīng)當(dāng)理解,本公開所述的特征融合方
式可根據(jù)實(shí)際情況進(jìn)行選擇,上述加權(quán)融合方式不對本公開的特征融合方式具有限制作用。
91.之后,服務(wù)器130繼續(xù)將所述融合后的第一級特征信息經(jīng)過所述第二級靜態(tài)特征提取模塊后,得到第二級特征信息;該步驟區(qū)別于步驟s331-2中采用第二級靜態(tài)特征提取模塊對所述第一級靜態(tài)特征信息進(jìn)行特征提取,得到第二級靜態(tài)特征信息。即所述第二級特征信息有別于所述第二級靜態(tài)特征信息。第二級靜態(tài)特征提取模塊的輸入端信息不同,則對應(yīng)輸出的信息也有所不同。本公開中,當(dāng)?shù)诙夓o態(tài)特征提取模塊的輸入端輸入的是未進(jìn)行特征融合的第一級靜態(tài)特征信息時(shí),則輸出第二級靜態(tài)特征信息。而當(dāng)?shù)诙夓o態(tài)特征提取模塊的輸入端輸入的是經(jīng)過特征融合后第一級特征信息時(shí),則輸出第二級特征信息。
92.之后,服務(wù)器130再繼續(xù)將所述第二級動態(tài)特征信息與所述第二級特征信息進(jìn)行特征融合,得到融合后的第二級特征信息。本公開中,所述第二級動態(tài)特征信息和所述第二級特征信息包含豐富的全局上下文特征信息,是更加全局、粗糙的深層特征,因而所述第二級動態(tài)特征信息與所述第二級特征信息的融合為深層融合。本公開中,上述將第二級動態(tài)特征信息與第二級特征信息進(jìn)行特征融合的方式同樣可以采用加權(quán)融合、特征拼接、特征之間對應(yīng)元素相乘、反卷積、跳躍連接(skip)等方式。
93.之后,服務(wù)器130繼續(xù)將所述融合后的第二級特征信息經(jīng)過所述第三級靜態(tài)特征提取模塊后,得到第三級特征信息;該步驟區(qū)別于步驟s331-3,采用第三級靜態(tài)特征提取模塊對所述第二級靜態(tài)特征信息進(jìn)行特征提取,得到第三級靜態(tài)特征信息。即所述第三級靜態(tài)特征信息有別于所述第三級特征信息。與第二級靜態(tài)特征提取模塊相同的是,第三級靜態(tài)特征提取模塊的輸入端信息不同,則對應(yīng)輸出的信息也有所不同。本公開中,當(dāng)?shù)谌夓o態(tài)特征提取模塊的輸入端輸入的是未進(jìn)行特征融合的第二級靜態(tài)特征信息時(shí),則輸出第三級靜態(tài)特征信息。而當(dāng)?shù)谌夓o態(tài)特征提取模塊的輸入端輸入的是經(jīng)過特征融合后第二級特征信息時(shí),則輸出第三級特征信息。采用上述方法將動態(tài)特征信息融合到靜態(tài)特征信息中得到所述第三級特征信息后,服務(wù)器130進(jìn)一步將所述第三級特征信息作為所述融合后的靜態(tài)特征信息。本公開中,通過將動態(tài)信息融合到靜態(tài)信息中的方式,可以獲得更加強(qiáng)大的特征表達(dá),從而得到更加魯棒的特征信息。
94.服務(wù)器130確定了融合后的靜態(tài)特征信息之后,可繼續(xù)執(zhí)行步驟s333-2,基于所述融合后的靜態(tài)特征信息和所述動態(tài)特征信息,確定所述特征信息。
95.在一些實(shí)施例中,服務(wù)器130可以將所述第三級動態(tài)特征信息作為所述動態(tài)特征信息;并將所述融合后的靜態(tài)特征信息和所述第三級動態(tài)特征信息共同作為所述特征信息。
96.應(yīng)當(dāng)理解,當(dāng)?shù)谝粰z測模型和第二檢測模型中包含的特征提取模塊的數(shù)量為其它數(shù)值時(shí),服務(wù)器130依然可以采用第一檢測模型對第一視頻幀子集進(jìn)行特征提取,得到靜態(tài)特征信息,服務(wù)器130也可以采用第二檢測模型對第二視頻幀子集進(jìn)行特征提取,得到動態(tài)特征信息。并且,服務(wù)器130可以在所述動態(tài)特征信息融合到所述靜態(tài)特征信息的過程中,根據(jù)特征提取模塊的數(shù)量確定淺層融合、深層融合的時(shí)機(jī),從而得到融合后的靜態(tài)特征信息。
97.本公開中,服務(wù)器130將所述融合后的靜態(tài)特征信息和所述動態(tài)特征信息作為所
述特征信息。一方面可以充分利用目標(biāo)視頻中的時(shí)空信息;另一方面,通過動態(tài)特征信息和靜態(tài)特征信息融合的方式得到的特征信息,可以進(jìn)一步提高用于活體檢測的特征魯棒性。
98.服務(wù)器130在確定了所述特征信息后,可以繼續(xù)執(zhí)行步驟s340,基于所述特征信息,確定所述目標(biāo)對象的活體概率。
99.在一些實(shí)施例中,步驟s340可以包括:
100.s341,基于所述融合后的靜態(tài)特征信息,確定所述目標(biāo)對象的第一活體概率;
101.s342,基于所述動態(tài)特征信息,確定所述目標(biāo)對象的第二活體概率;
102.本公開中,服務(wù)器130可以采用分類器分別計(jì)算目標(biāo)對象的第一活體概率和第二活體概率。由于目標(biāo)對象的第一活體概率是根據(jù)融合后的靜態(tài)特征信息計(jì)算所得,而目標(biāo)對象的第二活體概率是根據(jù)動態(tài)特征信息計(jì)算所得。因而,服務(wù)器130在對目標(biāo)對象進(jìn)行活體預(yù)測時(shí),可以綜合第一活體概率和第二活體概率,計(jì)算所述目標(biāo)對象最終的活體概率。即服務(wù)器130確定了所述第一活體概率和所述第二活體概率后,繼續(xù)執(zhí)行步驟s343,基于所述第一活體概率和所述第二活體概率,確定所述目標(biāo)對象的所述活體概率,所述活體概率用于指示所述目標(biāo)對象為活體對象的概率。
103.具體地,服務(wù)器130可以采用分?jǐn)?shù)融合的方式分別獲取所述第一活體概率和所述第二活體概率的權(quán)重比;再基于所述權(quán)重比、所述第一活體概率和所述第二活體概率,確定所述目標(biāo)對象的活體概率。
104.在一些實(shí)施例中,在步驟s340之后,還包括:
105.s350,將所述活體概率與預(yù)設(shè)概率閾值進(jìn)行對比;以及
106.s360,確定所述活體概率超過所述預(yù)設(shè)概率閾值,確定所述目標(biāo)對象為活體對象。
107.本公開中,當(dāng)所述活體概率超過所述預(yù)設(shè)概率閾值時(shí),確定所述目標(biāo)對象為活體對象(真人);當(dāng)所述活體概率未超過所述預(yù)設(shè)概率閾值時(shí),則確定所述目標(biāo)對象為非活體對象(非真人),此時(shí),也可以將所述目標(biāo)對象稱為攻擊對象。
108.綜上所述,在閱讀本詳細(xì)公開內(nèi)容之后,本領(lǐng)域技術(shù)人員可以明白,前述詳細(xì)公開內(nèi)容可以僅以示例的方式呈現(xiàn),并且可以不是限制性的。盡管這里沒有明確說明,本領(lǐng)域技術(shù)人員可以理解本公開意圖囊括對實(shí)施例的各種合理改變,改進(jìn)和修改。這些改變,改進(jìn)和修改旨在由本公開提出,并且在本公開的示例性實(shí)施例的精神和范圍內(nèi)。
109.此外,本公開中的某些術(shù)語已被用于描述本公開的實(shí)施例。例如,“一個(gè)實(shí)施例”,“實(shí)施例”和/或“一些實(shí)施例”意味著結(jié)合該實(shí)施例描述的特定特征,結(jié)構(gòu)或特性可以包括在本公開的至少一個(gè)實(shí)施例中。因此,可以強(qiáng)調(diào)并且應(yīng)當(dāng)理解,在本公開的各個(gè)部分中對“實(shí)施例”或“一個(gè)實(shí)施例”或“替代實(shí)施例”的兩個(gè)或更多個(gè)引用不一定都指代相同的實(shí)施例。此外,特定特征,結(jié)構(gòu)或特性可以在本公開的一個(gè)或多個(gè)實(shí)施例中適當(dāng)?shù)亟M合。
110.應(yīng)當(dāng)理解,在本公開的實(shí)施例的前述描述中,為了幫助理解一個(gè)特征,出于簡化本公開的目的,本公開有時(shí)將各種特征組合在單個(gè)實(shí)施例、附圖或其描述中。或者,本公開又是將各種特征分散在多個(gè)本公開的實(shí)施例中。然而,這并不是說這些特征的組合是必須的,本領(lǐng)域技術(shù)人員在閱讀本公開的時(shí)候完全有可能將其中一部分特征提取出來作為單獨(dú)的實(shí)施例來理解。也就是說,本公開中的實(shí)施例也可以理解為多個(gè)次級實(shí)施例的整合。而每個(gè)次級實(shí)施例的內(nèi)容在于少于單個(gè)前述公開實(shí)施例的所有特征的時(shí)候也是成立的。

技術(shù)特征:


1.一種活體檢測方法,包括:獲取目標(biāo)視頻,所述目標(biāo)視頻包括至少一幀圖像,所述目標(biāo)視頻中包括至少一個(gè)目標(biāo)對象;對所述目標(biāo)視頻進(jìn)行視頻拆幀,得到第一視頻幀子集和第二視頻幀子集,所述第一視頻幀子集對應(yīng)第一幀率,所述第二視頻幀子集對應(yīng)第二幀率,所述第一幀率小于所述第二幀率;基于所述第一視頻幀子集和所述第二視頻幀子集,確定所述目標(biāo)視頻的特征信息;以及基于所述特征信息,確定所述目標(biāo)對象的活體概率。2.如權(quán)利要求1所述的活體檢測方法,其中,所述確定所述目標(biāo)視頻的特征信息,包括:采用第一檢測模型對所述第一視頻幀子集進(jìn)行特征提取,得到靜態(tài)特征信息;采用第二檢測模型對所述第二視頻幀子集進(jìn)行特征提取,得到動態(tài)特征信息;以及基于所述靜態(tài)特征信息和所述動態(tài)特征信息,確定所述特征信息。3.如權(quán)利要求2所述的活體檢測方法,其中,所述第一檢測模型和所述第二檢測模型中包含相同數(shù)量的特征提取模塊。4.如權(quán)利要求3所述的活體檢測方法,其中,所述第一檢測模型中包含第一級靜態(tài)特征提取模塊、第二級靜態(tài)特征提取模塊和第三級靜態(tài)特征提取模塊;以及所述采用第一檢測模型對所述第一視頻幀子集進(jìn)行特征提取,得到靜態(tài)特征信息,包括:采用第一級靜態(tài)特征提取模塊對所述第一視頻幀子集進(jìn)行特征提取,得到第一級靜態(tài)特征信息;采用第二級靜態(tài)特征提取模塊對所述第一級靜態(tài)特征信息進(jìn)行特征提取,得到第二級靜態(tài)特征信息;以及采用第三級靜態(tài)特征提取模塊對所述第二級靜態(tài)特征信息進(jìn)行特征提取,得到第三級靜態(tài)特征信息。5.如權(quán)利要求4所述的活體檢測方法,其中,所述第二檢測模型中包含第一級動態(tài)特征提取模塊、第二級動態(tài)特征提取模塊和第三級動態(tài)特征提取模塊;以及所述采用第二檢測模型對所述第二視頻幀子集進(jìn)行特征提取,得到動態(tài)特征信息,包括:采用第一級動態(tài)特征提取模塊對所述第二視頻幀子集進(jìn)行特征提取,得到第一級動態(tài)特征信息;采用第二級動態(tài)特征提取模塊對所述第一級動態(tài)特征信息進(jìn)行特征提取,得到第二級動態(tài)特征信息;以及采用第三級動態(tài)特征提取模塊對所述第二級動態(tài)特征信息進(jìn)行特征提取,得到第三級動態(tài)特征信息。6.如權(quán)利要求3-5任一項(xiàng)所述的活體檢測方法,其中,所述第一檢測模型中的靜態(tài)特征提取模塊的卷積核數(shù)大于所述第二檢測模型中對應(yīng)層級的動態(tài)特征提取模塊的卷積核數(shù)。7.如權(quán)利要求6所述的活體檢測方法,其中,每個(gè)所述靜態(tài)特征提取模塊的卷積核數(shù)同與其對應(yīng)的所述動態(tài)特征提取模塊的卷積
核數(shù)之比與所述第二幀率同所述第一幀率之比正相關(guān)。8.如權(quán)利要求7所述的活體檢測方法,其中,所述第二幀率為所述第一幀率的n倍;以及每個(gè)所述靜態(tài)特征提取模塊的卷積核數(shù)為與其對應(yīng)層級的動態(tài)特征提取模塊的卷積核數(shù)的n倍,其中,n為大于1的自然數(shù)。9.如權(quán)利要求5所述的活體檢測方法,其中,所述基于所述靜態(tài)特征信息和所述動態(tài)特征信息,確定所述特征信息,包括:將所述動態(tài)特征信息融合到所述靜態(tài)特征信息中,得到融合后的靜態(tài)特征信息;以及基于所述融合后的靜態(tài)特征信息和所述動態(tài)特征信息,確定所述特征信息。10.如權(quán)利要求9所述的活體檢測方法,其中,所述將所述動態(tài)特征信息融合到所述靜態(tài)特征信息中,得到融合后的靜態(tài)特征信息,包括:將所述第一級動態(tài)特征信息與所述第一級靜態(tài)特征信息進(jìn)行特征融合,得到融合后的第一級特征信息;將所述融合后的第一級特征信息經(jīng)過所述第二級靜態(tài)特征提取模塊后,得到第二級特征信息;將所述第二級動態(tài)特征信息與所述第二級特征信息進(jìn)行特征融合,得到融合后的第二級特征信息;將所述融合后的第二級特征信息經(jīng)過所述第三級靜態(tài)特征提取模塊后,得到第三級特征信息;以及將所述第三級特征信息作為所述融合后的靜態(tài)特征信息。11.如權(quán)利要求10所述的活體檢測方法,其中,所述基于所述融合后的靜態(tài)特征信息和所述動態(tài)特征信息,確定所述特征信息,包括:將所述第三級動態(tài)特征信息作為所述動態(tài)特征信息;以及將所述融合后的靜態(tài)特征信息和所述第三級動態(tài)特征信息共同作為所述特征信息。12.如權(quán)利要求11所述的活體檢測方法,其中,所述基于所述特征信息,確定所述目標(biāo)對象的活體概率,包括:基于所述融合后的靜態(tài)特征信息,確定所述目標(biāo)對象的第一活體概率;基于所述動態(tài)特征信息,確定所述目標(biāo)對象的第二活體概率;以及基于所述第一活體概率和所述第二活體概率,確定所述目標(biāo)對象的所述活體概率,所述活體概率用于指示所述目標(biāo)對象為活體對象的概率。13.如權(quán)利要求12所述的活體檢測方法,其中,所述基于所述第一活體概率和所述第二活體概率,確定所述目標(biāo)對象的所述活體概率,包括:獲取所述第一活體概率和所述第二活體概率的權(quán)重比;以及基于所述權(quán)重比、所述第一活體概率和所述第二活體概率,確定所述目標(biāo)對象的活體概率。14.如權(quán)利要求1所述的活體檢測方法,其中,在所述確定所述目標(biāo)對象的活體概率之后,還包括:將所述活體概率與預(yù)設(shè)概率閾值進(jìn)行對比;以及確定所述活體概率超過所述預(yù)設(shè)概率閾值,確定所述目標(biāo)對象為活體對象。
15.一種活體檢測系統(tǒng),包括:至少一個(gè)存儲介質(zhì),包括至少一個(gè)指令集,用于活體檢測方法的實(shí)施分析;以及至少一個(gè)處理器,同所述至少一個(gè)存儲介質(zhì)通訊連接,其中,當(dāng)所述系統(tǒng)運(yùn)行時(shí),所述至少一個(gè)處理器讀取所述至少一個(gè)指令集,并且根據(jù)所述至少一個(gè)指令集的指示執(zhí)行權(quán)利要求1-14中任一項(xiàng)所述的活體檢測方法。

技術(shù)總結(jié)


本公開提供了一種活體檢測方法和系統(tǒng),涉及生物識別技術(shù)領(lǐng)域。本公開提供的活體檢測方法包括:獲取目標(biāo)視頻;對所述目標(biāo)視頻進(jìn)行視頻拆幀,得到第一視頻幀子集和第二視頻幀子集;基于所述第一視頻幀子集和所述第二視頻幀子集,確定所述目標(biāo)視頻的特征信息;以及基于所述特征信息,確定所述目標(biāo)對象的活體概率。本公開提供的上述方法通過模仿人視覺系統(tǒng)的時(shí)序信息提取方式,從目標(biāo)視頻中提取具有不同特征(動態(tài)特征信息、靜態(tài)特征信息)的視頻幀子集,并基于兩個(gè)不同的視頻幀子集確定目標(biāo)視頻的特征信息,從而提高活體攻擊檢測的特征魯棒性,為人臉識別系統(tǒng)建立堅(jiān)實(shí)的安全底盤。為人臉識別系統(tǒng)建立堅(jiān)實(shí)的安全底盤。為人臉識別系統(tǒng)建立堅(jiān)實(shí)的安全底盤。


技術(shù)研發(fā)人員:

武文琦

受保護(hù)的技術(shù)使用者:

支付寶(杭州)信息技術(shù)有限公司

技術(shù)研發(fā)日:

2022.09.13

技術(shù)公布日:

2022/12/16


文章投稿或轉(zhuǎn)載聲明

本文鏈接:http://m.newhan.cn/zhuanli/patent-1-52653-0.html

來源:專利查詢檢索下載-實(shí)用文體寫作網(wǎng)版權(quán)所有,轉(zhuǎn)載請保留出處。本站文章發(fā)布于 2022-12-20 21:56:43

發(fā)表評論

驗(yàn)證碼:
用戶名: 密碼: 匿名發(fā)表
評論列表 (有 條評論
,2人圍觀
參與討論