本文作者:kaifamei

一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法

更新時(shí)間:2025-12-25 01:38:05 0條評(píng)論

一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法



1.本發(fā)明涉及一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,可用于模式識(shí)別中的圖像聚類領(lǐng)域。


背景技術(shù):



2.圖像數(shù)據(jù)的聚類分析具有廣泛的研究和應(yīng)用前景。在計(jì)算機(jī)視覺和模式識(shí)別領(lǐng)域,圖像是一種最普遍的視覺信息呈現(xiàn)。圖像數(shù)據(jù)通常是高維和非線性可分的,表現(xiàn)為包含大量冗余特征、分布更稀疏和包含至少一個(gè)具有非凸形狀邊界的簇。數(shù)據(jù)聚類作為一種基本的數(shù)據(jù)處理技術(shù)日益成熟,為解決圖像數(shù)據(jù)的聚類問題提供了方法依據(jù)。譜聚類方法具有檢測(cè)數(shù)據(jù)的復(fù)雜結(jié)構(gòu)和處理非線性可分?jǐn)?shù)據(jù)的能力,適用于圖像數(shù)據(jù)的聚類。
3.度量數(shù)據(jù)對(duì)象之間的相似性對(duì)于譜聚類至關(guān)重要。譜聚類通過將數(shù)據(jù)對(duì)象和成對(duì)數(shù)據(jù)對(duì)象之間的相似度分別視為圖的頂點(diǎn)和連接兩個(gè)頂點(diǎn)的邊的權(quán)重,將聚類問題轉(zhuǎn)化為圖劃分問題。根據(jù)不同的度量相似度的方式,譜聚類方法主要分為基于距離的方法和基于表示的方法。基于距離的方法很難揭示非線性流形中數(shù)據(jù)對(duì)象之間的內(nèi)在相似性和反映真實(shí)分布信息,對(duì)數(shù)據(jù)中的噪聲損傷很敏感。基于表示的方法通過數(shù)據(jù)的自表達(dá)自動(dòng)有效地度量數(shù)據(jù)對(duì)象之間的關(guān)系以提高聚類性能,引起了人們的極大關(guān)注。
4.但是,在處理復(fù)雜的真實(shí)世界的圖像數(shù)據(jù)時(shí),由于相關(guān)的基于表示的譜聚類方法的自表達(dá)屬性不能夠有效地保證空間近鄰的數(shù)據(jù)對(duì)象在潛在的系數(shù)空間中也有相似表示,因此,它挖掘數(shù)據(jù)內(nèi)在結(jié)構(gòu)的能力有限。


技術(shù)實(shí)現(xiàn)要素:



5.為了克服已有的聚類方法挖掘圖像數(shù)據(jù)對(duì)象之間相似性關(guān)系的局限和聚類性能的不足,本發(fā)明提供了一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,通過在迭代過程中交替優(yōu)化和求解,能夠?qū)崿F(xiàn)低秩共識(shí)核學(xué)習(xí)、核空間下數(shù)據(jù)自表達(dá)和自適應(yīng)超圖正則化三者的交替指導(dǎo)和動(dòng)態(tài)提升,更深層次地挖掘數(shù)據(jù)對(duì)象之間的內(nèi)在相似性關(guān)系,并用于非線性可分?jǐn)?shù)據(jù)的聚類任務(wù)。其中,本發(fā)明提出的自適應(yīng)超圖,即自適應(yīng)地融合候選核的近鄰核來(lái)動(dòng)態(tài)地構(gòu)建概率超圖,優(yōu)化地利用了不同候選核下的樣本關(guān)聯(lián)性,挖掘了更穩(wěn)定的高階關(guān)系。
6.為了達(dá)到上述目的,本發(fā)明采用了下列技術(shù)方案:
7.一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,該方法包括如下步驟:
8.s1,獲取圖像數(shù)據(jù);
9.s2,通過低秩共識(shí)核學(xué)習(xí)、核空間下圖像數(shù)據(jù)自表達(dá)和自適應(yīng)超圖正則化,迭代地構(gòu)建超圖和更新超圖拉普拉斯矩陣、系數(shù)矩陣、共識(shí)核矩陣和候選核權(quán)重,直到達(dá)到收斂條件;
10.s3,應(yīng)用所述s2步驟得到的系數(shù)矩陣構(gòu)造相似度矩陣;
11.s4,應(yīng)用所述s3步驟得到的相似度矩陣,調(diào)用譜聚類算法,得到聚類結(jié)果。
12.優(yōu)選地,在所述s1步驟中,假設(shè)圖像數(shù)據(jù)為n表示有n個(gè)數(shù)據(jù)對(duì)象,d表示數(shù)據(jù)對(duì)象的特征維度,將x中的每個(gè)數(shù)據(jù)對(duì)象看作一個(gè)頂點(diǎn),頂點(diǎn)集為v={v1,v2,

,vn}。
13.優(yōu)選地,所述步驟s2的具體過程為:公式(1)所示模型能直接從圖像數(shù)據(jù)中學(xué)得系數(shù)矩陣、共識(shí)核矩陣、候選核權(quán)重,模型如下:
[0014][0015][0016]
其中,第一項(xiàng)是核空間下數(shù)據(jù)自表達(dá)約束項(xiàng),第二項(xiàng)是系數(shù)矩陣的稀疏或低秩正則項(xiàng),第三項(xiàng)是共識(shí)核學(xué)習(xí)約束項(xiàng),第四項(xiàng)是共識(shí)核的低秩正則項(xiàng),第五項(xiàng)是自適應(yīng)超圖正則項(xiàng);
[0017]
給定m個(gè)候選核矩陣,是第r個(gè)候選核矩陣,表示第r個(gè)候選核矩陣中第i行第j列的元素,是系數(shù)矩陣,是共識(shí)核矩陣,是候選核權(quán)重向量,gr是第r個(gè)候選核對(duì)應(yīng)的權(quán)重,φ(x)表示未知的核映射函數(shù),k=φ(x)
t
φ(x),‖
·
‖f是frobenius范數(shù),第一項(xiàng)是frobenius范數(shù),第一項(xiàng)可轉(zhuǎn)化為ρ(z)為‖z‖1或‖z‖
*
,‖
·
‖1和‖
·

*
分別是l1范數(shù)和核范數(shù),是標(biāo)準(zhǔn)化的超圖拉普拉斯矩陣,α、β、γ和δ是懲罰參數(shù);
[0018]
采用交替方向乘子法求解公式(1)中z,k,g,步驟如下:首先在公式(1)中分離變量,引入變量和并添加相應(yīng)的約束;然后重寫公式(1)對(duì)應(yīng)的增廣拉格朗日函數(shù):
[0019][0020]
其中,μ是懲罰參數(shù),和是拉格朗日乘子;最后,為了獲得最小化增廣拉格朗日函數(shù)(2)的最優(yōu)解z
*
,k
*
,g
*
,迭代更新z,k,g,l
symh
也隨g自適應(yīng)變化,并利用可行性誤差更新拉格朗日乘子,當(dāng)滿足收斂條件時(shí),迭代停止。
[0021]
進(jìn)一步地,所述迭代的具體過程為:設(shè)最大迭代次數(shù)為t,第t(0≤t≤t)次迭代的
優(yōu)化變量和拉格朗日乘子分別為{z
(t)
,k
(t)
,g
(t)
,l
symh(t)
,j
(t)
,w
(t)
}和{y
1(t)
,y
2(t)
},初始化g
(0)
=1,初始化z
(0)
和j
(0)
為單位矩陣,初始化k
(0)
,w
(0)
,y
1(0)
和y
1(0)
為零矩陣,從{1e-5,1e-3,0.1,10,1e3,1e5}范圍中初始化μ
(0)
,參數(shù)的具體迭代過程如下:
[0022]
s21,固定g
(t)
,更新l
symh(t+1)
的過程如下:
[0023]
加權(quán)融合候選核的近鄰核:
[0024][0025][0026]
其中,hr(i,j)表示第r個(gè)候選核的近鄰核矩陣hr中第i行第j列的元素,nk(i)表示數(shù)據(jù)對(duì)象i的k個(gè)近鄰集合,g為加權(quán)融合后的矩陣;
[0027]
構(gòu)建超圖,超圖包含頂點(diǎn)集v={v1,v2,

,vn}和超邊集ε={e1,ej,

,en},通過關(guān)聯(lián)矩陣h
(t)
和超邊權(quán)重矩陣w
(t)
刻畫:
[0028][0029][0030]
其中,h(vi,ej)是關(guān)聯(lián)矩陣h中第i行第j列的元素,表示頂點(diǎn)vi與超邊ej之間的相似度,超邊權(quán)重矩陣w是一個(gè)對(duì)角矩陣,w(ej)是w中第j行第j列的元素,表示超邊ej的權(quán)重,g
ij
表示矩陣g中第i行第j列的元素,表示矩陣g中第i行第j列的元素,是矩陣中第i行第j列的元素;
[0031]
更新l
symh(t+1)

[0032][0033]
其中,de和dv分別為包含所有超邊的度和包含所有頂點(diǎn)的度的對(duì)角矩陣,超邊ej的度頂點(diǎn)vi的度
[0034]
s22,固定l
symh(t+1)
,k
(t)
,j
(t)
,y
1(t)
和μ
(t)
,更新z
(t+1)

[0035]z(t+1)
=(k
(t)

(t)
i+2δl
symh(t+1)
)-1
(k
(t)

(t)j(t)
+y
1(t)
),#(8)
[0036]
令z
(t+1)
中小于0的元素為0:
[0037]z(t+1)
=max(z
(t+1)
,0),#(9)
[0038]
s23,固定z
(t+1)
,g
(t)
,w
(t)
,μ
(t)
和y
2(t)
,更新k
(t+1)

[0039][0040]
令k
(t+1)
中小于0的元素為0:
[0041]k(t+1)
=max(k
(t+1)
,0),#(11)
[0042]
s24,固定z
(t+1)
,μ
(t)
和y
1(t)
,更新j
(t+1)

[0043]
若ρ(j)=‖j‖1,則:
[0044][0045]
若ρ(j)=‖j‖
*
,則:
[0046][0047]
其中,c
ij
是矩陣c中第i行第j列的元素,u
(t)
、v
(t)
和σ
(t)
分別是對(duì)應(yīng)于c
(t)
的奇異值分解的左奇異向量、右奇異向量和奇異值;
[0048]
令j
(t+1)
中小于0的元素為0:
[0049]j(t+1)
=max(j
(t+1)
,0),#(14)
[0050]
s25,固定k
(t+1)
,μ
(t)
和y
2(t)
,更新w
(t+1)

[0051][0052]
其中,其中,和分別是對(duì)應(yīng)于d
(t)
的奇異值分解的左奇異向量、右奇異向量和奇異值;
[0053]
令w
(t+1)
中小于0的元素為0:
[0054]w(t+1)
=max(w
(t+1)
,0),#(16)
[0055]
s26,固定k
(t+1)
,更新g
(t+1)

[0056]
求解g
(t+1)
的優(yōu)化問題變?yōu)榍蠼庖粋€(gè)帶有線性約束的二次規(guī)劃問題,可利用存在的matlab函數(shù)quadprog求解;
[0057]
s27,更新拉格朗日乘子y
1(t+1)
,y
2(t+1)
和μ
(t+1)

[0058]y1(t+1)
=y(tǒng)
1(t)

(t)
(j-z),#(17)
[0059]y2(t+1)
=y(tǒng)
2(t)

(t)
(w-k),#(18)
[0060]
μ
(t+1)
=min(μ
max
,τμ
(t)
),#(19)
[0061]
其中,τ根據(jù)經(jīng)驗(yàn)調(diào)整,μ
max
是μ被允許的最大值;
[0062]
s28,判斷是否達(dá)到迭代停止條件,迭代停止條件為:
[0063][0064]
其中,ε為閾值,若達(dá)到迭代停止條件,則得到最終的z
*
,k
*
,g
*
,否則繼續(xù)執(zhí)行s21-s28。
[0065]
優(yōu)選地,在所述s3步驟中,應(yīng)用所述s2步驟得到的系數(shù)矩陣構(gòu)造相似度矩陣為:
[0066]
s=|z|+|z|
t
.#(21)
[0067]
優(yōu)選地,所述s4步驟具體為:把相似度矩陣作為譜聚類算法的輸入,調(diào)用譜聚類算法,得到聚類結(jié)果。
[0068]
與現(xiàn)有技術(shù)相比本發(fā)明具有以下優(yōu)點(diǎn):
[0069]
本發(fā)明的方法不同于已有的基于表示的譜聚類方法,本方法融合低秩核學(xué)習(xí)和自適應(yīng)超圖獲得相似度矩陣從而進(jìn)行譜聚類,其特和創(chuàng)新主要在于:1)本發(fā)明提出集成自適應(yīng)超圖正則化、數(shù)據(jù)自表達(dá)和低秩核學(xué)習(xí)到一個(gè)統(tǒng)一的目標(biāo)函數(shù)中,交替優(yōu)化和求解,實(shí)現(xiàn)了三者的交替指導(dǎo)和動(dòng)態(tài)提升,可更深層次地挖掘數(shù)據(jù)的內(nèi)在相似性關(guān)系,并用于非線性可分?jǐn)?shù)據(jù)的聚類任務(wù);2)本發(fā)明提出自適應(yīng)地融合候選核的近鄰核來(lái)動(dòng)態(tài)地構(gòu)建概率超圖,優(yōu)化地利用了不同候選核下的樣本關(guān)聯(lián)性,挖掘了更穩(wěn)定的高階關(guān)系;3)與傳統(tǒng)的基于表示的譜聚類方法和基于核的譜聚類方法相比,本發(fā)明更能有效地挖掘非線性可分?jǐn)?shù)據(jù)之間的內(nèi)在相似性關(guān)系,提升聚類性能。
附圖說明
[0070]
圖1是使用本發(fā)明方法對(duì)圖像數(shù)據(jù)進(jìn)行聚類的工作流程圖。
具體實(shí)施方式
[0071]
本發(fā)明的目的、優(yōu)點(diǎn)和特點(diǎn),將通過下面優(yōu)選實(shí)施例的非限制性說明進(jìn)行圖示和解釋。這些實(shí)施例僅是應(yīng)用本發(fā)明技術(shù)方案的典型范例,凡采取等同替換或者等效變換而形成的技術(shù)方案,均落在本發(fā)明要求保護(hù)的范圍之內(nèi)。
[0072]
本發(fā)明揭示了一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,如圖1所示,該方法包括如下步驟:
[0073]
s1,獲取圖像數(shù)據(jù);假設(shè)圖像數(shù)據(jù)為n表示有n個(gè)數(shù)據(jù)對(duì)象,d表示數(shù)據(jù)對(duì)象的特征維度,將x中的每個(gè)數(shù)據(jù)對(duì)象看作一個(gè)頂點(diǎn),頂點(diǎn)集為v={v1,v2,

,vn};
[0074]
s2,通過低秩共識(shí)核學(xué)習(xí)、核空間下圖像數(shù)據(jù)自表達(dá)和自適應(yīng)超圖正則化,迭代地構(gòu)建超圖和更新超圖拉普拉斯矩陣、系數(shù)矩陣、共識(shí)核矩陣和候選核權(quán)重,直到達(dá)到收斂條件;具體過程為:
[0075]
公式(1)所示模型能直接從圖像數(shù)據(jù)中學(xué)得系數(shù)矩陣、共識(shí)核矩陣、候選核權(quán)重,模型如下:
[0076][0077][0078]
其中,第一項(xiàng)是核空間下數(shù)據(jù)自表達(dá)約束項(xiàng),第二項(xiàng)是系數(shù)矩陣的稀疏或低秩正則項(xiàng),第三項(xiàng)是共識(shí)核學(xué)習(xí)約束項(xiàng),第四項(xiàng)是共識(shí)核的低秩正則項(xiàng),第五項(xiàng)是自適應(yīng)超圖正則項(xiàng);
[0079]
給定m個(gè)候選核矩陣,是第r個(gè)候選核矩陣,表示第r個(gè)候選核矩陣中第i行第j列的元素,是系數(shù)矩陣,是共識(shí)核矩陣,是候選核權(quán)重向量,gr是第r個(gè)候選核對(duì)應(yīng)的權(quán)重,φ(x)表示未知的核映射函數(shù),k=φ(x)
t
φ(x),‖
·
‖f是frobenius范數(shù),第一項(xiàng)是frobenius范數(shù),第一項(xiàng)可轉(zhuǎn)化為ρ(z)為‖z‖1或‖z‖
*
,‖
·
‖1和‖
·

*
分別是l1范數(shù)和核范數(shù),是標(biāo)準(zhǔn)化的超圖拉普拉斯矩陣,α、β、γ和δ是懲罰參數(shù);
[0080]
采用交替方向乘子法求解公式(1)中z,k,g,步驟如下:首先在公式(1)中分離變量,引入變量和并添加相應(yīng)的約束;然后重寫公式(1)對(duì)應(yīng)的增廣拉格朗日函數(shù):
[0081][0082]
其中,μ是懲罰參數(shù),和是拉格朗日乘子;最后,為了獲得最小化增廣拉格朗日函數(shù)(2)的最優(yōu)解z
*
,k
*
,g
*
,迭代更新z,k,g,l
symh
也隨g自適應(yīng)變化,并利用可行性誤差更新拉格朗日乘子,當(dāng)滿足收斂條件時(shí),迭代停止。
[0083]
進(jìn)一步地,所述迭代的具體過程為:設(shè)最大迭代次數(shù)為t,第t(0≤t≤t)次迭代的優(yōu)化變量和拉格朗日乘子分別為{z
(t)
,k
(t)
,g
(t)
,l
symh(t)
,j
(t)
,w
(t)
}和{y
1(t)
,y
2(t)
},初始化g
(0)
=1,初始化z
(0)
和j
(0)
為單位矩陣,初始化k
(0)
,w
(0)
,y
1(0)
和y
1(0)
為零矩陣,從{1e-5,1e-3,0.1,10,1e3,1e5}范圍中初始化μ
(0)
,參數(shù)的具體迭代過程如下:
[0084]
s21,固定g
(t)
,更新l
symh(t+1)
的過程如下:
[0085]
加權(quán)融合候選核的近鄰核:
[0086][0087][0088]
其中,hr(i,j)表示第r個(gè)候選核的近鄰核矩陣hr中第i行第j列的元素,nk(i)表示數(shù)據(jù)對(duì)象i的k個(gè)近鄰集合,g為加權(quán)融合后的矩陣;
[0089]
構(gòu)建超圖,超圖包含頂點(diǎn)集v={v1,v2,

,vn}和超邊集ε={e1,ej,

,en},通過關(guān)聯(lián)矩陣h
(t)
和超邊權(quán)重矩陣w
(t)
刻畫:
[0090][0091][0092]
其中,h(vi,ej)是關(guān)聯(lián)矩陣h中第i行第j列的元素,表示頂點(diǎn)vi與超邊ej之間的相似度,超邊權(quán)重矩陣w是一個(gè)對(duì)角矩陣,w(ej)是w中第j行第j列的元素,表示超邊ej的權(quán)重,g
ij
表示矩陣g中第i行第j列的元素,表示矩陣g中第i行第j列的元素,是矩陣中第i行第j列的元素;
[0093]
更新l
symh(t+1)

[0094][0095]
其中,de和dv分別為包含所有超邊的度和包含所有頂點(diǎn)的度的對(duì)角矩陣,超邊ej的度頂點(diǎn)vi的度
[0096]
s22,固定l
symh(t+1)
,k
(t)
,j
(t)
,y
1(t)
和μ
(t)
,更新z
(t+1)

[0097]z(t+1)
=(k
(t)

(t)
i+2δl
symh(t+1)
)-1
(k
(t)

(t)j(t)
+y
1(t)
),#(8)
[0098]
令z
(t+1)
中小于0的元素為0:
[0099]z(t+1)
=max(z
(t+1)
,0),#(9)
[0100]
s23,固定z
(t+1)
,g
(t)
,w
(t)
,μ
(t)
和y
2(t)
,更新k
(t+1)

[0101][0102]
令k
(t+1)
中小于0的元素為0:
[0103]k(t+1)
=max(k
(t+1)
,0),#(11)
[0104]
s24,固定z
(t+1)
,μ
(t)
和y
1(t)
,更新j
(t+1)

[0105]
若ρ(j)=‖j‖1,則:
[0106][0107]
若ρ(j)=‖j‖
*
,則:
[0108][0109]
其中,c
ij
是矩陣c中第i行第j列的元素,u
(t)
、v
(t)
和σ
(t)
分別是對(duì)應(yīng)于c
(t)
的奇異值分解的左奇異向量、右奇異向量和奇異值;
[0110]
令j
(t+1)
中小于0的元素為0:
[0111]j(t+1)
=max(j
(t+1)
,0),#(14)
[0112]
s25,固定k
(t+1)
,μ
(t)
和y
2(t)
,更新w
(t+1)

[0113][0114]
其中,其中,和分別是對(duì)應(yīng)于d
(t)
的奇異值分解的左奇異向量、右奇異向量和奇異值;
[0115]
令w
(t+1)
中小于0的元素為0:
[0116]w(t+1)
=max(w
(t+1)
,0),#(16)
[0117]
s26,固定k
(t+1)
,更新g
(t+1)

[0118]
求解g
(t+1)
的優(yōu)化問題變?yōu)榍蠼庖粋€(gè)帶有線性約束的二次規(guī)劃問題,可利用存在的matlab函數(shù)quadprog求解;
[0119]
s27,更新拉格朗日乘子y
1(t+1)
,y
2(t+1)
和μ
(t+1)

[0120]y1(t+1)
=y(tǒng)
1(t)

(t)
(j-z),#(17)
[0121]y2(t+1)
=y(tǒng)
2(t)

(t)
(w-k),#(18)
[0122]
μ
(t+1)
=min(μ
max
,τμ
(t)
),#(19)
[0123]
其中,τ根據(jù)經(jīng)驗(yàn)調(diào)整,μ
max
是μ被允許的最大值;
[0124]
s28,判斷是否達(dá)到迭代停止條件,迭代停止條件為:
[0125][0126]
其中,ε為閾值,若達(dá)到迭代停止條件,則得到最終的z
*
,k
*
,g
*
,否則繼續(xù)執(zhí)行s21-s28。
[0127]
s3,應(yīng)用所述s2步驟得到的系數(shù)矩陣構(gòu)造相似度矩陣:
[0128]
s=|z|+|z|
t
.#(21)
[0129]
s4,應(yīng)用所述步驟s3得到的相似度矩陣,把相似度矩陣作為譜聚類算法的輸入,調(diào)用譜聚類算法,得到聚類結(jié)果。
[0130]
性能對(duì)比:
[0131]
將本發(fā)明的一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法在jaffe人臉圖像數(shù)據(jù)集和coil20目標(biāo)圖像數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),使用聚類評(píng)估指標(biāo)評(píng)估本發(fā)明的方法和對(duì)比聚類方法的聚類性能,進(jìn)行對(duì)比分析。
[0132]
具體地,jaffe數(shù)據(jù)集包含213張照片,為10名日本女性在實(shí)驗(yàn)環(huán)境下根據(jù)指示分別做出七種表情(包括悲傷、快樂、生氣、厭惡、驚訝、恐懼和中性),并由照相機(jī)拍攝人臉表情,每種表情大概有3或4張樣片。coil20數(shù)據(jù)集包含1440張圖片,為20個(gè)物體被從不同角度拍攝(每隔5度拍攝一張圖片),每個(gè)物體有72張圖片。實(shí)驗(yàn)用的jaffe數(shù)據(jù)集和coil20數(shù)據(jù)集的特征維度分別為676和1024。
[0133]
在相同的實(shí)驗(yàn)設(shè)置下,選取了8個(gè)相關(guān)的具有代表性的聚類方法作為對(duì)比方法(k-means、normalized cut(ncut)、sparse subspace clustering(ssc)、least squares regression(lsr)、low-rank representation(lrr)、single kernel-based learning method(sklm)、multiple kernel-based learning method(mklm)和low-rank kernel learning for graph matrix(lkg)),與本發(fā)明的方法joint low-rank consensus kernel learning and adaptive probabilistic hypergraph regularization for spectral clustering(lkhr)進(jìn)行對(duì)比實(shí)驗(yàn),lkgs和lkgr分別代表ρ(z)=‖z‖1和ρ(z)=‖z‖
*
情況下的lkg方法,lkhrs和lkhrr分別代表ρ(z)=‖z‖1和ρ(z)=‖z‖
*
情況下的lkhr方法。
[0134]
使用兩個(gè)被廣泛使用的聚類評(píng)估指標(biāo)accuracy(acc)和normalized mutual information(nmi)來(lái)度量算法的性能,表中的每個(gè)方法對(duì)應(yīng)的聚類評(píng)估指標(biāo)數(shù)值為100次聚類的平均值,表中的sklm方法對(duì)應(yīng)的聚類評(píng)估指標(biāo)數(shù)值為多個(gè)單核(線性核、多項(xiàng)式核和高斯核)下的平均值(最大值,最小值)。
[0135]
實(shí)驗(yàn)結(jié)果如下:
[0136]
表一:jaffe數(shù)據(jù)集上各種方法的實(shí)驗(yàn)結(jié)果
[0137][0138][0139]
表二:coil20數(shù)據(jù)集上各種方法的實(shí)驗(yàn)結(jié)果
[0140]
方法accnmik-means0.650.76ncut0.850.91ssc0.720.86lsr0.680.77lrr0.660.78sklm0.75(0.9,0.66)0.84(0.94,0.76)mklm0.740.82lkgs0.780.91lkgr0.790.85lkhrs0.920.96lkhrr0.920.96
[0141]
本發(fā)明提出集成自適應(yīng)超圖正則化、數(shù)據(jù)自表達(dá)和低秩核學(xué)習(xí)到一個(gè)統(tǒng)一的目標(biāo)函數(shù)中,交替優(yōu)化和求解,實(shí)現(xiàn)了三者的交替指導(dǎo)和動(dòng)態(tài)提升,更深層次地挖掘數(shù)據(jù)的內(nèi)在相似性關(guān)系,并用于非線性可分?jǐn)?shù)據(jù)的聚類任務(wù)。并且,本發(fā)明提出自適應(yīng)地融合候選核的近鄰核來(lái)動(dòng)態(tài)地構(gòu)建概率超圖,優(yōu)化地利用了不同候選核下的樣本關(guān)聯(lián)性,挖掘了更穩(wěn)定
的高階關(guān)系。實(shí)驗(yàn)中使用聚類指標(biāo)accuracy(acc)和normalized mutual information(nmi)來(lái)度量算法的聚類性能。表一和表二的結(jié)果顯示了本發(fā)明提出的方法的聚類性能優(yōu)于其他對(duì)比的聚類方法,表明本發(fā)明方法可以顯著提高圖像數(shù)據(jù)的聚類性能。
[0142]
本發(fā)明尚有多種實(shí)施方式,凡采用等同變換或者等效變換而形成的所有技術(shù)方案,均落在本發(fā)明的保護(hù)范圍之內(nèi)。

技術(shù)特征:


1.一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,其特征在于:所述方法包括如下步驟:s1,獲取圖像數(shù)據(jù);s2,通過低秩共識(shí)核學(xué)習(xí)、核空間下圖像數(shù)據(jù)自表達(dá)和自適應(yīng)超圖正則化,迭代地構(gòu)建超圖和更新超圖拉普拉斯矩陣、系數(shù)矩陣、共識(shí)核矩陣和候選核權(quán)重,直到達(dá)到收斂條件;s3,應(yīng)用所述s2步驟得到的系數(shù)矩陣構(gòu)造相似度矩陣;s4,應(yīng)用所述s3步驟得到的相似度矩陣,調(diào)用譜聚類算法,得到聚類結(jié)果。2.根據(jù)權(quán)利要求1所述的一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,其特征在于:在所述s1步驟中,假設(shè)圖像數(shù)據(jù)為n表示有n個(gè)數(shù)據(jù)對(duì)象,d表示數(shù)據(jù)對(duì)象的特征維度,將x中的每個(gè)數(shù)據(jù)對(duì)象看作一個(gè)頂點(diǎn),頂點(diǎn)集為v={v1,v2,

,v
n
}。3.根據(jù)權(quán)利要求1所述的一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,其特征在于,所述步驟s2的具體過程為:公式(1)所示模型能直接從圖像數(shù)據(jù)中學(xué)得系數(shù)矩陣、共識(shí)核矩陣、候選核權(quán)重,模型如下:如下:其中,第一項(xiàng)是核空間下數(shù)據(jù)自表達(dá)約束項(xiàng),第二項(xiàng)是系數(shù)矩陣的稀疏或低秩正則項(xiàng),第三項(xiàng)是共識(shí)核學(xué)習(xí)約束項(xiàng),第四項(xiàng)是共識(shí)核的低秩正則項(xiàng),第五項(xiàng)是自適應(yīng)超圖正則項(xiàng);給定m個(gè)候選核矩陣,是第r個(gè)候選核矩陣,表示第r個(gè)候選核矩陣中第i行第j列的元素,是系數(shù)矩陣,是共識(shí)核矩陣,是候選核權(quán)重向量,g
r
是第r個(gè)候選核對(duì)應(yīng)的權(quán)重,φ(x)表示未知的核映射函數(shù),k=φ(x)
t
φ(x),‖
·

f
是frobenius范數(shù),第一項(xiàng)是frobenius范數(shù),第一項(xiàng)可轉(zhuǎn)化為ρ(z)為‖z‖1或‖z‖
*
,‖
·
‖1和‖
·

*
分別是l1范數(shù)和核范數(shù),是標(biāo)準(zhǔn)化的超圖拉普拉斯矩陣,α、β、γ和δ是懲罰參數(shù);采用交替方向乘子法求解公式(1)中z,k,g,步驟如下:首先,在公式(1)中分離變量,引入變量和并添加相應(yīng)的約束;然后,重寫公式(1)對(duì)應(yīng)的增廣拉格朗日函數(shù):
其中,μ是懲罰參數(shù),和是拉格朗日乘子;最后,為了獲得最小化增廣拉格朗日函數(shù)(2)的最優(yōu)解z
*
,k
*
,g
*
,迭代更新z,k,g,l
symh
也隨g自適應(yīng)變化,并利用可行性誤差更新拉格朗日乘子,當(dāng)滿足收斂條件時(shí),迭代停止。4.根據(jù)權(quán)利要求3所述的一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,其特征在于,所述s3步驟中,應(yīng)用所述s2步驟得到的系數(shù)矩陣構(gòu)造相似度矩陣為:s=|z|+|z|
t
.#(3)。5.根據(jù)權(quán)利要求3所述的一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,其特征在于,所述迭代的具體過程為:設(shè)最大迭代次數(shù)為t,第t(0≤t≤t)次迭代的優(yōu)化變量和拉格朗日乘子分別為{z
(t)
,k
(t)
,g
(t)
,l
symh(t)
,j
(t)
,w
(t)
}和{y
1(t)
,y
2(t)
},初始化g
(0)
=1,初始化z
(0)
和j
(0)
為單位矩陣,初始化k
(0)
,w
(0)
,y
1(0)
和y
1(0)
為零矩陣,從{1e-5,1e-3,0.1,10,1e3,1e5}范圍中初始化μ
(0)
,參數(shù)的具體迭代過程如下:s21,固定g
(t)
,更新l
symh(t+1)
的過程如下:加權(quán)融合候選核的近鄰核:加權(quán)融合候選核的近鄰核:其中,h
r
(i,j)表示第r個(gè)候選核的近鄰核矩陣h
r
中第i行第j列的元素,n
k
(i)表示數(shù)據(jù)對(duì)象i的k個(gè)近鄰集合,g為加權(quán)融合后的矩陣;構(gòu)建超圖,超圖包含頂點(diǎn)集v={v1,v2,

,v
n
}和超邊集}和超邊集通過關(guān)聯(lián)矩陣h
(t)
和超邊權(quán)重矩陣w
(t)
刻畫:刻畫:其中,h(v
i
,e
j
)是關(guān)聯(lián)矩陣h中第i行第j列的元素,表示頂點(diǎn)v
i
與超邊e
j
之間的相似度,超邊權(quán)重矩陣w是一個(gè)對(duì)角矩陣,w(e
j
)是w中第j行第j列的元素,表示超邊e
j
的權(quán)重,g
ij
表示矩陣g中第i行第j列的元素,示矩陣g中第i行第j列的元素,是矩陣中第行第列的元
素;更新l
symh(t+1)
:其中,d
e
和d
v
分別為包含所有超邊的度和包含所有頂點(diǎn)的度的對(duì)角矩陣,超邊e
j
的度頂點(diǎn)v
i
的度s22,固定l
symh(t+1)
,k
(t)
,j
(t)
,y
1(t)
和μ
(t)
,更新z
(t+1)
:z
(t+1)
=(k
(t)

(t)
i+2δl
symh(t+1)
)-1
(k
(t)

(t)
j
(t)
+y
1(t)
),#(9)令z
(t+1)
中小于0的元素為0:z
(t+1)
=max(z
(t+1)
,0),#(10)s23,固定z
(t+1)
,g
(t)
,w
(t)
,μ
(t)
和y
2(t)
,更新k
(t+1)
:令k
(t+1)
中小于0的元素為0:k
(t+1)
=max(k
(t+1)
,0),#(12)s24,固定z
(t+1)
,μ
(t)
和y
1(t)
,更新j
(t+1)
:若ρ(j)=‖j‖1,則:若ρ(j)=‖j‖
*
,則:其中,c
ij
是矩陣c中第i行第j列的元素,u
(t)
、v
(t)
和σ
(t)
分別是對(duì)應(yīng)于c
(t)
的奇異值分解的左奇異向量、右奇異向量和奇異值;令j
(t+1)
中小于0的元素為0:j
(t+1)
=max(j
(t+1)
,0),#(15)s25,固定k
(t+1)
,μ
(t)
和y
2(t)
,更新w
(t+1)
:其中,其中,和分別是對(duì)應(yīng)于d
(t)
的奇異值分解的左
奇異向量、右奇異向量和奇異值;令w
(t+1)
中小于0的元素為0:w
(t+1)
=max(w
(t+1)
,0),#(17)s26,固定k
(t+1)
,更新g
(t+1)
:求解g
(t+1)
的優(yōu)化問題變?yōu)榍蠼庖粋€(gè)帶有線性約束的二次規(guī)劃問題,可利用存在的matlab函數(shù)quadprog求解;s27,更新拉格朗日乘子y
1(t+1)
,y
2(t+1)
和μ
(t+1)
:y
1(t+1)
=y(tǒng)
1(t)

(t)
(j-z),#(18)y
2(t+1)
=y(tǒng)
2(t)

(t)
(w-k),#(19)μ
(t+1)
=min(μ
max
,τμ
(t)
),#(20)其中,τ根據(jù)經(jīng)驗(yàn)調(diào)整,μ
max
是μ被允許的最大值;s28,判斷是否達(dá)到迭代停止條件,迭代停止條件為:其中,ε為閾值,若達(dá)到迭代停止條件,則得到最終的z
*
,k
*
,g
*
,否則繼續(xù)執(zhí)行s21-s28。6.根據(jù)權(quán)利要求1所述的一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,其特征在于,所述s4步驟具體為:把相似度矩陣作為譜聚類算法的輸入,調(diào)用譜聚類算法,得到聚類結(jié)果。

技術(shù)總結(jié)


本發(fā)明涉及圖像聚類領(lǐng)域,公開了一種融合低秩核學(xué)習(xí)和自適應(yīng)超圖的圖像聚類方法,該方法包括如下步驟:S1,獲取圖像數(shù)據(jù);S2,通過低秩共識(shí)核學(xué)習(xí)、核空間下圖像數(shù)據(jù)自表達(dá)和自適應(yīng)超圖正則化,迭代地構(gòu)建超圖和更新超圖拉普拉斯矩陣、系數(shù)矩陣、共識(shí)核矩陣和候選核權(quán)重,直到達(dá)到收斂條件;S3,應(yīng)用所述S2步驟得到的系數(shù)矩陣構(gòu)造相似度矩陣;S4,應(yīng)用所述S3步驟得到的相似度矩陣,調(diào)用譜聚類算法,得到聚類結(jié)果。本發(fā)明方法集成自適應(yīng)超圖正則化、核空間下數(shù)據(jù)自表達(dá)和低秩核學(xué)習(xí)到一個(gè)框架中,實(shí)現(xiàn)了三者的交替指導(dǎo)和動(dòng)態(tài)提升,優(yōu)化地利用了不同候選核下的樣本關(guān)聯(lián)性,挖掘了更穩(wěn)定的高階關(guān)系,從而更深層次地挖掘數(shù)據(jù)的內(nèi)在結(jié)構(gòu)。從而更深層次地挖掘數(shù)據(jù)的內(nèi)在結(jié)構(gòu)。從而更深層次地挖掘數(shù)據(jù)的內(nèi)在結(jié)構(gòu)。


技術(shù)研發(fā)人員:

杜宇慧 牛菊

受保護(hù)的技術(shù)使用者:

山西大學(xué)

技術(shù)研發(fā)日:

2022.10.12

技術(shù)公布日:

2023/1/19


文章投稿或轉(zhuǎn)載聲明

本文鏈接:http://m.newhan.cn/zhuanli/patent-1-78333-0.html

來(lái)源:專利查詢檢索下載-實(shí)用文體寫作網(wǎng)版權(quán)所有,轉(zhuǎn)載請(qǐng)保留出處。本站文章發(fā)布于 2023-01-25 23:51:11

發(fā)表評(píng)論

驗(yàn)證碼:
用戶名: 密碼: 匿名發(fā)表
評(píng)論列表 (有 條評(píng)論
2人圍觀
參與討論