
信息與計算科學(xué)專業(yè)實(shí)驗(yàn)報告
課程名稱數(shù)據(jù)挖掘原理與算法總實(shí)驗(yàn)學(xué)時:
第
次
共次
實(shí)驗(yàn)項(xiàng)目名稱
聚類分析
本次實(shí)驗(yàn)學(xué)時數(shù):實(shí)驗(yàn)類型
日期
2016年5月25日星期
三
年級本13信計01班
學(xué)生姓名黃順團(tuán)學(xué)號
201343901
31
課任教師唐志剛
1.實(shí)驗(yàn)?zāi)康?
用數(shù)據(jù)挖掘聚類算法(Q型聚類、R型聚類)求分類微博數(shù)據(jù)。
2.實(shí)驗(yàn)環(huán)境:
MATLAB7.0。
Windows7操作系統(tǒng)、
3.實(shí)驗(yàn)內(nèi)容
由于數(shù)據(jù)集比較大,數(shù)據(jù)TXT文件不引入報告中、命名為、
相關(guān)兩個源文件代碼文件如下:
1、Untitled。m
clc,clear
loadjulei。txt%把原始數(shù)據(jù)保存在純文本文件ju中
r=corrcoef(julei);%計算相關(guān)系數(shù)矩陣
d=1-r;%進(jìn)行數(shù)據(jù)變換,把相關(guān)系數(shù)轉(zhuǎn)化為距離
d=tril(d);%取出矩陣d得下三角元素
d=nonzeros(d);%取出非零元素
d=d';%化成行向量
z=linkage(d,'average’);%按類平均法聚類
dendrogram(z);%畫聚類圖
T=cluster(z,’maxclust’,4)%把變量劃分成4類
fori=1:4
tm=find(T==i);%求第i類得對象
tm=reshape(tm,1,length(tm));%變成行向量
fprintf(’第%d類得有%sn’,i,int2str(tm));%顯示分類結(jié)果
end
r%顯示相關(guān)系數(shù)矩陣
2、Untitled2、m
clc,clear
loadjulei、txt%把原始數(shù)據(jù)保存在純文本文件julei。txt中
julei(:,5)=[];%刪除數(shù)據(jù)矩陣得第5列,即使用變量1,2,3,4
julei=zscore(julei);%數(shù)據(jù)標(biāo)準(zhǔn)化
y=pdist(julei);%求對象間得歐氏距離,每行就是一個對象
z=linkage(y,'average');%按類平均法聚類
dendrogram(z);%畫聚類圖
fork=2:8
fprintf('劃分成%d類得結(jié)果如下:n',k)
T=cluster(z,’maxclust',k);%把樣本點(diǎn)劃分成k類
fori=1:k
tm=find(T==i);%求第i類得對象
tm=reshape(tm,1,length(tm));%變成行向量
fprintf('第%d類得有%sn’,i,int2str(tm));%顯示分類結(jié)果
end
ifk==8
break
end
fprintf(’************n');
End
輸出結(jié)果為:
1、
圖一(R型聚類)
〉>T=
4
2
3
1
2
第1類得有4
第2類得有25
第3類得有3
第4類得有1
〉>r=
1。0000-0。18240、0439—0、0298—0。0871
—0、18241。00000、28440、41580。9003
0。04390、28441、00000、18830。3327
-0。02980.41580.18831.00000.4965
—0。08710、90030.33270、49651.0000
2、
圖2(各對象聚類樹形圖)
劃分成2類得結(jié)果如下:
第1類得有128268
第2類得有123456789101112
1314151617181926
27282930313233343536373839
4041424344454647484950515253
545556575859666
76869707172737475767778798
6878889909192
93949596979899104105
114115116117118119
12412512612712913
1341351361371386
4155156157158159160
16116216316416516616716816917
174175176177178179180181182183184185186187
1881891941951961971981992002
05214
215216217218219224225226227228
22923023123223323423523623723823924024124
2243244245246247248249254
255256257258259264265266267
269270271272273274275276277278279280281
282283284285286287288289294295
296297298299300
************
劃分成3類得結(jié)果如下:
第1類得有125274
第2類得有123456789101112
1314151617181926
27282936373839
46474849505152535
45556575859666
76869767778798
68788899091929394
95969798991
11260121122
12312412612712913413513613
7138139140141142143144145146147148149
1541559164
165166167168169170171172173174175176177
178179180181182183184185186187188189190191
192193194195196197198199204205
214215216217218
219220221222223224225226227228229230231
23223323423523623723823924424524
6247248249254255256257258
25926426526626726927
275276277278279280281282283284285286287288
289294295296297298299300
第3類得有128268
************
劃分成4類得結(jié)果如下:
第1類得有192541173260283
第2類得有123456789101112
1314151617182021222324262728
293637383940424344
454647484956575859
6061626364656667686970717273
74757677787980818283848586
87888996979899100102
1031131141151
161171181191261271291301311
3213313413513613713813914414514
6147148149154155156157158159
16416516616721741
751761771781791841851861871
88189194195196197198199200
209210211212
2132142152162225226
227228229230231232233234235236237238239
24424524624724824925
254255256257258259261262263264265266267
269275276277278279280281282
284285286287288289290291292293294295296
297298299300
第3類得有125274
第4類得有128268
************
劃分成5類得結(jié)果如下:
第1類得有1048215233
第2類得有12345678911121314
1516171827282930
3132333435363738394042434445
46474950515253545556575859
6061626364656667686970717273
7475767778798687
88899697989910
0106107113114
1151166127129130131
132133134135136137138139144
1451460151152153154155156157158
159164165166167168169170172174
1751761771781791841851861
87188189190191192193194195196197198199
204209210211212213
21421621721821922422522622722
8229235236237238239240241242
243244245246247248249254255
256257258259261262263264265266267269270271
272273275276277278279280281282284285286
28728828929429529629729829930
0
第3類得有192541173260283
第4類得有125274
第5類得有128268
************
劃分成6類得結(jié)果如下:
第1類得有2936374243
44454647495188189190191
197198199200282
第2類得有123456789111213
14151617182728
383946575859606
162636465666768697172737475
7677787986878889909
19293949596979899105
115116117118119122
123124126127129134135136137
138139144145146147148149150151
1521531548159160162163164165166
167168169176177178179180181182
1831841851861921931941951962012
20621121221321421621721821922
022122222322422522622722822923
23523623723823924424524624724824
9254255256257258259261262263
264265266267269275276277278279
2862872882892942
95296297298299300
第3類得有1048215233
第4類得有192541173260283
第5類得有125274
第6類得有128268
************
劃分成7類得結(jié)果如下:
第1類得有10
第2類得有48215233
第3類得有293637424344
454647495188189190191197
198199200282
第4類得有123456789111213
1415161718272838
3946575859606162
6364656667686971727374757677
7879868788899091
9293949596979899105
115116117118119122
1231241261271291301311321331341351361371
38139144145146147148149150151
152153154155156157158159165166
167168169176177178179180181
182183184185186192193194195196201202203
212213214216217218
219224225226227228229230231232
23423523623723823924424524
6247248249250251252253254255256257258259
261262263264265266267269275276
277278279286287288289290291
292293294295296297298299300
第5類得有192541173260283
第6類得有125274
第7類得有128268
************
劃分成8類得結(jié)果如下:
第1類得有1234568911121314
15161718272838
39515254555657585960616263
64656667686971727374757677787
986878889909192
93949596979899105106
113114115116117118119122123
1265136137138139140
141142143144145146147148149155156
157158159160162163164165168169170172174175
176177178179180181182183184185186192193
194195196205210
211212213214216217218219224
225226227228229230231232234235236237238
239241242243244245246247248249250251252
253254255256258259263264265266267269270
271272273275276277278279286
287288289294295296297298299
300
第2類得有7416616724
第3類得有10
第4類得有48215233
第5類得有293637424344
454647495078189190191197
198199200282
第6類得有192541173260283
第7類得有125274
第8類得有128268
轉(zhuǎn)化為源字符數(shù)據(jù)為:
劃分成2類得結(jié)果如下:
第1類得有曹國偉曹國偉
第2類得有其她
************
劃分成3類得結(jié)果如下:
第1類得有張向東周鴻祎
第2類得有其她
第3類得有曹國偉曹國偉
************
劃分成4類得結(jié)果如下:
第1類得有Hitwi王建碩小小數(shù)據(jù)分析師琳琳亂飛麥田程苓峰—云科技淘寶指數(shù)
fengyuncrawl王爍龔宇
第2類得有其她
第3類得有張向東周鴻祎
第4類得有曹國偉曹國偉
************
劃分成5類得結(jié)果如下:
第1類得有白鴉陳坤淘寶網(wǎng)萬客團(tuán)
第2類得有其她
第3類得有Hitwi王建碩小小數(shù)據(jù)分析師琳琳亂飛麥田程苓峰-云科技淘寶指數(shù)
fengyuncrawl王爍龔宇
第4類得有張向東周鴻祎
第5類得有曹國偉曹國偉
************
劃分成6類得結(jié)果如下:
第1類得有MINI金石頭雷軍夢想家林志穎羅志祥范范范瑋琪蒼井空大S小S孟非
DCCI互聯(lián)網(wǎng)數(shù)據(jù)中心沈浩老師韓庚文章同學(xué)林俊杰周立波胡歌黃健翔國美在線王
微俞永福當(dāng)當(dāng)網(wǎng)庫巴網(wǎng)孫燕姿蔡依林林俊杰蘇寧易購京東商城夢想家林志穎范
范范瑋琪金錯刀
第2類得有其她
第3類得有白鴉陳坤淘寶網(wǎng)萬客團(tuán)
第4類得有Hitwise王建碩小小數(shù)據(jù)分析師琳琳亂飛麥田程苓峰-云科技淘寶指數(shù)
fengyuncrawl王爍龔宇
第5類得有張向東周鴻祎
第6類得有曹國偉曹國偉
************
劃分成7類得結(jié)果如下:
第1類得有白鴉
第2類得有陳坤淘寶網(wǎng)萬客團(tuán)
第3類得有MINI金石頭雷軍夢想家林志穎羅志祥范范范瑋琪蒼井空大S小S孟
非DCCI互聯(lián)網(wǎng)數(shù)據(jù)中心沈浩老師韓庚文章同學(xué)林俊杰周立波胡歌黃健翔國美在
線王微俞永福當(dāng)當(dāng)網(wǎng)庫巴網(wǎng)孫燕姿蔡依林林俊杰蘇寧易購京東商城夢想家林志
穎范范范瑋琪金錯刀
第4類得有其她
第5類得有Hitwi王建碩小小數(shù)據(jù)分析師琳琳亂飛麥田程苓峰-云科技淘寶指數(shù)fen
gyuncrawl王爍龔宇
第6類得有張向東周鴻祎
第7類得有曹國偉曹國偉
************
劃分成8類得結(jié)果如下:
第1類得有其她
第2類得有董勤峰數(shù)據(jù)化管理微數(shù)據(jù)spark張鵬古永鏘王建碩小小數(shù)據(jù)分析師社
會網(wǎng)絡(luò)與數(shù)據(jù)挖掘1號商城-品質(zhì)百貨宮玉國吳曉波cnsns
第3類得有白鴉
第4類得有陳坤淘寶網(wǎng)萬客團(tuán)
第5類得有MINI金石頭雷軍夢想家林志穎羅志祥范范范瑋琪蒼井空大S小S孟非
DCCI互聯(lián)網(wǎng)數(shù)據(jù)中心沈浩老師韓庚文章同學(xué)林俊杰周立波胡歌黃健翔國美在線王微
俞永福當(dāng)當(dāng)網(wǎng)庫巴網(wǎng)孫燕姿蔡依林林俊杰蘇寧易購京東商城夢想家林志穎范范范瑋琪
金錯刀
第6類得有Hitwi王建碩小小數(shù)據(jù)分析師琳琳亂飛麥田程苓峰—云科技淘寶指
數(shù)fengyuncrawl王爍龔宇
第7類得有張向東周鴻祎
第8類得有曹國偉曹國偉
5、小結(jié)、體會或建議(2至3行):
本實(shí)驗(yàn)用MATLAB實(shí)驗(yàn),根據(jù)聚類結(jié)果,得出相關(guān)微博數(shù)據(jù)之間得分類關(guān)系,可以粗略得瞧出微
博用戶得粉絲數(shù)、關(guān)注數(shù)、微博數(shù)、收藏數(shù)、互粉數(shù)之間得聚類關(guān)系及相互得聚類結(jié)果。但就是
實(shí)驗(yàn)過程過于簡單,運(yùn)用MATLAB自帶Q型、R型聚類算法求解結(jié)果,總就是沒有K—平均算法、PAM、
FCM算法得結(jié)果簡潔明了、
學(xué)生簽名:黃順團(tuán)
2016年5月2
5日
7.教師評語:
教師簽名:
20年月日
成績
本文發(fā)布于:2023-03-10 05:12:49,感謝您對本站的認(rèn)可!
本文鏈接:http://m.newhan.cn/zhishi/a/1678396370134281.html
版權(quán)聲明:本站內(nèi)容均來自互聯(lián)網(wǎng),僅供演示用,請勿用于商業(yè)和其他非法用途。如果侵犯了您的權(quán)益請與我們聯(lián)系,我們將在24小時內(nèi)刪除。
本文word下載地址:王建碩.doc
本文 PDF 下載地址:王建碩.pdf
| 留言與評論(共有 0 條評論) |