
維普資訊
工程科技 《锏陵譬院譬籟 ̄2oo8年第2期
基于多規則的客戶端郵件過濾系優
高良誠
(1.合肥工業大學,安徽合肥230009;2.銅陵職業技術學院,安徽銅陵244000)
摘要:文章在分析傳統反垃圾郵件技術的基礎上,提出了一種基于多規則的客戶端郵件過濾系統的設計模型。該系統采用
黑白名單技術和基于CCERT規則集相結合的過濾技術,通過引入用戶反饋機制,能適應特定用戶的個性化需求,進
行垃圾郵件過濾,從而降低誤報率,提高反垃圾郵件系統的可用性,具有較好的實用效果。
關鍵詞:反垃圾郵件技術;黑自名單;關鍵字匹配;用戶反饋
中圖分類號:TP316.8 文獻標識碼:A 文章編號:1672—0547(2008)02—0075—02
電子郵件系統是互聯網的一個成功典范,電子郵件已成為
從而降低誤報率。
Internet用戶最常用的通信方式之一。由于郵件系統自身的缺
設定兩個閾值W1和W2(WI<W2),以及郵件為垃圾郵件
陷,近年來垃圾郵件問題日益嚴重,給互聯網用戶帶來很多的煩 的概率值M,判定郵件的標準是:
惱和侵害,嚴重污染了我們的網絡環境,占用了大量的網絡帶
如果M<W1,判定為正常郵件:
寬、存儲和運算資源。
如果M_)w2,判定為垃圾郵件:
據中國互聯網協會2008年第一次統計報告顯示,2007年
如果W1≤M≤w2,判定為疑似郵件。
第四季度,中國互聯網用戶平均每周收到垃圾郵件數量為16.71
M的值由下式確定:
封,垃圾郵件的危害越來越嚴重,2007年垃圾郵件給中國造成的 M=F()( 的初始值為o)
損失達188A億人民幣。如何有效地防范垃圾郵件,已成為網絡
X:{xl。x2'…},xi表示郵件的某個信頭特征,各個xi之間是
信息安全領域的重要課題。
互相獨立的變量。如果xi符合垃圾郵件的某項顯著特征,例如非
1.研究現狀
法的郵件服務器地址,則置M=W2+I,表明這是一封垃圾郵件,
采用反垃圾郵件技術對郵件進行過濾,是目前防范垃圾郵
同時不考慮變量Y。
件的普遍做法。反垃圾郵件技術主要有:反向域名驗證技術、黑
Y=fy1,y2,…},yi表示郵件標題或正文中包含垃圾郵件某關
白名單技術、基于規則的過濾技術、基于統計的過濾技術。
鍵宇。如果包含某關鍵宇,則給變量M累加一個該關鍵宇對應
基于規則和統計的過濾技術具有較高的準確率和智能性,
的權值。
得到比較廣泛的運用。但是由于垃圾郵件過濾是個復雜的問題,
3.多規則過濾技術
目前還沒有能完美地過濾所有垃圾郵件的技術,垃圾郵件過濾
3.1 白名單、黑名單技術
過程中主要存在兩個問題: 黑名單(Black List)和白名單( ite List)分別是已知的垃
(1)誤報率的問題 圾郵件發送者和可信任的發送者的IP地址、郵件地址或域名。
目前,沒有一種反垃圾郵件技術能保證過濾工作完全準確。
“黑名單”立足于排除,服務器拒絕來自黑名單地址的郵件。“白
對用戶而言,漏報幾封郵件是可以接受的,而將正常郵件判定為
名單”則主要用來確認合法的電子郵件來源,減少黑名單排除失
垃圾郵件,并進行丟棄,可能給用戶帶來很大的損失。
誤的情況。
(2)垃圾郵件判定標準問題
目前比較流行的是實時黑名單(Realtime B1ackhole iLst,
垃圾郵件類別的判定標準和用戶密切相關,如一個產品宣 RBL)技術,這種技術非常簡單,而且效率很高。但是垃圾郵件層出
傳廣告,有人認為是垃圾郵件,但有人則認為是正常郵件。另外,
不窮,及時更新黑白名單是困難的,所以在實際應用中,這種技術
用戶對垃圾郵件的判別標準也會隨時間推移而改變,而且垃圾 很難取得一個非常好的效果,通常和其他一些技術混合使用。
郵件本身的內容形式也在不斷地變化。這些都造成郵件類別的
32基于CCERT規則集的過濾技術 .
不確定性。
基于統計方法的過濾技術,其優點是規則由機器學習自動生
目前的郵件過濾模式主要有服務器過濾和客戶端過濾,相 成,時效性較強,但規則與訓練的郵件樣本集有關,因此,可推廣性
比服務器過濾,客戶端過濾能及時地反饋用戶個性化信息,使過
不強。基于規則方法的過濾技術,其優點是可以共享規則集,因此,
濾系統更準確,更適合特定用戶需求。
可推廣性較強,但規則的生成依賴人工,因而時效性不強。
針對上述問題,本文主要研究多規則過濾方法,來提高過濾的 目前,中國教育和科研計算機網緊急響應組(CCERT)通過
準確性,采用客戶端過濾模式,能體現用戶的個性化需求。在此基 采集教育科研網內大量的垃圾郵件樣本,用統計方法自動生成
礎上,提出了一種基于多規則的客戶端郵件過濾系統的設計。
規則集Chinese rules.cf,依據規則的匹配來對新郵件進行分析
2垃圾郵件數字化描述
判斷。該方法吸取了基于規則和基于統計技術的優點:首先它是
考慮到垃圾郵件判定過程中,降低誤報率的重要性,將郵件
一
種基于規則的方法,因此推廣性很強,它的規則又是由統計方
分為三個類別:正常郵件、垃圾郵件和疑似郵件。在郵件判定時, 法自動生成的,可以能比較快地跟蹤垃圾郵件的新動態,因此它
對于垃圾郵件特征不是特別明顯的郵件,將其歸類為疑似郵件,
的時效性也很強。
收稿日期:2008—03—13
作者簡介:高良城(1971一),男,合肥工業大學計算機與信息學院在讀碩士研究生,銅陵職業技術學院信息工程系講師,主要研究方向為計算機
網絡安全。
一
75—

本文發布于:2023-11-18 16:37:03,感謝您對本站的認可!
本文鏈接:http://m.newhan.cn/zhishi/a/1700296623219068.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:基于多規則的客戶端郵件過濾系統.doc
本文 PDF 下載地址:基于多規則的客戶端郵件過濾系統.pdf
| 留言與評論(共有 0 條評論) |