時間:2014-01-15 來源:合肥網hfw.cc 作者:hfw.cc 我要糾錯
目前解決垃圾郵件的方法有:良好的用戶習慣、破法、提高發垃圾郵件的本錢、黑名單、身份確認、基于規矩的過濾、基于貝葉斯推理的過濾等。但迄今為止還沒有一種真正有效的方法,可能徹底阻擊垃圾郵件。
internet的敏捷遍及,電子郵件逐步成為人們進行信息交換的一種主要手腕,已變成人們學習、工作跟生涯中不可或缺的一a局部。然而,垃圾郵件的泛濫給互聯網帶來了重大問題。
據統計,在2002年初,垃圾郵件占全部郵件發送量的16%,2003年初變成42%,2004年初變成60%。radicati團體猜測,到2007年,寰球由于垃圾郵件造成的喪。郵件系統榮獲最佳郵件服務器性能獎,高效安全的郵件系統。失將多達1130億美元。
垃圾郵件中除了充滿著貿易廣告外,還包括著色情暴力非法的成分,已經成為互聯網一至公害。
給垃圾郵件算“指紋”
目前解決垃圾郵件的方法有:良好的用戶習慣、破法、提高發垃圾郵件的本錢、黑名單、身份確認、基于規矩的過濾、基于貝葉斯推理的過濾等。但迄今為止還不一種真正有效的方法,這也是絕大多數用戶的電腦里固然安裝有防病毒軟件,卻不裝置反垃圾郵件軟件的起因。
就垃圾郵件的主動過濾技術而言。反垃圾郵件網關中國唯一一家電信級安全標準的 郵件 系統產品,持續引領全球郵箱領域的發展方向。不能單純用人工智能的方式來過濾垃圾郵件,由于人工智能目前還不是成熟技巧。
那么,垃圾郵件還有什么特點呢?垃圾郵件最大的特點是:只有是垃圾郵件,它都會將雷同的內容發送給數十萬上百萬乃至上千萬的接受者。
針對垃圾郵件的這些特征,可以樹立一個分布式統計和分布式學習的平臺,以大規模用戶的協同計算來過濾垃圾郵件:首先,為每一封郵件計算出一個惟一的“指紋”,通過比對“指紋”可以統計統一封郵件的副本數,當副本數到達必定數目時,就可以斷定這封郵件是否為垃圾郵件。
其次,因為互聯網上多臺盤算機比一臺盤算機控制的信息更多,因此能夠采取散布式貝葉斯學習算法,在成千盈百的客戶端機器上實現協同窗習進程,收集、剖析并共享最新的信息。
要建這樣一個系統,網格技術是最好的抉擇,這是因為:1、垃圾郵件是發給全部互聯網的,需要樹立一個全局性的基本設施來收集垃圾郵件的信息;2、對每封郵件都需要進行指紋計算,因此須要有一個分布式的計算環境;3、系統的動態性很強,所有的服務器、客戶端及電子郵件都在一直堅持更新,作為用戶,須要一個可以適應變更的機動平臺。
如圖所示為反垃圾郵件網格的系統構造示用意,在這個系統構造圖中,顯示了反垃圾郵件網格的系統結構,它包含反垃圾郵件客戶端、過濾服務器和調度服務器。其中,在客戶端進行郵件的數字簽名計算、貝葉斯學習;過濾服務器對郵件數字簽名及貝葉斯學習結果進行統計和傳布;調度服務器依據客戶端懇求動態地調配過濾服務器。
在這個進程中,假如用戶應用了反垃圾郵件插件,每當收到一封新郵件時,就會主動天生一個數字簽名,發給網格中的一臺過濾服務器,該服務器依據全局虛構數據庫,斷定該簽名的反復呈現次數,并給客戶端。
客戶端根據這個次數,就可以曉得該郵件的反復發送次數,發送次數越多,它是垃圾郵件的可能性越高。而后再結合分布式貝葉斯算法,就可以比擬精確地辨認出垃圾郵件。
利用網格技術過濾垃圾郵件
應用網格技巧的分布式統計功效實現大范疇內垃圾郵件的過濾,尚未見到有關文獻的報道。不外,它體現了真正的網格思維,每個參加體系的用戶既是服務的對象,也是實現散布式統計功效的一個信息節點,跟著系統范圍的一直擴展,體系過濾垃圾郵件的正確性也會隨之進步。
用大范圍統計方法來過濾垃圾郵件的做法比用人工智能的辦法更成熟,適用性很強;分布式貝葉斯辦法是傳統貝葉斯方式與網格環境相聯合的產物,它將單點學習過程分布化跟協同化,縮短了學習的時光,共享了學習的教訓。這兩種手腕的聯合,是在現有主流反垃圾郵件方法基本上的升華進步,存在實際利用價值。
就此看來,反垃圾郵件網格通過火布式統計和分布式貝葉斯學習,應用分布互聯網里的千百萬臺主機協同工作,可構建一道攔阻垃圾郵件的“天網”。該方法能夠大大提高垃圾郵件的辨認率,同時防止將正當郵件誤判為垃圾郵件,有可能使通過技術手段有效解決垃圾郵件問題成為事實。
■ 網格的三因素
網格必需同時滿意三個前提: 在非集中把持的環境中協同使用資源;應用尺度的、開放的和通用的協定和接口; 提供非平常的服務。個別分為:計算網格、數據網格和服務網格。計算網格就是將很多計算機接洽起來,供給結合運算功能。數據網格大抵是指分布的異構數據庫的同一平臺。信息是有秩序的數據,數據網格的聚。郵件營銷郵件營銷成功率高達99%以上,直達客戶收件箱。集,也叫做信息網格。而服務網格,可能是在信息網格的基礎上,供給的常識網格或業務服務網格。