可擴展的郵件過濾程序與API,SpamAssassin 3.4.0 發布
近日,Apache軟件基金會(由志愿者所構成的開發者、管理員團隊,擁有170多個開源的孵化項目)發布了一個“獻給Internet的情人節禮物”,即Apache SpamAssassin 3.4.0——備受贊譽、高度可擴展的郵件過濾程序與API。eWeek稱其為過去10年間改變計算機產業的11項Apache技術之一。 SpamAssassin已經被全球不計其數的組織所部署。這個備受贊譽的反垃圾郵件平臺賦予了系統管理員強大的能力,能夠有效防止郵件遭受垃圾郵件的騷 擾。該版本的主要新特性有增加了對IPv6的支持、改進的DNS Blocklist技術,通過Redis后端支持可伸縮的貝葉斯過濾器等。
通過提供一個廣泛的特性集并支持郵件分類(包括基于文本的模式、貝葉斯過濾器、DNS Blocklists、校驗和過濾器、發送者認證以及自動化的規則通道更新等),SpamAssassin采用了一種多步驟/分層的方式對郵件進行過濾, 從而提升精確度,并降低將正常郵件錯誤地識別為垃圾郵件的幾率。
該項目的此次發布也是一個里程碑事件,上一次發布可以追溯到兩年前。Apache SpamAssassin副總裁Kevin A. McGrail說到“借助于SpamAssassin 3.4.0的發布,該項目將會繼續與垃圾郵件制造者戰斗到底。SpamAssassin最棒的一個特性就是經過驗證的分類分數框架,系統管理員可以憑借它 用新的理念來改進郵件分類,這使得SpamAssassin能夠不受時間影響而具有很強的可擴展性”。
目前,世界上已經有很多組織部署了Apache SpamAssassin,這包括國家、地區以及本地的ISP、郵件服務提供商、財富世界500強公司以及中小型企業等,涵蓋了教育部門、政府部門以及個 人。Apache軟件基金會高級系統管理員Joseph Schaefer說“SpamAssassin是Apache軟件基金會反垃圾郵件解決方案的核心系統,我們每天都會收到50多萬個連接,首先都會指向郵 件列表,但我們卻幾乎感覺不到垃圾郵件的騷擾,這多虧了SpamAssassin”。SpamAssassin項目每天都會提供規則更新來與垃圾郵件作斗 爭,上個月,該項目就已經服務于100多萬臺郵件服務器了。
SpamAssassin也是幾個商業產品的基礎,并且作為核心用于很多郵件與垃圾郵件過濾公司的商業產品中,包括最流行的Web托管控制平臺 cPanel。cPanel將SpamAssassin呈現在眾多系統管理員面前。cPanel的開發部主管Eric Ellis說“成千上萬的最終用戶提供了很多解決方案來消除服務器上的垃圾郵件”。Apache SpamAssassin反映出了反垃圾郵件社區的大力支持,這包括開發、測試以及研究,從有經驗的用戶所得到的建議到與垃圾郵件作斗爭所吸取的經驗教 訓。此次發布將獻給整個社區。
與Apache所有的產品一樣,Apache SpamAssassin軟件也是基于Apache License v2.0發布的,并且受自選的項目活躍貢獻者的監管。項目管理委員會(PMC)將會指導項目每天的運作,包括社區開發與產品發布等。感興趣的讀者可以在http://spamassassin.apache.org/上查看SpamAssassin的發布聲明、源代碼、文檔與相關資源等信息。
Apache SpamAssassin背景知識
SpamAssassin是個用于識別垃圾郵件的郵件過濾器。它是個智能的郵件過濾器,通過各種測試來識別未經請求的郵件,即垃圾郵件。這些測試會 應用到郵件頭與內容,使用高級的統計方法來對郵件進行分類。此外,SpamAssassin還擁有一個模塊化的架構,可以快速利用其他技術來對抗垃圾郵 件,同時也可以很輕松地與幾乎任何郵件系統進行集成。
相對于其他反垃圾郵件系統來說,SpamAssassin實用的多技術解決方案、模塊化與可擴展性是其一大特色。由于這些優 勢,SpamAssassin被廣泛應用于郵件系統的方方面面。無論是郵件客戶端還是郵件服務器,你都會看到SpamAssassin的影子,它可用于多 種不同的操作系統,過濾進出的郵件,還實現了范圍廣泛的策略動作。服務提供商、業務、非營利與教育組織以及最終用戶系統都會安裝 SpamAssassin。此外,SpamAssassin還是當今市場上眾多反垃圾郵件產品的根基。
SpamAssassin靈活且強大的Perl程序集與其他老式反垃圾郵件過濾方式不同,它聯合使用了多種檢查方式來確定某個消息是否是垃圾郵件。其主要測試方式如下所示:
- 郵件頭測試
- 郵件體短語測試,請參看SpamAssassinRules了解更多信息
- 貝葉斯過濾器
- 自動化的地址白名單/黑名單
- 手工設定的地址白名單/黑名單
- 協作式的垃圾郵件識別數據庫
- DNS Blocklists,也稱作“RBLs”或“Realtime Blackhole Lists”
- 字符集與本地化
雖然上述每一種方法都有可能錯誤識別垃圾郵件,不過上述方法的組合是很少會出現錯誤的。
SpamAssassin擁有眾多優秀的特性,下面列出其主要功能及優勢:
- 廣泛性:SpamAssassin使用了多種本地與網絡測試來識別垃圾郵件簽名。這使得垃圾郵件制造者很難逃脫出SpamAssassin的識別范圍。
- 自由軟件:SpamAssassin與其他流行的開源軟件包如Apache Web Server等一樣基于相同的條款與使用條件。
- 易于擴展:反垃圾郵件測試與配置以普通文本的形式存儲,這使得它非常容易配置,添加新規則也易如反掌。
- 靈活性:SpamAssassin以經過良好設計、抽象API的形式封裝了自身的邏輯,因此可以集成到郵件系統的任何地方。Mail::SpamAssassin類可用在為數眾多的郵件系統中,比如說procmail、sendmail、Postfix及qmail等等。
- 易于配置:SpamAssassin只需要極少的配置;你無需不斷地使用郵件帳號、郵件列表成員等來更新它。分類完畢后,站點與用戶指定的策略就可以應用于垃圾郵件。策略可以應用于郵件服務器,也可以使用用戶自己的郵件應用。
值得注意的是,SpamAssassin并不是一個刪除、路由垃圾郵件并對收件箱進行分類的程序。這些都是郵件路由功能,而
SpamAssassin卻并非一個郵件路由器。它是一個郵件過濾器或是分類器。它會檢查接收到的每條消息,然后為其設定一個分數,表示該郵件是垃圾郵件
的可能性。接下來,外部程序必須要檢查這個分數,然后執行用戶期望的路由。在檢查完SpamAssassin所設定的分數后,有很多程序都可以輕松執行后
續的功能。
來自:http://www.infoq.com/cn/news/2014/02/SpamAssassin-3.4-Release