反垃圾邮件管理系统的设计(黑白名单技术)(SQL2000)
来源:56doc.com 资料编号:5D4207 资料等级:★★★★★ %E8%B5%84%E6%96%99%E7%BC%96%E5%8F%B7%EF%BC%9A5D4207
资料以网页介绍的为准,下载后不会有水印.资料仅供学习参考之用. 密 保 惠 帮助
资料介绍
摘 要
随着Internet的迅速普及,电子邮件以其快捷、方便、低成本的特点逐渐成为人们进行信息交流的主要媒介之一,但是随之而来的垃圾邮件也越来越泛滥。垃圾邮件占用了有限的存储、计算和网络资源,耗费了用户大量的处理时间,影响和干扰了用户的正常工作、生活和学习。如何有效地治理垃圾邮件是全世界共同面临的一道难题,也是互连网上目前有待解决的问题。本文首先介绍了电子邮件对人们日常生活的重要性,然后概要介绍了反垃圾邮件技术的发展历史。研究了三种过滤垃圾邮件的方法,分别是黑白名单技术、主题关键字过滤技术和贝叶斯策略,对这三种技术的设计方法做了说明,重点介绍了贝叶斯过滤技术的设计原理和实现步骤。最后总结了这几种过滤技术的不足之处和设计中遇到的难点问题。
关键词:电子邮件;垃圾邮件;黑白名单;主题关键字;贝叶斯
Design of anti-spam mail management system based on ASP
Abstract
With the rapid development of internet, the technology of email is used widely in people's daily life. However, the occurrence of more and more spam emails is annoying to user, which causes the great waste of user's time, money as well as network bandwidth. And what's worst, it can be harmful to users. It affects and interferes with the user's normal work, life and studying. How to deal with spam emails effectively, that is a common difficult problem for all over the world. In the current Internet it is a problem for waiting for us to resolve. At first this paper introduces the e-mail's importance for people's daily life. Then it introduces simply development history of the anti-spam technology and researches three of spam filtering methods, they are black and white list technology, subject keyword filtering technology and bayesian strategy. Then the designing methods of three kinds of technology are introduced. Focusing on the bayesian filtering technology, this paper introduces its designing principle and implementation's steps. Finally I sums up some shortcomings of several kinds of filtering technology and some difficult problems in designing.
Key words: email; spam email; black and white list; subject keyword; bayesian
反垃圾概述
“垃圾邮件”多指未经请求而发送的电子邮件,也可以是发送给与信件主题不相关的新闻组或者列表服务器的同一信件的重复邮件。国内外的技术专家和反垃圾邮件组织对“垃圾邮件”的定义如出一辙:批量发送的未征得收信人同意的电子邮件。 这些电子邮件虽然每封的信息量不一定很大,但是邮件内容不是大多数用户需要甚至是令大多数用户讨厌的。铺天盖地的宣传邮件不仅侵犯了用户的私人空间,而且干扰了大多数用户正常使用电子邮件功能,同时给用户带来了上网时间和上网资金上的浪费,因此被称为“垃圾邮件”。国际互联网上的常见名词SPAM、UCE(Unsolicited Commercial Email不请自来的商业电子邮件)和UBE(Unsolicited Bulk Email不请自来的批量电子邮件)与通常所称的垃圾邮件是一样的。
系统功能模块设计
本系统分为三个大模块
1. 日常操作模块
这个模块分为收邮件和写邮件两部分,用户可以通过这个模块收发电子邮件,完成正常邮件和垃圾邮件的接收,本系统是采用从本地数据库读取数据,为反垃圾技术的研究提供测试环境。
2. 邮件夹
此模块建立了两个文件夹,分别是收件夹和垃圾邮件夹,经过过滤的正常邮件显示在收件夹中,过滤后得到的垃圾邮件显示在垃圾邮件夹中。并可以对邮件进行删除和查看操作。
3. 垃圾邮件过滤
此模块是本设计的核心部分,采用了黑名单、白名单、主题关键字、贝叶斯过滤技术来过滤垃圾邮件,用户可以通过过滤设置来启动和停止这些过滤规则。
基本功能
通过黑名单、白名单、主题关键字、贝叶斯过滤技术完成客户端的垃圾邮件过滤,每个过滤规则在对邮件进行处理判断后,若可以确定邮件的属性,即为垃圾邮件或非垃圾邮件就可以直接把邮件显示在垃圾邮件夹和收件夹。
目 录 10000字
1 引言 1
1.1 课题背景 1
1.2 开发概述 1
1.2.1电子邮件概述 1
1.2.2反垃圾概述 2
2 电子邮件的工作原理 2
2.1 电子邮件的结构 2
2.2 电子邮件的传输 3
3 需求分析 3
3.1 数据库需求分析 3
3.2 开发环境需求 5
4 系统功能和技术描述 6
4.1 系统功能模块设计 6
4.2基本功能 6
4.3黑白名单技术 7
4.4 关键字过滤技术 7
4.5 贝叶斯过滤技术 8
4.5.1贝叶斯过滤算法的基本步骤 8
4.5.2贝叶斯过滤算法举例 9
4.5.3贝叶斯过滤模块划分 10
5 系统工作流程和详细设计 11
5.1 系统工作流程图 11
5.2邮件统计设计 11
5.3收件夹设计 12
5.4反垃圾功能设计 13
5.4.1黑白名单过滤 13
5.4.2主题关键字过滤 14
5.4.3贝叶斯过滤 15
5.4.4过滤参数设置 17
6 测试与分析 17
6.1系统测试 17
6.2设计中的难点问题 18
6.3三种过滤技术分析 19
6.4通用模块分析 19
结 论 20
参考文献 20
致 谢 21
声 明 22
|