邮件过滤需求规格说明书

上传人:wuxin****2020 文档编号:162653655 上传时间:2022-10-19 格式:DOC 页数:21 大小:338.01KB
收藏 版权申诉 举报 下载
邮件过滤需求规格说明书_第1页
第1页 / 共21页
邮件过滤需求规格说明书_第2页
第2页 / 共21页
邮件过滤需求规格说明书_第3页
第3页 / 共21页
资源描述:

《邮件过滤需求规格说明书》由会员分享,可在线阅读,更多相关《邮件过滤需求规格说明书(21页珍藏版)》请在装配图网上搜索。

1、文档编号版本号_1_文档名称_需求规格说明书_ 项目名称:_ 垃圾邮件过滤系统_ 项目负责人:_ 开发单位:_软件工程大作业小组_编写_ _校对_ _审核_ _ 2013_年_10_月_13_日 1、引言1.1 编写目的 “邮件过滤系统”软件需求说明书主要为软件开发提供需求说明,在需求说明说中详细介绍本系统要达到什么样的要求以及基于什么样的硬件设备和软件平台来实现本软件系统的。此文档是参与本软件的需求分析人员、开发人员、测试人员的参考依据,它明确规定了本软件的性能要求、设计需求以及所能达到的期望值,保证开发出高质量、有市场价值的软件。面向的读者:本系统软件的开发人员,测试人员,主要提供一些必要

2、的参考给后续开发人员,从而让开发人员开发出的软件实现后能充分满足客户或用户的需求。1.2项目背景l 本项目的任务提出者:高东发老师l 项目开发者:林子豪、梁晓明、崔建鹏、吴清、张珊珊l 垃圾邮件的危害: 占用网络资源 浪费服务器资源 增加用户处理时间 对网络安全形成危险 散步有害信息l 电子邮件已成为日常生活中最流行,最方便,经济的通信手段。用户在收发邮件同时,经常受到垃圾邮件的干扰。邮件的泛滥给互联网用户带来很多烦恼和侵害,也给社会带来了极大的负面影响。根据“中国互联网协会反垃圾中心”调查显示的数据如下:调查结果显示,截止2013年2月,中国邮箱用户平均每周所收到的垃圾邮件大约是35%,这些

3、垃圾邮件不仅浪费我们阅读时间,而且大大影响了我们的身心健康。由此可见,过滤垃圾邮件迫在眉睫。l 目前,国内研究的过滤技术主要是基于内容的过滤。基于内容的过滤具有较高的智能性和准确率,是一种较成熟的垃圾邮件过滤技术。但是这种方法仍然存在较大的问题以下这几个问题: 对中文邮件的误判率较高 目前过滤技术对垃圾词汇不易识别 对垃圾邮件概念不明确 对其他语言邮件无法识别 无法适应日新月异的垃圾邮件伪装技术的进步l 目前国内邮箱用户所收到的垃圾邮件内容状况如下:调查结果显示,截止2012年11月,邮箱用户所收到的垃圾邮件内容集中在“欺诈类”内容和“消费类”内容。这些内容或多或少干扰我们的判断,影响我们的理

4、性,特别是对缺乏判断能力的未成年青少年造成巨大的危害。l 垃圾邮件的语言种类繁多,以下的图表显示了垃圾邮件所使用的语言种类。通过对中国互联网用户所收取垃圾邮件的语言种类进行统计可以看出,“中文”、“英文”、“日文”这 3 类语言占用户收到垃圾邮件的前 3 位,如图所示。其中,中文垃圾邮件所占比例已经高达 67.39%,而其他语言所占比例总和仅32.61%。垃圾邮件具有很强的区域性,因此,在我国基于中文内容的垃圾邮件过滤方法研究需结合自身特点体现出较强的针对性。综合调查结果显示,不断加强垃圾邮件的过滤是一项非常重要、而且很有市场价值,但却十分艰巨的工作。1.3定义1.3.1垃圾邮件定义垃圾邮件(

5、spam、junk mail):中国互联网协会反垃圾邮件规范将垃圾邮件被界定如下: (l)收件人事先没有提出要求或者同意接收的广告、电子刊物以及各种形式的宣传品等宣传性的电子邮件。 (2)收件人无法拒收的电子邮件。 (3)隐藏发件人身份、地址、标题等信息的电子邮件。 (4)含有虚假的信息源、发件人、路由等信息的电子邮件。垃圾邮件定量描述根据上述垃圾邮件的定义,一封电子邮件是否是垃圾邮件可以用式子 M=f(X,Y,Z)来衡量,M的初始值为0。其中x=x1,x2,xi表示垃圾邮件的某一信头特征,各个xi之间是互相独立的变量。如果xi是垃圾邮件的明确特征,则表明这极有可能是一封垃圾邮件。例如xi为非

6、法的邮件服务器地址,则置变量M为一较大值;如果xi不是垃圾邮件的明确特征,例如发送服务器的域名与发件人域名不同,则只能置M为一个很小的值。Y和Z分别为邮件标题。邮件正文和邮件附件经过垃圾邮件内容分析和计算后得到的这封邮件属于垃圾邮件的概率值。1.3.3软件开发中出现的其它术语定义 u E-mail(电子邮件):又称电子信箱、电子邮政,它是种用电子手段提供信息交换的通信方式,是Internet应用最广的服务,通过网络的电子邮件系统,用户可以用非常低廉的价格(不管发送到哪里,都只需负担电话费和网费即可),以非常快速的方式(几秒钟之内可以发送到世界上任何你指定的目的地),与世界上任何一个角落的网络用

7、户联系,这些电子邮件可以是文字、图像、声音等各种方式。同时,用户可以得到大量免费的新闻、专题邮件,并实现轻松的信息搜索。u 贝叶斯分类算法:一类利用概率统计知识进行分类的算法1.4参考资料 名称 作者 年份 出处 JAVA邮件开发详解 张孝祥 2007 书籍 垃圾邮件过滤的叶贝斯算法研究 李兴军 2008 论文客户端垃圾邮件过滤系统的研究与实现高良成2008合肥工业大学硕士学位论文基于内容的垃圾邮件过滤技术研究孙晶涛2010兰州理工大学博士学位论文中国互联网反垃圾协会信息中心中国互联网协会反垃圾邮件规范2、任务概述2.1目标n 功能: 完善收发邮件功能。适用于一切类型有效的邮箱格式。 过滤垃圾

8、邮件。我们志在对垃圾邮件的过滤准确率达到90%左右,给邮箱用户提供一个安全、干净的网络环境,节约用户时间、让用户不收垃圾邮件的干扰。n 操作界面:力求操作简单,和windows窗口操作界面类似,实现人性化,为广大用户提供良好的界面操作环境。n 软件大小:要求软件安装包不能超过50M,要求代码实现的过程中尽量简单,尽量去掉冗余的代码部分。n 个性化:记忆用户的手动设置,即当用户默认一类邮件作为垃圾邮件的时候,软件产生记忆功能,以后都能为用户处理用户要求处理的邮件。用户也可以手动解除垃圾邮件的处理,大大提高的个性用户个性化邮件处理的准确率。n 目标客户:开发出的软件要求适合广大邮件服务提供商、自建

9、服务器企业及政府机关、大专院校、社团组织等非盈利性组织机构。n 价值: 引导用户正确规范使用邮箱,避免用户自身发送垃圾邮件 提醒用户对垃圾邮件的地方,让用户正确认识到垃圾邮件所带来的危害。 为创建一个安全健康的互联网环境作出了重大贡献。2.2运行环境 硬件:Pentium级处理芯片1兆显存的兼容显卡显示器连接互联网 软件:windows操作系统 SQL Server 20052.3条件与限制 条件:每个开发人员都有计算机一台进行编程 高东发老师的定期指导 限制: 本软件开发周期期限为12周,分三个阶段完成,分别为需求分析期、软件设计期、软件测试期。本学期期末大作业展示前务必做好。 无资金供给

10、3、数据描述3.1静态数据静态数据:包括系统登录密码,各数据库所在位置,数据库账号密码,系统分析原始数据。3.2动态数据动态数据:包括数据库内各项显示数据,用户登录信息,系统时间,垃圾邮件样本。3.3数据库描述 采用SQL Server 2005,SQL Server 提供海量数据存取,系统运行稳定高效,对并发访问响应速度很快,控制访问安全性好,能够满足系统的性能要求。3.4贝叶斯算法描述该邮件过滤器由贝叶斯过滤算法实现,它的推理如下:由此,我们很容易算出所收到邮件时垃圾邮件的概率,再根据所设阈值判定是否为垃圾邮件。3.5贝叶斯算法的JavaMail系统逻辑架构终端Web 服务器应用程序服务器

11、邮件服务器Internet数据库服务器3.6邮件服务器系统的工作流程图3.7数据词典3.7.1Email表Email表 字段名 类型 e_name TEXT e_passage TEXT e_time DATATIME from_add varchar(50) e_context TEXT subject TEXT3.7.2数据流词条描述 数据流名:登录信息来源:用户的输入去向:系统内部检验部分组成:用户名,密码(验证码)流通量:每次登录输入一次 数据流名:登录结果来源:系统去向:用户组成:返回信息流通量:每次登录返回一次 数据流名:邮件接收来源:邮件服务器去向:应用服务器组成:邮件信息流通量

12、:以邮件数而定 数据流名:识别信息来源:邮件服务器去向:贝叶斯学习中心组成:spam概率值流通量:以邮件数而定 数据流名:处理信息来源:贝叶斯学习中心去向:垃圾邮箱组成:识别错误信息流通量:以邮件数而定3.7.3数据文件词条描述 数据文件名:用户数据简述:存储用户信息数据文件组成:用户的各项信息 数据文件名:邮件数据简述:将邮件分类存储数据文件组成:垃圾邮件和非垃圾邮件3.7.4加工逻辑词条描述v 加工名:检验简要描述:判断用户的许可性输入数据流:登录信息输出数据流:登录结果加工逻辑:判断是否与系统内部用户信息相符合v 加工名:判断简要描述:判断接受到的邮件是否为垃圾邮件输入数据流:识别信息输

13、出数据流:处理信息加工逻辑:判断邮件的spam概率值是否在范围内 3.8数据采集垃圾邮件样品由网上查找所得的垃圾邮件样品库所得。4、功能需求4.1功能划分l 写邮件功能l 收邮件功能l 过滤垃圾邮件功能l 设置个性化功能4.2功能描述l 写信箱:和我们常用的163邮箱QQ邮箱类似。使用该软件的用户打开写信箱,在写信部分填写正文。写完邮件后,通过填写有效的邮箱地址,就可以实现该邮件的发送,从而实现通信。l 收信:和我们常用的163邮箱QQ邮箱类似。用户可以接收到任何类型的邮箱发送的邮件,并且可以接收附件。用户通过登录账户就可以查看所收到的邮件l 过滤箱:用于存储被自动过滤掉的垃圾邮件。用户可以在

14、过滤箱查看被过滤掉的邮件,也可以清空垃圾邮件。l 设置: 设置某些邮箱地址为黑名单 设置含有某些字眼的关键词为黑名单 设置某一些路由器IP为黑名单 设置邮件的自动过滤 设置联系人并保存5 性能需求5.1 数据精确度 该邮件过滤器应采用贝叶斯分类算法实现,过滤准确率在95以上,即1000封垃圾邮件可以过滤掉950封。 该邮件过滤器扫描一封邮件(无附件)的时间应在0.05s0.08s。 该邮件过滤器应具有自我学习的功能,会根据新收到的邮件,不断调整。 要求邮件过滤器把6个月内所收到的垃圾邮件作为样本,提高过滤精确度。5.2 时间特性 响应时间:邮件客户端可以在收到对方发送的邮件时延缓响应时间,该邮

15、件过滤器需要在延缓时间内马上响应,对邮件进行学习、分析、识别。 更新处理时间:0.001s 数据转换与传输时间:0.01s 运行时间:提取邮件关键字和分析邮件不得超过5s。5.3 适应性 操作方式的变化:界面操作改变不会影响软件的正常运行 运行环境的变化:在所有Windows操作系统下都能正常运行 其他软件的接口的变化:在不同的Web服务器中都能正常运行 精度和有效时限的变化:尽管精确度和有效时限发生了变化,该软件都能正常运行 开发计划的变化:若增加新功能,不会影响到先前的功能模块6. 运行需求6.1 用户界面6.1.1 屏幕格式 采用图形用户界面(GUI)标准 要求有菜单及工具栏以方便操作

16、界面应简洁友好,便于广大群众使用 每个按钮样式应统一,风格一致 大部分功能可直接通过鼠标点击完成 菜单避免使用英文6.1.2 菜单格式要求菜单格式大致与windows XP经典模式相同,可添加新的功能单项。6.1.3 输入输出时间年份以4位数字输出6.2 硬件接口v 支持一般功能的台式机或笔记本电脑6.3 软件接口u Windows 操作系统u Web服务器u 邮箱服务器u 客户端访问服务器6.4 通信接口v 需要局域网的协议(如TCP/IP)6.4 故障处理 软件故障处理:词库用文本代替数据库,在开发阶段可以随时改动文本内容 硬件故障处理:考虑周全,一般不会发生硬件故障7. 其他需求7.1

17、可使用性 该软件界面简单,采用全中文界面操作,图文信息便于理解。只要是知道电脑的基本操作的用户都可以使用该系统,而且界面的每一页都会显示相关的提示信息,如果操作错误,系统也会进行提示。7.2 安全保密性为防止邮箱密码及其他信息被非法访问、使用、修改、破坏或者泄密,必须满足一下需求: 利用可靠的密码技术 给不同的模块分配不同的功能 限定一个程序中某些区域的通信 掌握特定的记录或历史数据集7.3可维护性v 代码规范,需遵守编程语言规范文档v 命名规范,需遵守编程语言规范文档v 维护方法,系统维护性良好,要求架构合理v 维护开发工作所使用的工具7.4 可移植性选择软件接口条件符合,同时一切限制条件都满足的情况下,把软件从一种环境移植到另一种环境指需要将该系统软件和文本文件进行拷贝,然后将软件重新安装就可以,很容易操作。7.5 稳定性防止意外修改使得程序失效。

展开阅读全文
温馨提示:
1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2: 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
3.本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!