情报实时过滤和分类系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:awzh963
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子邮件的普及,邮件在当今军事情报中所占的比例越来越高。海量邮件中存在的垃圾邮件问题日益突出,其数量急剧增长,内容和形式也千变万化,给情报工作带来了巨大的困扰。邮件中存在的垃圾邮件严重降低了邮件的可用率,使情报工作的效率大大降低,情报检索工作的准确性也受到了严重的干扰。设计一个高效准确的邮件过滤和分类系统,从海量的邮件中提取出有价值的情报,已经成为当前军事情报工作的一个重要课题和迫切要求。现有的情报系统采用的情报过滤和情报检索所采用的方法大部分依赖于词典和关键字搜索。使用关键字搜索,命中率低,效率慢;依赖词典,则存在分词障碍,并且不能有效的抵抗人工干扰。本文对现有的算法在文本过滤和文本分类中存在的问题进行了分析,提出了改进方法,设计了一种速度快、计算简便、性能好、不依赖字典和分词技术的文本分类方法,并在此基础上设计了情报实时过滤分类系统。系统从邮件的预处理、特征选择、相似度计算、文本过滤及文本分类等方面对如何提高邮件和文本的过滤和检索性能进行了研究和探索。实验证明情报实时过滤和分类系统是抗干扰能力强、新词识别能力较好、时空高效的情报平台。其过滤策略能够有效的降低系统中的垃圾邮件含量,提高系统的有价值邮件的含量。基于过滤策略,分类策略也能快速准确的提取出满足用户预设条件的邮件。该系统满足了情报系统对于实时性和海量处理的需求。
其他文献
多年来,指导信号采样的理论基础一直是著名的奈奎斯特(Nyquist)采样定理。定理要求信号的采样率不得低于信号最大频率的两倍,这给系统的处理能力带来了很高的要求,给相应的硬件设
据不完全统计,每年在世界各地举办的国际学术会议的数量达到了1万多次,参会人次也有百万之巨,学术交流活动日益频繁。而且,学术会议的种类繁多,特点复杂,有的是一次性的会议,有的则
随着计算机技术的迅猛发展,虚拟实验一直是计算机领域、教育信息化方向的研究热点。本研究以中职《计算机组装与维护》课程中硬件组装实验教学的不足为研究起点,通过设计与开
学位
随着英特网的不断发展,图像数量与日俱增,每天大量的图像都会被添加到图像数据库中,图像检索技术逐渐成为一个非常活跃的研究领域。如何有效地对这些图像进行分析、存储和检索已
农业信息化公认的难题是信息传递的“最后一公里”。在农业生产现场直接提供服务是提高农业服务效率和准确度的有力保证。基于移动网络的农业微博,可以方便地解决这一难题。利
随着计算机软硬件技术和现代测控技术的不断发展,自动测试系统的规模和复杂程度越来越高,使用传统的软件开发方法,特别是使用C语言这种面向过程的程序设计语言,难以在有限的的时
在计算机信息安全体系的建设过程中,身份认证占据重要的地位。如何提升企业内部各部门及移动办公人员访问企业内网数据的身份认证识别安全等级,已经成为网络管理员需要解决的重
流程挖掘在社会日常生产工作中起到非常重要的作用。但是,由于当今市场的竞争和技术的升级,系统的流程会趋向于弹性化、灵活化。因此,需要感知系统流程变化和变化后的流程对
随着信息化的迅猛发展,SOA成为解决软件系统构件化过程中长期存在的复杂度和相关度问题的新方法。一方面SOA提供了一个松散耦合的、跨平台的、与语言无关的系统,但另一方面也带