基于概念向量空间模型的电子邮件分类

来源 :计算机应用 | 被引量 : 1次 | 上传用户:tp20201892
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一个基于概念向量空间模型的电子邮件分类方法。在提取电子邮件特征向量时,以WordNet语言本体库为基础,以同义词集合概念代替词条,同时考虑同义词集合间的上下位关系,从而建立电子邮件的概念向量空间模型作为电子邮件的特征向量。使用TF*IWF*IWF方法对概念向量进行权值修正,最后通过简单向量距离分类方法来确定电子邮件的类别。实验结果表明,当训练集合数目有限时,该方法能够有效提高电子邮件的分类准确率。
其他文献
根据国内外在信息采集领域的发展以及并行采集技术的研究,提出了一个基于多线程并行的W eb信息采集结构模型,该模型以线程并行的方式对W eb页面同时采集,实现了全面、高效并且灵活的信息搜集。
通过扩展DTD和XML文档的解析建立面向对象的XML存储模式中的数据仓支持XML数据之间的继承关系和基于XML的面向对象的数据查询方式。文章阐述了解析器的系统设计与实现算法,并给出进一步的研究方向。
提出了一种基于按需距离矢量路由(Adhoc On Dem and Distance Vectorrouting,AODV)的邻域自意识路由协议(Neighborhood Aware RoutingP rotocolbasedon AODV,NAAODV),它充分考虑并利用了邻居信息,使故障路由具有快速修复的功能。仿真结果表明,NAAODV较AODV在系统吞吐量和平均端到端延时方面,都有了明显的改善
作者分析了饲料生产加工流程(配方设计-原料采购-加工过程-产品贮藏)中可能存在的不安全因素,提出解决措施。
2005年1月6日,上海捷银信息技术有限公司(捷银)宣布已正式达成协议,在符合惯例性成交条件的情况下.整合英斯克信息技术有限公司(英斯克),而捷银是从英斯克公司孵化出的一个项目演
针对大型空间数据库应用的需求及己有空间索引技术的不足,在论述R-树及R*-树索引技术的相关概念、数据结构、算法描述及性能分析的基础上,提出了一种改进的R*-树空间索引结构。研究结果表明:改进后的R*-树与原始的R*-树相比具有更高的性能。
【正】 英明领袖华主席亲自主持召开的党的第十一次全国代表大会,是一次承先启后的大会,是一次高举毛主席的伟大旗帜,坚持马克思主义、坚持团结、坚持光明正大的大会,是我党
动物也会数学,这是真的吗?  你知道吗?许多动物的头脑并非像人们想象的那样愚钝,它们不仅聪明,而且懂得计算、计量、数数……甚至可以说它们是数学“天才”!  现在,我们就一起去认识下面这些“数学家”吧!  蜜蜂  蜜蜂的蜂房是中空的六角柱状体,底部由三个菱形面组成,菱形的钝角为109°28′,锐角为70°32′。蜂房的巢壁厚0.073毫米,误差极小。更令人叫绝的是,世界上所有蜜蜂的蜂房都是统一按照这
“一棵茶树一斤油,子子孙孙不用愁”。这是大三湘油茶基地的口号之一。在周新平眼中,茶油的价值已不仅仅是一种产品,更饱含着浓浓爱心,升华到一种让农民过上幸福日子的社会责任。
为探索预防、治疗仔猪脐疝简便而有效的方法,笔者用保守法成功治愈9头病例,通过对病例和病史资料进行分析,并同其他保守和手术治疗方法相比较,总结出各种方法的适应症和优缺