最大熵模型在邮件分类中的应用

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:yummyumi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
邮件分类是指在给定的分类体系下,根据邮件的内容和属性,确定其类别标签的过程。将最大熵模型应用于邮件分类中.给出了邮件的预处理过程,介绍了邮件信头特征,分析比较了特征数量和迭代次数、邮件特征字段对分类结果的影响,以及对层次分类和平面分类的效果进行了比较。实验表明,特征数量和迭代次数分别取2000和250时为宜;充分利用邮件各字段信息,取得的总体分类效果最好,但对合法邮件,利用邮件头及邮件标题却取得了最好结果,并在层次分类中验证了这点,层次分类效果要优于平面分类。最后进行了总结和展望。
其他文献
利用1951-2005年西宁、兰州、临夏气温资料和北半球500hPa高度、海平面气压及北太平洋海温资料,分析了黄河上游地区冬季气温的异常变化及其海气背景。发现:黄河上游地区冬季气
摘 要 林业是我国重要资源,是我国生态建设的重要组成部分,但在我国林业执法过程中,受到各种因素的影响,出现了许多问题,所以应提出完善策略,不断完善林业综合执法体系,加强执法人员的执法能能力,促进林业事业的长久发展。  关键词 林业;综合执法体系;突出问题;完善策略  中图分类号:F326.2 文献标志码:B DOI:10.19415/j.cnki.1673-890x.2016.26.034  随着
针对粗糙集理论核心内容之一的知识约简问题,提出了一种基于遗传算法的粗糙集属性约简算法。利用条件墒计算属性问的相关性,并将其引入到适值函数中,可以保证所求约简含有较少的
针对目前实施的多数停车诱导系统可变信息板动态车位信息显示较单调的现状,探讨了以模糊控制方法来进行信息警示。综合考虑各种因素(停车场当前空位数、当前驶入率与驶出率、信
摘 要 为确保农作物粮食持续增产,促使农民在生产过程中持续增收,必须加强农作物种子生产经营管理。基于此,围绕农作物种子生产经营管理的加强这一主题,从积极建立和完善种子经营备案的制度、生产经营许可证的管理制度、种子质量监督管理制度、种子经营保证制度、农作物新品种试验以及示范科学管理、种子经营档案管理制度、种子标签管理、技术和售后服务、检查、监督及通报制度等方面展开阐述,旨在促进农作物种子生产经营管理
根据果洛地区玛沁、玛多、甘德、达日、久治和班玛六县历年3—10月平均降水量的分布规律以及受地形抬升等因素的影响分析,表明果洛地区云水资源丰富,适宜大规模开发利用,并得出
2009年2月23日,青海省视频天气会商系统正式启用:为发挥青海省视频天气会商系统在业务工作中的应用,提高业务管理部门和相关网络技术人员管理和应用该系统的能力,省局监测网络处
果洛州现有加油站共18家,多数加油站地处偏僻,地质情况为土壤层仅30cm后表现为沙砾层,自然电阻率极大。在雷电防护装置设计、施工中,由于受环境、地质情况的影响,共用接地体电阻值
摘 要 虽然玉米这一农作物在我国栽培种植范围很广,但栽培管理效率仍然是困扰玉米产量质量提升的关键性因素。从选地整地、选种播种和播种后管理3个方面,探讨了玉米种植过程中栽培管理的技术性问题,希望对提高我国玉米种植业整体效益有所裨益。  关键词 玉米;种植;栽培管理技术  中图分类号:S513 文献标志码:B 文章编号:1673-890X(2016)09-0-02  玉米在我国农业体系中占有着非常重要
对4方向背景方向特征进行了改进,提出了8方向背景特征描述方法。与4方向背景方向特征描述方法相比,改进后的特征描述方法可以从0°、45°、90°、135°、180°、225°、270°、315°共8个方向来对汉字图像进行考察,从而进一步提高描述的精度。此外,为了消除笔划粗细的影响,还对背景方向特征进行了归一化处理。实验结果表明改进后的归一化8方向背景方向特征具有更高的识别精度。