中文垃圾邮件的索引分词法的研究与设计

来源 :计算机应用 | 被引量 : 11次 | 上传用户:lyklcjs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了提高中文垃圾邮件预处理阶段的性能,加快查找分词的速度,基于哈希函数的算法思想创造性的构造了索引词典,设计了一种针对中文垃圾邮件的中文索引分词方法。通过实验,表明该方法提高了传统机械分词法的效率和准确率,改善了邮件预处理阶段的性能,并且可以广泛地应用于中文分词领域。
其他文献
手机短信作为简便有效的信息交流方式已成为大学生之间一种主要的交往形式。通过对2004.1~2004.7期间山东某学院在校学生手机短信通讯数据的统计分析,构建出学生人际交往虚拟网络,着重于网络拓扑结构的小样本统计分布研究,给出一种获取小群体拓扑结构的新算法。
对新疆培养青少年男子足球运动员中的训练管理体制、培养模式、队伍数量、队员人数及其分布、民族比例、基础设施、教练员、比赛等方面进行分析.研究表明,新疆青少年培养存在
针对人工免疫网络解决多模态函数优化时可能出现的早熟收敛现象和搜索精度不甚满意的问题,提出改进的混沌免疫网络算法。改进算法终止条件及采取相应措施以避免早熟,利用混沌变量来模拟免疫细胞的增殖方式以提高算法的搜索精度。通过对一些典型测试函数进行仿真实验,结果表明该算法能够快速优化抗体,搜索能力强,搜索精度高,是一种效果优良的解决多模态函数优化问题的极值寻优方法。
介绍了基于轮廓特征的非规则碎片复原系统的模块构成,并针对碎片序列拼合模块,利用碎片间的匹配对关系,提出了一种新的碎片拼合序列遍历算法。该算法中碎片均由当前匹配碎片和另一碎片共同匹配而得,从而在后续的拼合中碎片的定位和拼合可由两碎片共同确定,这将为拼合过程提供保证。最后结合实例,进行了算法验证,取得了较好效果。
在处理彩色集成电路(IC)图像的过程中,为了降低计算的复杂度,经常需要将彩色图像转换成灰度图像后再进行处理。本文将数据降维中优化判据的思想引入彩色图像到灰度图像的转换中。为了求得最优降维方向,必须寻找一个判据来衡量各个降维方向上形成的灰度图像的质量。文中采用加权的Fisher判据来衡量图像的质量。在将图像分割成区域后,判据中的类间距离反映了区域之间的对比度,类内距离反映了区域内部之间的均匀性,权重
随着<中华人民共和国体育法>的通过和实施,我国体育的三元结构(社会体育、学校体育、竞技体育)最终以法律形式确定下来.然而,"群众体育"在我国人民的现实生活中,尤其在政府重
提出了一种用视频图像进行试井解释的方法,依据视频图像上物体的大小,利用摄像机镜头光学成像原理计算井筒内落物的尺寸;根据视频图像的特点,选择图像的特定部分进行二值化处理以分离出油和背景,计算出指定深度的准含油率;对视频图像先进行平滑处理,再用高斯拉普拉斯算子进行边缘检测计算出指定深度段内的射油孔数;利用图像几何校正技术,将椭圆的套管边缘校正为垂直井轴的类圆边缘。