基于通用后缀树模型的垃圾邮件过滤方法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:baishe654
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用通用后缀树模型(GSTM),利用邮件内容的上下文信息,进行每个文本位置的不定长多元统计,从而获得被测邮件与不同训练集的相似程度,确定邮件所属的类别。理论分析和实验表明,在相同语料上,该方法的精确度和召回率均达到或超过了基于向量空间模型的邮件过滤方法;对于长度为N的邮件,过滤时间为O(N);长度为N的新邮件加入训练集,训练时间为O(N),满足了训练集的动态增长;该方法不需进行分词处理,完全独立于语种,适用于多语种邮件同时存在的情况。 By using the universal suffix tree model (GSTM), the context information of the message content is used to carry out the variable-length multivariate statistics of each text position to obtain the similarity degree between the measured mail and different training sets and to determine the category to which the mail belongs. Theoretical analysis and experiments show that the accuracy and recall rate of the proposed method meet or exceed the mail filtering method based on vector space model. For the length N message, the filtering time is O (N) and the length is N is added to the training set, the training time is O (N), which satisfies the dynamic growth of the training set. This method does not need word processing and is completely independent of the language. It is suitable for the simultaneous existence of multilingual mail.
其他文献
工程机械是资源开发、市政工程、交通建设、水利电力等工程施工的重要机械设备.传统的轮式工程机械的差速器,自锁系数变化范围小,防滑功能有限,影响车辆操纵的稳定性;同时差
利用吹扫捕集法在“大洋一号”船上现场探测到Logatchev热液场水柱上方及附近存在明显的甲烷羽状流.测定结果显示,热液区海水甲烷背景含量为1.05~1.68nmol/L,明显高于大西洋深
为了在自身地质条件复杂,且外部存在交叉作业、无法实施封闭爆破施工的条件下,控制露天爆破振动及飞石对周边构建筑物的影响,以徐州轨道交通1号线一期地下市政工程振兴路站—
根据1997~2000年东海23°30′~33°00′N、118°30′~128°00′E海域4个季节海洋调查,运用磷虾类物种丰度和同步的温、盐度资料,进行曲线拟合,构造数学模型,计算各种磷虾分布的最适温度和盐度,并参考其地理和季节分布特征,对东海浮游磷虾类生态类型进行定量分析。结果表明,在磷虾优势种中,太平洋磷虾(Euphausia pacifica)是温带外海种,小型磷虾(E.nana)是暖温
主要讨论用于完成数值协处理器各种运算的微码电路.简单介绍微码电路在协处理器中的重要性,具体介绍微程序控制模块的工作原理,微码电路的微码地址产生、微程序和微子程序的
详细评述了剪切带运动学和内部几何学研究的新进展.剪切带内的递进变形一般为三斜对称,单斜剪切带(包括简单剪切带)是特例情形.理论模拟表明,如同许多天然剪切带中所见到的,
南海西部越南岸外MD05-2901孔晚第四纪450 ka以来黏土矿物和氧同位素的高分辨率分析表明,伊利石、绿泥石和高岭石含量表现出明显的冰期-间冰期旋回变化,而蒙脱石含量呈现频率
该文介绍了在线路放样过程中使用参数方程来确定中边桩坐标的新方法。根据曲线模型,找出线路控制坐标系与局部坐标系坐标之间的参数方程关系,推出了缓和曲线及圆曲线中边桩坐标的参数方程,代入已知量求得参数的值,给出了求解步骤。该方法思路清晰,具有一次计算就可以实现坐标准确确定的优点,便于工程应用。
预测微生物的数学模型可以对食品中微生物的生长、残存和死亡进行数量化预测.简述了预测微生物的数学模型研究食品微生物行为的理由.介绍了微生物预测模型的研究概况及其在肉
高校教学改革在不断深入,各方面体制在不断调整,教材管理工作也要不断适应新要求和新挑战.目前,商务学院的教材管理模式.还处于传统和手工阶段,远远不能适应学院发展的要求.