论文部分内容阅读
传统的基于统计的文本过滤技术对具有倾向性的文本进行过滤效果不好,原因在于基于统计的方法忽略了文本中的词序等语义约束,无法有效识别倾向性信息.本文提出一种基于文本倾向性的文本过滤方法,将倾向性词典和语义规则匹配相结合,对文本中的词的倾向性和词序加以考虑,能有效地对倾向性文本进行识别和过滤.该方法应用于邮件过滤系统设计中,取得了良好的过滤效果.