论文部分内容阅读
随着互联网上可用信息的日益增多,怎样快速而有效地获取有用信息成为人们研究的重要课题,信息自动分类就应运而生了。贝叶斯作为其中的一种分类方法,应用在很多领域。本文将贝叶斯与语言模犁相结合的分类模型应用于中文文本分类中。在复旦大学中文语料库上进行实验,得出如下结论:使用四种平滑技术改进后的贝叶斯分类模型的性能要优于朴素贝叶斯分类模型的性能,特别是采用了改进平滑尺度的Jelinek-Mercer平滑技术后,分类器的性能得到较大改善。