论文部分内容阅读
本文分类主要作为处理大量的文本数据和新闻数据的关键技术,为了使用户准确的查找所需的文本,着重的介绍了新闻分类的基本方法,介绍了余弦相似度的概念和具体使用方法,包括余弦相似度的基本应用.一并介绍了KNN的方法来分类,最后介绍了逆文档频率的信息熵和对比验证信息是否符合所分类别的方法与评价指标.