逆文档频率相关论文
垂直领域文本分类一般将研究内容限定在特定专业领域或有某种特定需求的领域中,与非垂直领域相比,垂直领域文本分类在文本表示、特......
针对短文本特征选择方法,分析研究逆文档频率(IDF)和卡方统计量两种方法的特点,并将IDF和卡方统计量方法相结合,对卡方统计量方法......
结合新闻网页的内容特征对中文网页关键词的构成特点进行阐述;对经典的TF-IDF加权公式进行改进,构建一个综合考虑多种影响因素的候......
本文在分析比较几种用于文本分类的特征选择方法的基础上,提出了一种基于术语频率和逆文档频率的特征选择方法TDF。采用KNN和Naive......
多变量数据流精确分类问题是当前数据挖掘与信息领域的热点和难点,引起国内外越来越多研究群体的关注,但以往的研究大多依赖于从单......