质心向量相关论文
随着互联网技术的高速发展,人们更加倾向于从网络上获取所需的新闻热点信息。由于网络数据具有信息来源广、传播速度快、内容杂乱......
研究如何在一个网页内部进行有选择的爬行.使用TFIDF-2模型以及Max,Ave,Sum三个启发式规则分别计算文档特征权重和质心特征权重,在......
文本分类是数据挖掘与信息检索领域的热点话题,近年来迅速发展。基于质心的方法是一种建模迅速且效果较好的文本分类方法,许多学者......
针对维吾尔文文本分类中的"标注瓶颈"问题,研究半监督文本分类。将期望最大化(expectation maximization,EM)算法和基于质心向量(C......
互联网的飞速发展使得主题爬行程序需要处理的网页越来越复杂,现在有相当数量的网页是多主题的(Multi-Topic)。如何在一个网页内部......
针对质心分类算法容易产生归纳偏置或模型失配问题的不足,提出一种基于支持向量的迭代修正质心分类算法.该方法仅使用由支持向量机......