短文本数据的自动分类

来源 :电脑与信息技术 | 被引量 : 0次 | 上传用户:sky_fly_sk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以比较购物搜索中的商品数据自动分类为应用背景,探讨短文本数据的分类问题,比较了常用的文本分类(Text Categorization)算法的特点,在此基础上提出k—NN与NB相结合的多分类器方案,对于NB算法分类不可信的情况下改用k—NN算法进行再次分类,并充分利用NB的中间结果供k—NN剪枝时作参考。实验数据表明该方法在与NB相近的时间复杂度下可明显地提高短文本分类的正确率和召回率,达到实际应用的要求。
其他文献
我与陈忠实的私交一直很好,我敬重他的文章,他看重我的书法(陈老师的书法也很好,尽管他常说他的书法是"用毛笔写成的字");我喜欢吃陕北饭,他也喜欢,于是便经常在这些饭馆碰面
对基于相移光栅中交叉相位调制的全光逻辑门的理论进行了研究.研究了器件的开关特性,利用泵浦光来控制弱连续波的输出切换,实现了将泵的光信息传输到连续光上.通过改变两个泵
根据学生的“最近发展区”,精心设计学习任务,可以促进深度学习的产生。基于此认识,以《蜜蜂》一课为例,教师在设计教学环节时,充分依据文体特点,着力体现关键学习任务的开放