概率潜在语义分析的KNN文本分类算法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:by_huang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的KNN文本算法在计算文本之间的相似度时,只是做简单的概念匹配,没有考虑到训练集与测试集文本中词项携带的语义信息,因此在利用KNN分类器进行文本分类过程中有可能导致语义丢失,分类结果不准确。针对这种情况,提出了一种基于概率潜在主题模型的KNN文本分类算法。该算法预先使用概率主题模型对训练集文本进行文本一主题、主题一词项建模,将文本携带的语义信息映射到主题上的低维空间,把文本相似度用文本一主题、主题一词项的概率分布表示,对低维文本的语义信息利用KNN算法进行文本分类。实验结果表明,在训练较大的训练数据集
其他文献
信用如今已经渗透至社会生活、工作之中,信用评估是金融、通讯等服务行业对消费者个体的重要需求。在分析个人信用影响因素及其相关数据建模基础上,改进了应用Logistic回归建模
人脸检测作为机器视觉研究的重要内容,在视频监控、安防等领域具有广泛的用途,是人脸识别技术的必备条件。针对复杂背景、光照不均匀等外部条件对人脸检测的影响,提出了基于局部二元模式(LBP)和支持向量机(SVM)的人脸检测算法。其中LBP是一种用来描述图像局部纹理特征的算子,具有旋转不变性和灰度不变性等显著的优点,其最主要的属性是对光照变化造成的灰度变化具有很好的鲁棒性。该算法使用LBP提取图像的特征值
小灵通家有两箱质量相同的苹果,小灵通从甲箱中取出7千克,乙箱里又放入19千克,这时乙箱苹果的质量是甲箱苹果的3倍。请问小灵通家原有苹果多少千克?
期刊
小朋友,你在进行简便运算时,是不是感觉乘法分配律特别容易出错?这是因为五大基本运算定律中,只有乘法分配律包含了两种运算,左右两边在形式上有很大不同,两边的运算顺序和运
《聊斋志异》中的每一个情节都反映了特定的心理诉求,准确把握其中的心理诉求是解读小说文本的有效途径。《阿宝》篇中孙子楚枝指死亡情节是从众与取悦的心理追求;离魂情节是痴
针对多帧视频序列图像超分辨率重建问题中图像序列的像素相关性,建立了一种有效的视频图像超分辨率重建数学模型,将视频超分辨率重建问题转化为从低分辨率图像像素序列到高分辨率图像像素序列的寻优问题。针对基本粒子群(PSO)算法的缺陷,将遗传原理及蚁群机制引入PSO,提出了一种改进的MPSO算法。结合视频序列超分辨率重建问题特性,图像/视频可以表示为粒子像素序列,并且相邻视频帧之间序列具有规则性、相关性以及
将网络化控制引入传统的直线电机控制系统,充分发挥网络化控制的共享信息资源、减少系统布线、增加系统的灵活性和可靠性等优势,发展一种新型的网络化直线电机迭代学习控制模式
通过分析研究发现D.L.Donoho提出的小波阈值去噪方法,以及文中提及的已构造出的小波阈值函数在图像去噪方面仍存在问题。为了进一步改善这些问题,综合典型的小波阈值函数的优
从一副扑克牌中抽出10张,使它们的点数分别是A、2、3、4、5、6、7、8、9、10,其中A看成1点,能不能把这10张牌排成一个长方形,使它的一组对边上各有4张牌,另外一组对边上各有3
核心部门使用的基于物联网的高性能计算机,需要在电磁干扰下,特别是在抗高功率微波作用环境下仍能正常工作。从抗高功率微波的需求出发,从信号滤波设计、信号光电转换设计和板卡设计着手,详细介绍了通信计算机关键电路设计,包括物联网层次结构、高功率微波工作原理、部分光电转换设计、电源的滤波设计以及微波实验。通信计算机通过供电输入设计、自研主板等关键板卡设计,包含直流滤波功能、功率变换电路和无联网关键部件的设计