特征加权的CLSVSM

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:wosee_2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
运用空间向量对文本信息进行合理且有效的表示对文本聚类以及检索的结果有较大影响。共现潜在语义向量空间模型(CLSVSM)深度挖掘了文本特征词之间的共现潜在语义信息并且提升了文本聚类的性能。本文在CLSVSM基础上先引入特征词词频信息,再将引入的词频作为权重赋予CLSVSM的共现强度,最终构建特征加权的CLSVSM。特征加权的CLSVSM在中文数据上的聚类效果如下:在F值方面,相比CLSVSM和Word2vec文本模型分别提高将近2.4%、5.2%,在熵值上相比90%CLSVSM_K和Word2vec文本模型
其他文献
地方高校音乐学专业是培养应用型音乐教育人才的重要载体。南疆某高校音乐学专业立足应用型人才培养要求,积极开展“音乐教学论”课程教学模式改革,通过准确定位课程教学目标
深度信息已被证明在显著性物体检测中是一个实用信息,但是深度信息和RGB信息如何更好地实现互补从而达到更高的性能仍是一个值得探究的事情。为此,本文提出一种基于深度图像增益的RGB-D显著性物体检测方法。在双分支的网络结构中增加一个增益子网,采用显著图作差的方法获得深度图片为显著性检测带来的增益,作为增益子网预训练的伪GT。三分支网络分别获取RGB特征、深度特征和深度增益信息,最终将三分支的特征进行融
文本信息的合理表示对文本主题聚类及检索有重要作用。针对文本表示模型维度较高的问题,基于共现潜在语义向量空间模型(CLSVSM)研究惩罚性矩阵分解(PMD),利用PMD对向量进行稀
深度学习是机器学习领域的一个重要分支,近年来在诸多领域取得突破性进展。对利用深度学习改进传统聚类算法,解决高维数据聚类问题开展了大量工作。对近几年深度聚类的研究进
随着我国计算机信息技术的高速发展,网络舆情系统在互联网领域中得到了越来越多的关注,但是我国的网络舆情管理工作仍然存在着诸多问题,其中最为集中的问题体现在反应机制的不完善。鉴于此,本文首先描述Floyd算法的内涵,阐述Floyd算法的运算步骤,提出基于Floyd改进算法的控制策略,同时分析Floyd改进算法在网络舆情中的应用与模型,重点探讨影响网络舆情监测技术的3个因素。最后以人民网和正义网正式发表
已有的变长模体发现算法存在速度慢、可扩展性较差,且结果中包含过短、过长和平凡匹配等无意义模体的问题。本文提出一种基于Matrix Profile的时间序列变长模体挖掘算法。该
基于微信公众平台为广东IT网设计开发一个微信公众号,为广东用户建立一个全方位、立体化的IT信息服务平台,同时提高IT行业信息服务平台的关注度。广东IT网微信公众号的开发,
Docker是一种面向云平台的虚拟化技术。作为容器技术的典型代表,Docker解决了传统虚拟化技术存在的诸多问题,以一种轻量化的方式管理资源,达到资源的最大化利用。对Docker技
具有重复感染可能性的传染病由于不受抗体或疫苗等手段的阻碍,其传播范围会比普通传染病更加广泛,严重危害人类的身心健康,影响社会的和谐稳定,有必要对其传播规律进行探究,
为解决传统社区发现算法难适用于大型复杂异质的移动网络的问题,利用移动网络使用详单数据(Usage Detail Record,UDR)和移动用户社交数据构建网络模型,提出一种融合多维信息