基于优化密度的耦合空间LDA文本聚类算法研究

来源 :计算机应用研究 | 被引量 : 20次 | 上传用户:ankang1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的空间向量模型在进行文本表示时计算相似度仅采用词频统计来表示文本以及对高维文本数据聚类效果有所下降等问题,提出一种基于优化密度的耦合空间LDA文本聚类算法。该算法利用提出的耦合空间模型和LDA主题模型线性融合计算文本相似度,并对阈值敏感问题进行优化,确定不同密度区域对应的阈值半径。实验结果表明,与改进的DBSCAN文本聚类算法和R-DBSCAN文本聚类算法相比,该算法的文本聚类精度更高、聚类效果更优。
其他文献
在2005-2007年的早春季节,笔者诊治6起鸭传染性鼻炎病例,其中育成鸭4起,产蛋鸭2起。现将诊治经过介绍如下。
为实现计算机与智能手机之间的数据通信,提出了一种利用智能手机作为发送端、光学鼠标作为接收端的可见光通信链路.光学鼠标可以看成一个集成了图像处理单元的光学传感器,它
为了兼顾高速铁路的速度优势和旅客出行的方便,从列车停站数量的均衡性和区间的可达性出发,建立高速铁路列车停站方案的非线性多目标优化模型。结合模型的特点,设计了具有自适应
针对当前压缩感知重构算法存在重构质量偏低、重构时间过长等问题,提出了基于矩阵流形分离字典构造的分块压缩感知重构算法。首先,该算法基于矩阵流形模型训练出可分离稀疏表示矩阵,并对其正交化;其次,构造随机测量矩阵,并利用矩阵运算将其与得到的稀疏表示矩阵进行结合,进而构造出一组分离字典;最后,将该字典用于信号压缩感知中,并通过线性运算实现信号的快速重构。实验结果表明,与当前主流的压缩感知重构算法相比,所提
针对认知无线电网络(CRN)通信可能会因为恶意次级用户(SU)的存在或信道损伤而遭到破坏等问题,提出了一种广义鲁棒的协作频谱感知(CSS)框架,频谱感知和恶意用户识别问题联合构成一种优化问题。提出的方案通过利用节点位置信息获得了性能的提升,利用在线异常感进行实时识别和跟踪,不仅能识别恶意用户和频谱机会,而且能处理不准确或丢失的距离测量和噪声SU报告。仿真实验使用蜂窝场景,在一个特定半径内包含一个主
针对经典的基于L1数据保真项的总变分图像复原模型易导致阶梯效应和损失图像重要细节的缺陷,提出了一种基于L1数据保真项的二阶总广义变分(total generalized variation,TGV)图像复原模型。为进一步提升含脉冲噪声模糊图像复原质量,在二阶TGV图像复原模型中引入边缘检测算子,使其在图像边缘区域减弱扩散,较好地保护图像边缘特征;在图像平滑区域增强扩散,有效地消除脉冲噪声和抑制阶梯
为了解决现有的远程证明方案对于多个安全组件同时证明时效率不高的问题,提出了一个基于多组件签名的远程证明方案,提供了使用属性签名来构造远程证明协议的思路。这种远程证明方案利用属性密码的签名协议进行构造,能够同时使用多个组件对消息进行签名,结合了属性密码学中的属性签名匿名性的特点,可以更好地保护证明平台的配置信息。对于具有不同安全性要求的消息有相应的签名组件,实现了动态证明。实现的原型系统表明,该方案
模指数运算是公钥密码体制中的基本运算,但造价昂贵。可验证外包计算将用户的计算代价转移给服务器,能大大提高用户的计算效率,且能有效验证服务器的计算结果。针对多个模指数运算的外包方案进行了研究,利用指数之间的相互隐藏,提出了新的两个模指数运算外包方案,并推广到多个模指数运算。方案基于两个服务器,实现了模指数运算底数和指数的隐私性,并且用户的可验证概率接近于1。与已有方案相比,所提方案同时提高了用户的计
针对异构网络切换算法判决不准确引起的乒乓效应问题进行了分析和研究,提出了一种基于差值门限比率和改进灰色关联分析相结合的异构网络切换算法。该算法首先采用差值门限比率进行预判决,初步确定网络是否切换;再利用改进灰色关联分析算法选取目标切换网络,从而决定是否切换网络。为了检验该算法性能,搭建了WLAN和UMTS融合的异构网络环境,采用MATLAB、OPNET等仿真工具,从网络切换次数和网络切换失败率两方
针对现有二进制测量矩阵重构性能和硬件实现的负相关性,提出了一种新型压缩感知二进制测量矩阵——伪随机块对角矩阵(PRBD)。PRBD矩阵使用平衡正交Gold序列、块对角矩阵和降采样矩阵,通过结构化的方法构造,不仅保留了确定性矩阵易于硬件实现和计算复杂度低的优点,而且有利于贪婪追踪算法进行图像重构。实验结果表明,PRBD测量矩阵具有良好的重构性能,在峰值信噪比(PSNR)的指标上比常用的二进制测量矩阵