基于Laplacian图谱的短文本聚类算法

来源 :电子学报 | 被引量 : 0次 | 上传用户:blademan_0617
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出基于词频处理的Laplacian图谱聚类算法,以解决短文本数据维数高、特征稀疏等问题.首先采用词频-逆文本频率指数TF-IDF(Term Frequency-Inverse Document Frequency)方法,将短文本数据集映射到文本向量空间得到词频权值矩阵;其次利用Laplacian矩阵的图谱聚类特性,对词频权值矩阵进行数据降维处理;然后依据Laplacian矩阵的特征值表示文本相似度的特点,选择前K个特征值对应的特征向量作为初始聚类中心,以减少聚类过程的迭代次数.在SSC、20 News
其他文献
3月18日,韓国空军发表调查结果,称当天在江原道春川地区发生的“天弓”中程防空导弹误射事故经查明由维修人员过失酿成。  调查显示,当地时间18日上午10点38分,2名维修人员在执行发射架年检过程中没有遵守线缆插拔程序,导致1枚造价高达15亿韩元(约合人民币890万元)的“天弓”导弹非正常发射。  因没有收到雷达制导信号,这枚导弹在升空约3.5秒后自爆,整个过程未造成人员伤亡。韩国空军表示,此事纯属
期刊
有人机/无人机(MAV/UAV)协同作战正成为各国的研究热点,针对相关领域目前对协同作战效能评估的需求,探讨了一种基于Hopfield网络的有人机/无人机协同作战效能评估的方法。通过分析有人机/无人机协同作战典型模式,综合“观察—判断—决策—行动(OODA)”任务回路,建立了有人机/无人机协同作战效能评估指标体系,将利用可拓层次分析法(EAHP)和模糊评判法得到的评价数据作为离散型Hopfield神经网络(DHNN)的参考标准,依据DHNN的联想记忆功能设计了有人机/无人机协同作战效能评估模型,并进行了仿
针对幅值强、频带宽、持续时间短等脉冲电场测量需求,本文提出一种基于电光聚合物缺陷光子晶体的全介质脉冲电场传感器.在周期性分布的光子晶体中引入电光聚合物作为缺陷层,外界电场的作用下,电光聚合物的折射率发生改变,这将会引起光子晶体的谐振频率偏移,监测谐振频率的变化即可实现被测电场测量.本文通过理论分析与数值模拟光入射角度不同且入射波的偏振状态不同时,光子晶体的结构参数对光子晶体传输光谱特征的影响规律,
红外与可见光图像融合可有效弥补单一传感器的不足,生成视觉效果更好、清晰度更高的融合图像。基于多尺度分解的融合方法在设计融合两幅图像的细节层与基本层的融合规则时,往往仅考虑细节层和基本层中的单尺度信息,易造成融合图像包含的有效特征较少。针对此问题,提出了一种基于随机游走算法的融合规则来融合基本层和细节层,该融合规则从两幅显著图中估计出一幅具有多尺度信息的显著图用于基本层和细节层的融合,可将每层中的多
有 些事出现毫无缘由,但有些事发生,是社会环境孕育的结果,比如去年舆论热议的成都“划拳定赔付”。  “撇托”“和谐”成为此次事件解读的关键词。有四川网民在评论时也讲起了自己的事,“五六年前和妈妈去超市买菜,爸爸在外面等,和别人蹭上了,打了保险电话他俩就在地上用树杈和小石头下五子棋,我们出来的时候已经处理完了。”  这些饱含“感性”、很四川的处事方式,确实游离于当下这个高度强调理性和逻辑的商业社会之
期刊
提出了一种基于气体吸收光谱的新型激光测距技术,将携带气体吸收光谱信息的参考光信号和测量光信号混频,利用傅里叶变换提取光程差,从而得出距离信息。根据推导的测距原理设计了基于激光甲烷遥测仪的测距系统,通过Matlab软件对测距过程进行了仿真分析。仿真结果验证了新型气体激光测距技术的可行性,为开发激光气体雷达指出了有意义的探索方向。
针对机动作战平台天线共享需求,提出了一种面向雷达通信一体化的线阵共享孔径分配方法。首先,建立了共享孔径的模型,根据雷达和通信工作频率差异设计了非均匀线型共享阵列;其次,将阵元位置的分配转化为多目标优化问题,选择雷达阵列方向图的最高旁瓣电平和通信阵元的信道容量作为优化目标;最后,用改进的模拟退火算法进行优化计算,并完成了相关的仿真实验,结果证明,雷达最高峰值旁瓣电平和通信信道容量能同时达到工作要求,实现了天线孔径的共享。
北斗二代民用D2导航电文(BeiDou-Civil Navigation Message-D2, B-CNAV-D2)信息在开放的信道中传输,缺乏完整性保护机制,面临信息被伪造和篡改的威胁,容易遭受欺骗攻击.为了保障B-CNAV-D2信息的完整、真实和可用,本文在分析B-CNAV-D2信息组成结构的基础上,设计了基于身份签名体制的北斗二代民用D2导航电文信息认证协议.该协议提供信息源认证和信息完整性保护,实现B-CNAV-D2信息防篡改和防伪冒的功能.B-CNAV-D2信息认证协议可以有效地减少传统签名认
针对平行分层海域中电偶极子源的定位问题,提出利用三个电场强度传感器同时确定场源位置、场源强度及分界面方位共9个参量的方法 .首先借助镜像法及边界条件推导了三层平行分层海域中电偶极子源在海水中产生电场强度的矩阵表达式,引入场强传递矩阵,然后通过传递矩阵求逆的方法消除电偶极子源的偶极矩参数,得到以电偶极子源位置及分界面方位为未知量的非线性方程组,将待确定的9个未知参数减少为6个待拟合量,并通过拟合的方法得到电偶极子源位置和分界面方位的最优解.最后通过仿真算例检验所提方法的有效性.结果表明,该定位方法在一定条件
为有效抑制雷达波形的脉冲压缩旁瓣水平,提高雷达弱目标检测和成像性能,本文提出了雷达波形和滤波器联合设计抑制脉冲压缩旁瓣水平的方法,建立了雷达波形和滤波器联合设计数学模型,基于分块坐标下降方法分解了联合设计问题,提出了一种联合优化算法,将该方法扩展到了正交波形和滤波器组设计,并提出一种并行优化的联合设计方法 .仿真结果表明,本文方法比传统方法具有更快的运行速度.该方法可有效扩展至正交波形和滤波器组设计问题.