基于图划分的谱聚类算法在文本挖掘中应用

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:csj123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统文本挖掘算法都是建立在凸球形的样本空间上,当样本空间不为凸时,算法就陷入“局部”最优。为了满足“全局”最优,引进了无向图结构表示文档之间的相似关系,由无向图建立文档之间的相邻接矩阵,谱聚类算法是通过对邻接矩阵进行分析,导出聚类对象的新特征,利用新的特征对原数据进行聚类。通过实验对该算法和其他的文本挖掘的算法进行分析比较,实验结果表明该算法聚类效果比传统数据挖掘方法好。最后指出谱聚类的不足和进一步的研究方向。
其他文献
博鳌,一个海滨小城,三水交汇、东临南海。12年前的它还寂寂无闻。今天,博鳌声音,世界倾听;博鳌观点,举足轻重。
性能计算对随机Petri网模型的性能分析具有重要作用。以研究随机Petri网性能计算软件关键技术为主要目的,提出了一种独立于计算(CIM)的性能计算软件体系结构元模型,并以此元模型
由中远太平洋公司、大连港集团和日本邮船株式会社共同出资组建的大连汽车码头,成立十年来,公司码头吞吐量多次实现十万量级的跨越式发展。
文件委员会一直把专家意见和实践知识作为审议、编纂过程中的关键内容,这个原则代代相传,延续至今。
为了降低J2EE的开发复杂度并缩短软件开发周期,设计并实现了一种基于inteUiWeb、Spring和Hibernate(即iSH)的应用框架,该框架在Web层、业务逻辑层和持久层分别引入inteUiWeb、Spr
网络仿真是网络协议设计的重要环节,也是通信网络性能分析的关键。基于C++和Tel脚本语言分裂层次实现的NS-2是一个开源、面向对象设计的多协议网络仿真软件,在网络仿真领域占有十
面对大学化学实验课课时短、任务重、易滋生厌倦心理等现象,文章以武汉轻工大学化学实验课为例,采用设置实用性实验项目,从渐进“引导式”提问入手诱导学生,深入研究实验教材细节
The chemical cellular signaling pathway of phosphatidylinositol-3-kinase(PI3K)is crucial in many aspects of cell growth and survival.Genetic alterations such as
支持向量机(Support Vector Machine,SVM)的参数选择一直缺乏很完善的方法,很大程度上限制了它的应用。为了获得较好的SVM参数,提出了基于佳点集遗传算法的参数选择方法,利用佳点集
卢帕金矿田位于坦桑尼亚西南部,是坦桑尼亚仅次于北部维多利亚湖金矿田的重要产金区。通过在卢帕金矿田东缘已知金矿点及其外围开展地质、物探和化探综合勘查。在东部土壤测