基于图划分的谱聚类算法在文本挖掘中应用

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户：csj123

【摘要】

：

传统文本挖掘算法都是建立在凸球形的样本空间上，当样本空间不为凸时，算法就陷入“局部”最优。为了满足“全局”最优，引进了无向图结构表示文档之间的相似关系，由无向图建立文档

【作者】

：

沈亚田沈夏炯张磊

【机构】

：

河南大学计算机与信息工程学院

【出处】

：

计算机技术与发展

【发表日期】

：

2009年5期

【关键词】

：

谱聚类邻接矩阵文本挖掘正则割 Laplancian矩阵 spectral cluster adjacent matrix text mining n

【基金项目】

：

河南省自然科学基金项目（0311011700）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

传统文本挖掘算法都是建立在凸球形的样本空间上，当样本空间不为凸时，算法就陷入“局部”最优。为了满足“全局”最优，引进了无向图结构表示文档之间的相似关系，由无向图建立文档之间的相邻接矩阵，谱聚类算法是通过对邻接矩阵进行分析，导出聚类对象的新特征，利用新的特征对原数据进行聚类。通过实验对该算法和其他的文本挖掘的算法进行分析比较，实验结果表明该算法聚类效果比传统数据挖掘方法好。最后指出谱聚类的不足和进一步的研究方向。

其他文献

博鳌听涛——把脉亚洲发展推动世界繁荣博鳌亚洲论坛2013年年会综述

博鳌，一个海滨小城，三水交汇、东临南海。12年前的它还寂寂无闻。今天，博鳌声音，世界倾听；博鳌观点，举足轻重。

期刊

博鳌亚洲论坛中国经济发展可持续发展

随机Petri网性能计算软件关键技术的研究

性能计算对随机Petri网模型的性能分析具有重要作用。以研究随机Petri网性能计算软件关键技术为主要目的，提出了一种独立于计算（CIM）的性能计算软件体系结构元模型，并以此元模型

期刊

随机PETRI网元模型马尔可夫链软件体系结构电子农务stochastic petri net metamodel Markovchain sof

从一湾小渔村到现代汽车大港

由中远太平洋公司、大连港集团和日本邮船株式会社共同出资组建的大连汽车码头，成立十年来，公司码头吞吐量多次实现十万量级的跨越式发展。

期刊

现代汽车跨越式发展株式会社日本邮船大连港太平洋吞吐量码头

BIMCO文件的百年变迁

文件委员会一直把专家意见和实践知识作为审议、编纂过程中的关键内容，这个原则代代相传，延续至今。

期刊

文件变迁专家意见委员会

一种基于iSH的应用框架设计及实现

为了降低J2EE的开发复杂度并缩短软件开发周期，设计并实现了一种基于inteUiWeb、Spring和Hibernate（即iSH）的应用框架，该框架在Web层、业务逻辑层和持久层分别引入inteUiWeb、Spr

期刊

应用框架intelliWebSPRINGHIBEMATEJ2EEapplication framework intelliWeb Spring

基于NS-2网络仿真协议的功能扩展

网络仿真是网络协议设计的重要环节，也是通信网络性能分析的关键。基于C＋＋和Tel脚本语言分裂层次实现的NS-2是一个开源、面向对象设计的多协议网络仿真软件，在网络仿真领域占有十

期刊

NS-2C++TCLSFQDropTail网络仿真协议NS-2C＋＋ TclSFQDropTailnetwurk simulation

大学化学实验课教学方法的探索与实践

面对大学化学实验课课时短、任务重、易滋生厌倦心理等现象，文章以武汉轻工大学化学实验课为例，采用设置实用性实验项目，从渐进“引导式”提问入手诱导学生，深入研究实验教材细节

期刊

大学化学实验课教学方法探索与实践university chemical experimental teaching method explorat

Synthesis of 1,2-Diphenyliminoethanols and the Evaluation of Their Possible Biological Activity

The chemical cellular signaling pathway of phosphatidylinositol-3-kinase(PI3K)is crucial in many aspects of cell growth and survival.Genetic alterations such as

期刊

BENZOINSchiffbases12-diphenyliminoethanol

基于佳点集遗传算法的支持向量机的参数选择

支持向量机（Support Vector Machine，SVM）的参数选择一直缺乏很完善的方法，很大程度上限制了它的应用。为了获得较好的SVM参数，提出了基于佳点集遗传算法的参数选择方法，利用佳点集

期刊

支持向量机参数选择方法遗传算法佳点集遗传算法support vector machineparameter selection algorithm

地物化综合方法在坦桑尼亚卢帕金矿田东缘找矿中的应用

卢帕金矿田位于坦桑尼亚西南部,是坦桑尼亚仅次于北部维多利亚湖金矿田的重要产金区。通过在卢帕金矿田东缘已知金矿点及其外围开展地质、物探和化探综合勘查。在东部土壤测

期刊

金矿化探异常物探异常卢帕金矿田坦桑尼亚gold depositgeophysical anomalygeochemical anomalyLup

基于图划分的谱聚类算法在文本挖掘中应用

与本文相关的学术论文