基于GA与PSO混合优化的Web文档聚类算法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:airbter
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web文档聚类是web数据挖掘的重要任务之一,针对Web文档向量空间的高维性与数据聚类问题的最优化性质,采用LDA对文档向量空间进行降维,提出运用混合优化算法GA_PSO在此低维空间进行寻优,来发现Web文档集的最优簇结构.通过在真实数据集20Newsgroups的实验,结果表明我们的方法具有良好的聚类有效性,能较完全和准确地将主题相关的Web文档聚成一类.
其他文献
移动P2P具有一些良好的特点,但是由于移动设备之间的多维异构,设备具有较低的带宽,较高的数据传输代价,加之资源分布的任意性,使得基于MP2P的数据存储和传输受到了极大的限制
本文通过采用预测方法及其原理,对驻马店市农村公路建设情况的预测和驻马店农村公路建设的经济社会效益进行了预测,提出了提高驻马店农村公路建设的经济社会效益的对策。 Th
将ITIL思想及其标准化流程运用于IT运维,是IT管理的理想目标和战略方向。本文介绍了某电力公司信息运维综合监管系统的构建及应用情况,分析了企业在建设ITIL的过程中,需要注
单纯的音乐课已适应不了新课改环境下的教学要求,在音乐课上改变听唱的传统教学方法势在必行,音乐课中舞蹈教学的融人恰恰解决了这个问题.因此,在音乐课中加强音乐与舞蹈的结
目的:探讨超声对结节性硬化的诊断价值。方法回顾性分析8例结节性硬化患者的临床及辅助检查资料,对病变特点进行总结。结果8例患者中合并双肾平滑肌脂肪瘤3例,合并肝脏及左肾平
目的 了解小儿肺炎支原体(MP)肺炎的临床特点,提高其诊断与治疗水平.方法 对我院2007年10月至2010年5月间38例确诊为MP肺炎病例进行临床分析.结果 发病年龄多为学龄儿童,6~13
研究有不等式约束的非线性规划问题,构造了一种新的两阶段算法:(1)利用传统优化方法求出原问题的一个局部极小点x*;(2)基于当前局部极小点和“准”罚函数的思想构造了一个辅
为了更准确的仿真五轴数控机床各运动轴的运动情况,提出一种开放式数控系统刀具运动轨迹验证方法.本方法从运动控制组件中采集运动控制数据,利用五轴机床机构运动学模型,将运
在基于服务质量(QoS)的Web服务组合中,提出一种采用路径模板编码机制的遗传算法来解决多路径全局优化问题.该方法首先在服务依赖图中基于语义匹配度约束获得多路径子图,并通
分布式实时事务调度协议用于实现事务间读写的并发控制,以满足事务的一致性与隔离性要求.本文改进了动态调整时间间隔的乐观并发控制协议,提出了一种分布式实时事务调度协议D