一种杂交算法在Web文档聚类中的研究

来源 :全国第五次程序设计语言发展与教学学术会议、第三届全国Web信息系统及其应用学术会议暨全国首届语义Web与本体论学术研讨会 | 被引量 : 0次 | 上传用户:yibola2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对K均值(K-means)聚类算法在Web文档聚类全局优化中的不足,提出了基于粒子群的K均值(PSO-KM)聚类算法.粒子群优化算法(PSO)是一种基于群智能的演化计算技术,有很强的全局搜索能力.文中采用F-measure和熵作为评价聚类质量的标准,把网上搜索到的真实Web文档作为实验数据对这种杂交算法进行了仿真试验.通过与K-means算法及基于基因算法的K均值(GA-KM)聚类算法的结果比较,可以看出PSO-KM聚类算法对Web文档的聚类质量优于其它两种算法,同时PSO-KM聚类算法的运算速度优于GA-KM算法.
其他文献
用含水有机物作溶剂以高收率合成了烯丙基甲酚醚,再经重排反应制备了优质的液体烯丙基甲酚产品.分析了此合成法的特点;表征和测试了产品结构和性能;初步试验了与双马来酰亚胺
采用硅氮烷前驱体和填料利用反应浇注的方法制备陶瓷材料.对硅氮烷前驱体的组成、结构和陶瓷产率进行了表征,测定了硅氮烷前驱体的固化温度.利用三点弯曲方法测定了制备的陶
对QY8911-Ⅱ改性双马来酰亚胺树脂的固化反应进行了分析,通过T-Φ外推法分别得到其凝胶化温度、固化温度、后处理温度;采用差示扫描量热(DSC)法研究了该树脂体系的固化反应动
会议
该文使用无监督的办法对信息抽取任务中句子实体关系进行提取并标注.首先把句子中实体对的上下文特征表示为向量空间模型中的向量,然后对这些特征按其信息墒的大小排序,在由
目的:探讨帕利哌酮缓释片治疗儿童期首发精神分裂症患者临床疗效及安全性。方法:对37例儿童期首发精神分裂症患者应用帕利哌酮缓释片治疗,观察6个月。采用阳性与阴性症状量表
本文在研究了经典的向量空间模型(VSM)及网页分类模型的基础上,提出了一种基于向量空间模型的多层次网页分类方法.该方法用主题词向量、修正主题词向量和主题概念向量从三个
目前大多数新闻搜索都是通过目前大多数新闻搜索都是通过关键字进行查询,检索到的信息量非常庞大,而且不能反映用户的个性化要求.本文的新闻服务系统引入了个性化服务和上下
目的:探讨帕利哌酮缓释片与利培酮治疗精神分裂症在疗效、耐受性、改善生活质量及社会功能方面的差异.方法:符合入组标准的精神分裂症患者被随机分为研究组(n=48)和对照组(n=
本体是语义Web中知识表示的核心模型,它可以更好地对Web信息进行表达,收集以及交互.在浏览器上实现本体的构建和编辑使得本体技术可以面向小型的用户,从而有助于语义Web技术
通过大量的举例说明在新的教学中,更需要类比法,而且还能取得良好的效果.