用页组拓扑平均距离改善页面聚类算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:fjyasp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种支持站点结构优化的页面聚类改进算法,通过引入图论中的拓扑平均距离,量化评估与挖掘站点结构中访问效率较低的内容文档集合为结构优化的兴趣页组,挖掘的页组具有更高的兴趣性,并将兴趣页组挖掘算法融入到拓扑优化算法中。实验结果表明改进算法能更好地优化站点结构,较一般算法收敛性好。
其他文献
形式化方法工具通常是在UNIX/Linux系统下设计开发的,难于使用阻碍了形式化方法的进一步推广。本文针对形式化方法RAISE,提出了一种研究和开发基于Web的工具的方法。该方法以原
同义词和近义词现象以及强关联语义信息加大了文本向量的特征维数,对文本分类的效率和精度都会带来极大影响。为了有效降低文本向量的特征维数,提出一种基于混合并行遗传聚类的
在实际应用中,单个Web服务通常无法满足复杂应用的需求,如何组合已有的服务,从而提供更强大更完整的商业功能已成为此领域的研究热点。然而现行的SOA架构中,Web服务组合方法中很
研究如何实现Logistic回归模型在中文垃圾邮件过滤中的应用,给出了关键技术,并将其应用于SEWM20071)垃圾邮件语料库上,取得了较优的过滤效果。还分析了影响正常邮件误判率、垃
首先定义了变迁耦合网及相关概念,其次揭示了变迁耦合网N中各个分支网的T-不变量同N的T-不变量之间的关系,根据是否与耦合变迁有关,将N的极小T-不变量分为两类MTS1和MTS2,然后给
路由算法对交换网络性能具有很大的影响。本文针对一种新型的大容量路由器交换网络拓扑-XD(Cross-Direct)网络的特点,提出了一类和应用于传统直连网络中的基于简单维序路由算法