图模式挖掘在Web链接结构分析中的应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:kelusi09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图模式挖掘是近年来数据挖掘界的一个热点问题,它在很多领域如Web挖掘,分子结构分析,生物信息学等有广阔的应用前景。本文在分析已有基于Apriori的图模式挖掘算法基础上,提出了基于先同分后异构思想的图模式挖掘算法,它有效地提高了图模式挖掘的效率。   为了改善权威资源分析的质量,本文把图模式挖掘理论应用到Web链接结构分析中,提出了基于图模式挖掘的权威资源分析方法,它首先基于RandomWalk聚类思想对搜索引擎搜索结果扩展得到的主题相关页面根据页面间的相似度进行了分组,然后利用频繁结构挖掘思想从每个分组里找出频繁出现的结构,并对这些结构进行一定的筛选,找出最具代表性的结构作为我们所求的权威资源。该方法不必使用内容分析就能改善权威资源分析的质量,减少主题漂移;而且能在发现主流行权威社区的同时,发现次流行社区,减少主题遗失。   最后,基于上面的技术,本文设计和实现了权威资源搜索的原型系统ARSS,它以Java为开发工具,实现了主题相关页面信息的收集,权威资源的分析和表现。它具有良好的用户界面,用户可以输入自己的搜索关键字,选择权威资源分析方法,设置相关参数,系统会自动返回相关的权威资源信息。通过一系列的对比实验,我们表明了系统的有效性。
其他文献
本文首先通过研究信息系统的形成和发展过程,从中分析出信息系统及其研究的发展趋势,然后总结了信息系统开发的三种认知观点,提出了信息系统开发系统的结构模型。然后,从复杂性科
本文以“能力本位”教学模式为理论基础,按照课程调研、职业能力分析、教学实施及教学评价这四个阶段来开展.根据“导游业务”课程的培养目标,构建本门课程的设计思路及教学
本篇论文探讨如何在对等计算网络中支持排序查询(RankedQueries),提出了支持在对等网络中的实现高效的排序查询的全新算法,其目的就在将排序查询这一传统数据库中的查询工具引
Huang在1996年提出了经验模式分解(Empirical ModeDecomposition, EMD)方法。EMD是一种由数据驱动的自适应信号处理方法,适用于非线性非平稳信号的处理。法国学者J. Nunes将一维
防火墙是保障网络安全的重要手段,然而,传统的边界防火墙过分依赖于网络拓扑结构,不能防止内部攻击,并且容易形成访问瓶颈。分布式防火墙是一种新型的防火墙,旨在解决传统边
第三代移动通信系统(3G)的出现使在无线系统中提供各种视频业务成为可能。但由于数据量巨大,原始视频信号必须经过压缩才能在无线网络中传输。ITU-T开发的H.263视频编解码标准
国家“十五”重大科技攻关项目“网络教育关键技术及示范工程”的目标是开发具有我国自主知识产权的网络教育软件系统。为解决该系统中财务活动的自动化,开发网络教育结算系
2007年的年末,笔者来到李中权将军的家中,看望了这位有着70多年党龄的老党员、老红军。他对多次党章修改谈了自己深刻的感受。当我敲门进入李将军家中的时候,李老已是满脸的
传统的关系数据库系统旨在处理永久、稳定的数据,强调数据的完整性与一致性,较少考虑与数据处理相关联的时间限制。实时数据库与其相比有很大的不同,它是数据库和实时系统在
随着各种新型网络的出现,TCP/IP协议已经无法满足这些复杂的网络环境,DTN(Delay Tolerant Network)应运而生,伴随着DTN发展的路由协议和缓存策略也成为最近几年的研究热点。当今主