重点学科网格中资源聚合机制的研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:luluwm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,对于Internet上零散分布的海量学科资源,缺乏一种方法对它们进行有效的聚合。搜索引擎在底层使用爬虫技术发现了大量的Web资源,但是无法揭示出资源之间的联系并对资源的质量进行评价;传统的信息发布门户可以通过人工分类的方法聚合Internet上的部分资源,但是其效率低,维护成本高。为了解决上述问题,重点学科网格资源聚合系统NKDG_RAS(National Key Discipline Grid Resource Aggregation System)提供了一种基于网格和Web 2.0的资源聚合平台,并以此为基础,通过用户的社会性贡献和协同过滤实现了资源聚合的目的。NKDG_RAS系统在结构上可以分为三层:信息层获取分散在Internet上的单个资源,包含了分布式RSS爬虫服务用于抓取以结构化数据形式发布的学科资源,基于Web的文献信息抽取服务用于获取以半结构化数据形式出现的文献元数据,用户贡献策略用于收集以无结构化数据形式存在的Web页面;汇聚层构建在信息层之上,其中的标签服务通过标签关联度算法揭示了资源之间的联系,资源推荐服务通过基于用户兴趣和资源质量的推荐算法帮助用户迅速发现可能与自己需求相吻合的最新资源,资源导入服务使用户能够将其它平台和应用上的数据导入至重点学科网格中,重复资源探测服务帮助用户发现与自己收藏了相同资源的其他用户;应用层是最上层,通过可扩展的国际化机制实现了对多语言的支持,RSS订阅服务为其它应用提供了重点学科网格中资源的mashup。采用PHP语言和JAVA语言实现了NKDG_RAS系统,并对系统进行了测试分析。功能测试结果表明系统的功能完备,各项服务工作正常;性能分析主要对比了改进前后的RSS爬虫服务和基于Web的文献信息抽取服务。性能测试结果表明,当RSS爬虫服务从中心服务器中分离出去之后,系统支持的并发用户数增加了50%,服务响应时间减少了51.08%。当基于Web的文献信息抽取服务增加缓存机制之后,且命中率为0.5时,服务响应时间减少了42.63%。
其他文献
云计算技术在近几年越来越成熟,越来越多的数据密集型信息中心部署了自己的云。为了满足现在社会大众对于计算能力、存储空间以及相关计算服务的复杂多变的需求,云计算技术很
随着计算机和网络技术的普及和应用,计算机安全变得越来越重要。入侵检测是计算机安全体系结构中的一个重要的组成部分,但面对日益更新的网络环境和层出不穷的攻击方法,传统构建
纹理合成有着非常广阔的应用背景,比如在布料产品、软体家具包装、各种台面纹理、汽车内饰等产品表面设计的过程中,以及影视特效制作、电子游戏等行业,都需要对大量的表面纹
计算机病毒出现以来,已对个人计算机系统及网络安全造成了巨大危害。随着计算机应用范围的进一步扩大,计算机病毒数量急增,并一直处于不断进化和高速发展的过程。目前,大多数反病
滑模控制作为一种非线性控制,与常规控制的根本区别在于控制的不连续性。它利用一种特殊的控制方式,强迫系统的状态变量沿着人为规定的相轨迹滑到期望点。由于给定的相轨迹与
集群系统以其卓越的性价比、良好的可扩展性、高可用性和可兼容性,逐步成为当今计算机体系结构和并行处理研究的热点。尤其是在金融领域内,还广泛存在着计算节点资源利用率低、
最优化(Optimization)是运筹学的一个重要的分支,它研究决策问题的最佳选择之特性,构造寻求最佳解的计算方法,研究这些计算方法的理论性质及实际计算表现。最优化问题可以简单的
随着互联网的广泛应用,人们对互联网的要求越来越高。传统的网络分布模型已经不能满足网络用户日益提高的需求,因此,Web Services(Web服务)应运而生。Web Services与传统的网络
分形图像压缩编码是一种具有高压缩比的新型图像压缩编码方法。这种方法利用了图像的自相似性对图像进行压缩。分形图像压缩编码的数学基础是迭代函数系统(IFS)、拼贴定理,其
随着对垃圾邮件过滤的各种技术和算法的不断发展,大部分基于机器学习的文本分类算法在实际使用中取得了较好的效果,但由于采用了文本分类中的一些算法,大部分算法都要求在应用前