基于Hadoop平台的HITS算法

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:cnjhhzy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对Hadoop平台进行了分析研究后,与HITS算法的设计理论和技术相结合,对基于中文词汇网络的HITS算法进行了重新设计,使其符合Hadoop平台的框架,详细分析了Map/Reduce函数的设计方案.用测试数据在不同集群上做实验,实验结果证明,HITS算法在分布式环境下能很好的运行,集群的优越性明显.
其他文献
无线传感器网络正常节点之间的对偶密钥有可能受损,攻击者将误用受损密钥伪造信息数据包,破坏正常通信或消耗节点有限的资源。针对这一问题,提出一种对偶密钥误用检测算法。在每
随着高校的不断扩招和合并,由于教学资源的有限,合理的安排教学计划已经成为一个日益严峻的问题排课以及教室的合理利用已经成为教学计划管理的一项重要工作.本文通过对遗传算法
为应对大量用户同时访问网络广播流媒体服务的需求,流媒体发布系统至关重要.结合网络广播系统的特点,设计并实现了一套用于网络广播的流媒体发布系统,该系统分为媒体流的Relay和
链式虚拟磁盘快照技术是广泛实现的一种支持虚拟机失效恢复的技术手段,针对链式结构磁盘快照技术引入多余I/O请求导致虚拟机性能低效问题,分析和研究了支持高效虚拟机快照实现的
根据用户对视频内容的个性化偏好,提出结合语义事件与精彩度的视频内容分级方法,构建时域内基于多粒度语义内容的统一丢帧模型,在 RTP/RTSP 流媒体服务器中基于语义丢帧算法设计
OpenFlow是为支持互联网创新研究而提出的基于流分类的新型网络试验技术,以OpenFlow为研究对象,在mininet测试平台下,利用OpenvSwitch交换机搭建虚拟交换试验网络模型,并进行了简
农民工医疗健康问题是政府长期关注的难题之一,农民工医疗健康信息分析系统旨在对农民工医疗健康信息数据进行统计与挖掘,辅助政府决策.基于数据仓库中的维度建模理论,结合农民工
针对目前农资市场的不规范问题导致的假劣农资损害农民利益的现象,建立一套农资产品溯源服务系统对于促进农业生产和增加农民收入具有重要的现实意义.农资溯源涉及到生产、物流、仓储、批发和零售等多个环节.如何协调整合各个环节的信息流是实现农资溯源服务的必要条件.近年物联网技术受到社会各界的广泛关注,在行业信息化、城市安防等都有实际应用.对实际应用于农资产品溯源服务系统的物联网技术进行了探讨.通过对物联网相关
本文以加快嵌入式数据库SQLite的数据查询速度为出发点,提出了一种在原有SQLite的B+树索引机制的基础上改进的新索引机制,在对嵌入式内存资源影响不大的前提下提高了SQLite的查
为满足石油工业上游勘探开发业务研究和方案设计对数据的特殊需求,采用多数据源集成技术、数据分类与搜索技术、系统服务功能定制技术、数据使用授权与安全控制等技术,实现了对