【摘 要】
:
近年来,随着Internet的不断发展,Web已经成为人们的重要信息来源,为人们提供了丰富的信息资源。与此同时,它所具有的海量数据、复杂性、极强的动态性和用户的多态性等特点也
论文部分内容阅读
近年来,随着Internet的不断发展,Web已经成为人们的重要信息来源,为人们提供了丰富的信息资源。与此同时,它所具有的海量数据、复杂性、极强的动态性和用户的多态性等特点也给Web资源的发掘造成了相当的难度。因此,将数据挖掘技术和Web结合起来,进行Web数据挖掘也就随之成为了解决Web挖掘问题的重要途径。本文通过对经典的Web结构挖掘算法PageRank的研究学习,集中研究了该算法的形成思路、计算方法,并分析该算法在独立网站、包含索引页面、包含入站链接和出站链接等几种模型下的效果,提出了相应的优化策略。针对PageRank算法中完全只考虑web页面之间的超链接分析而忽略web页面的内容,从而导致分析结果出现主题漂移和种种的不足,提出了一种结合超链接分析和内容相关性分析的关于PageRank的改进算法,该算法通过对不同web页面进行内容分析并赋予链接之间不同的权重来实现对PageRank的改进,并最终通过实验证明该新算法的有效性。最后我们还针对PageRank算法中在对页面节点进行排序时存在将页面权威性与枢纽性完全分开或忽视了页面的枢纽性,造成信息的丢失等问题,通过重新设定PageRank算法中的个性化矢量因子E.探讨建立在此基础上的PageRank算法,并通过实验验证了该算法对该问题的有效性。
其他文献
本课题利用“双滴法”合成镁铝水滑石,并用不同方法将其与数种聚合物复合,制备纳米复合材料。利用XRD分析了水滑石的结构,确认成功制备出了具有典型层状结构的水滑石。对复合
目的分析后循环缺血患者血管结构异常的影像学特点、并依此进行分型,探讨其临床意义。方法临床确诊为后循环缺血患者306例,全部进行MRA检查并对部分患者同时进行DSA检查,对其
目前阶段,我国的城市建设进程在不断加快。因此必须提高对城市规划和土地规划两部分的重视程度,使其能够对我国居民的生活发展起到推动作用。我国现在出台了多项针对国土空间
工作过程系统化的课程建设是以工作过程为主线,将情境教学充分附着在主线上。开发工作过程系统化的课程,通过理论层面的创新实现知识重构,打破传统学科体系的壁垒,使相应知识
为了探讨不同花生品种的感官品质、理化与营养品质、加工品质与其蛋白质凝胶性之间的关系,提出适宜肉制品加工凝胶型蛋白质专用花生品种的主要特性和评价方法,构建适宜加工凝
当前的职业网球技法日益表现出力量化的发展趋势,其中击球的速度与力量成为当前职业网球运动员进军网坛的主要手段。网球运动中的击球力量主要来自于地面,经过力量链条传达到上
本论文主要目的乃针对「从博达公司事件审视台湾之公司治理制度」之相关议题,作进一步之探讨2004年间台湾的博达科技公司突然因为无法偿还到期之可转换公司债,竟于当年6月14
为了探讨包装材料对常温贮藏条件下花生耐贮性的影响,该文研究了常用的3种包装材料下花生色泽、含水率、电导率、发芽率、黄曲霉感染指数、防虫效果的变化规律。结果表明:包
农村图书馆作为公共文化体系中的重要组成部分,存在着地理分布不平衡、建设基础薄弱、资金投入的连续性差、专业管理队伍严重缺乏、管理体制缺失等问题;解决这些问题,需要构
<正> 一、公共服务:城镇化对政府公共管理的内在需求一般而言,政府公共服务,是指在经济社会发展中,政府为履行职责,克服市场失灵,优化资源配置,满足社会公共需要,为企业生产