Web结构挖掘相关论文
Web商业化至今,搜索引擎始终是网络上被使用最多的服务项目.然而,随着网上内容的爆炸式增长和内容形式花样的不断翻新,传统的搜索......
今天,人们寻找WWW上的信息,通常是在搜索引擎上执行一个查询。很多搜索引擎是基于关键词的,对于每一个查询,他们返回一个与查询内容匹......
企业在Portal上发布与企业相关的信息,使得浏览者迅速找到他所需要的内容。由于Internet的规模与使用的持续增长,大多数的Web结构非......
Web挖掘是传统的数据挖掘理论在Web中的应用,其涉及多学科领域的知识,如计算机网络、数学、人工智能等,是一个交叉性的研究领域。W......
SNS (Social Network Site),即社交网站。近几年,网络上掀起了一股社交网站的风潮,由于国内社交网站发展较晚,是借鉴外国Facebook......
学位
分析了Web结构挖掘算法PageRank和HITS,并对二者进行了比较,指出它们所存在的问题,提出了一种PageRank的改进算法。
This paper a......
介绍了Web数据挖掘技术以及图书馆虚拟馆藏建设的概念,从Web内容挖掘、Web结构挖掘、Web用法挖掘3个方面论述Web数据挖掘的流程......
PageRank算法是搜索引擎用于标识网页的等级/重要性的一种方法,但是在实际的应用中,发现它还是存在一定的缺陷.本文提出一种在网页......
基于Web技术的数据挖掘已经成为当前挖掘技术中的重点,这意味着传统基于数据库的应用,已经无法适应时代的发展,本文针对Web数据挖......
信息的网络化给广大用户带来方便的同时,由于其面向对象的广泛化,网络上存储的信息庞大而纷繁复杂,这样就给使用者获取有用信息带......
随着Internet的迅猛发展,Web成为了人们获取信息的重要途径。但是,网页数量的与日剧增,信息量的爆炸式增长,也为人们的信息查询带......
因特网技术的发展和普及使得信息的发布和获取的方式发生了根本性的变化,Web成为了当前信息传播的主要载体之一.如何在Web这个全球......
摘要: 随着互联网的迅猛发展,web上的信息飞速增长,如何从大量的数据集合中抽取有用的信息,找到有效的数据管理和使用的平台,合理的组织......
本文介绍了Web结构挖掘的基本概念,分析了HITS和PageRank算法,并对这两种算法进行了比较,最后探讨了基于这两种算法的改进算法.......
本文首先介绍了Web结构挖掘技术在Web中的应用,其次陈述了Web结构挖掘技术中的经典链接分析算法PageRank,最后分析了PageRank在网......
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息.Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数......
本文从Web数据挖掘的概念入手,介绍了Web挖掘的一般流程,重点阐述了Web挖掘任务的三种分类:Web内容挖掘、Web结构挖掘和Web使用挖......
Web的出现,将海量、异构、动态数据处理这样一个新的课题摆在人们的面前。Web数据挖掘是将数据挖掘技术和Web结合起来,本文主要从Web......
Web数据挖掘是目前数据挖掘领域中一个很重要的研究领域,文章首先介绍了Web数据挖掘的几个分类,分析了Web数据挖掘所面临的问题,最后......
随着网络和数据挖掘技术的发展,Web数据挖掘得到了较多的研究。文章从Web结构挖掘的角度出发,在分析传统的HITS(Hyperlink—Induced T......
基于Web的数据挖掘是一个结合了数据挖掘和WWW的热门研究课题.本文介绍了Web数据的特点及Web数据挖掘研究的三种分类:Web内容挖掘......
在分析Web结构挖掘现有算法的基础上,重点研究了HITS(Hyperlink-Induced Topic Search)算法.Hub页面的多主题性、无关页面和无关链......
在信息化时代,用户访问网站一般都带有针对性与目的性,电子商务网站可以通过对用户访问的数据进行分析,从而发现潜在的客户并且了......
摘要: 在研究Web结构挖掘经典算法Pagerank和云计算关键技术Mapreduce的基础上,将Pagerank算法与Mapreduce编程模型结合,针对基于并行......
介绍了搜索引擎和Web结构挖掘的相关知识,重点研究Web结构挖掘的PageRank算法以及它在搜索引擎中的应用。在基于Web页面相似度的基......
在分析网络有向图的总体结构以及导航页面、目标页面和网络功能的基础上,研究了结构挖掘算法。针对Hub页面的多主题性、无关页面和......
随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为国内外研究的热点。基于Web结构挖掘中HITS算法......
Web站点是由许多Web页面构成的信息系统,随着网络的飞速发展,Web挖掘得到了越来越多的研究。如何从Web中找到与用户查询主题相关的......
随着网络信息资源的爆发式增长,现有的搜索引擎已经无法满足迅速获取准确信息的需要,为搜索引擎引入搜索内容更为精确的主题爬虫显得......
针对Web结构挖掘算法容易出现“主题漂移”以及主机间的多重互相加强关系的问题,提出了一种基于最大流与页面相似度值的超链接结构......
Internet的发展给传统的数据挖掘领域提出了很多新的研究课题.Web挖掘技术就是传统的数据挖掘技术与计算机网络技术的结合.Web使用记......
本文从Web数据挖掘的概念入手,介绍了Web挖掘的一般流程,重点阐述了Web挖掘任务的三种分类:Web内容挖掘、Web结构挖掘和Web使用挖掘......
随着因特网的发展,其性质发生了根本性的变化,Web已经成为人类社会的公共信息资源.在因特网给人类带来前所未有的信息机遇的同时,......
当前网络发展迅速,各种网站比比皆是,它容纳了海量的信息,但是这么多的信息,却使人们产生了信息贫乏的感觉,这是因为Web上的信息覆盖面......
分析了Google的PageRank(PR值)算法原理,详细论述了网站链接的3个主要方面:出站链接、入站链接、站内链接的变化对网站PR值的影响,并......
博客(Blog)网站作为近年来新型的网络媒体得到越来越多的个人和企业的关注,因此针对Blog数据设计了相应的数据分析系统.并介绍了Blog数......
Web结构挖掘是对Web的链接结构进行分析。该文概述Web结构挖掘技术。列举其常见算法。并对PageRank和HITS这两种最重要的Web结构挖......
随着Intemet/Web技术的快速普及和迅猛发展,各种信息可以以非常低的成本在网络上获得。如何在这些信息中找到用户真正需要的内容,成为......
在调研近十余年国内外链接分析研究的相关文献的基础上,归纳了链接分析研究的四大视角,即网络计量学视角、检索优化视角、Web结构挖......
本文以Web为研究对象,着手数据挖掘技术在Web中的应用分析。文中通过对Web特点的分析,以及Web挖掘的分类研究,阐述了Web内容挖掘、......
该文讨论了用自组织映射进行Web结构挖掘的基本方法,用SOM可直观地表示数据的相似性和进行分类,还可方便地进行数据聚簇分析,并可在We......
社区的存在是互联网的一个重要特性;结合链接分析和社区发现的知识,提出了一种搜索引擎结果排序算法,通过与相同主题下PageRank算法的......
为了提高PageRank算法检索结果的精确度,分析了PageRank算法的基本原理和存在的不足,提出了基于超链接文本语义相关性的超链接算法.算......
随着Internet技术的发展,Web网页成为人们获取信息的有效途径,Web数据挖掘逐渐成为研究的热点。基于Web结构挖掘的PageRank算法存......
介绍了Web挖掘的任务和分类;讨论了Web的内容挖掘、结构挖掘和使用记录挖掘....
在对web结构挖掘的典型算法探讨的基础上,提出了一种PageRsnk算法和HITS算法相结合的改进算法,并对该算法进行了简要分析。......
[摘 要]HITS算法是基于链接分析的一种权威资源提取算法。相对于其他Web结构挖掘算法来说,HITS算法优势非常明显。针对HITS算法的缺......
Web挖掘是指使用数据挖掘技术从Web文档和服务中发现和提取信息和知识的技术。本文概述了Web数据挖掘的基本情况以及Web结构挖掘和......
Web数据挖掘就是利用数据挖掘技术从网络文档和服务中发现和提取信息。Web数据挖掘是一种新兴的边缘科学技术,他涉及到机器学习、数......