网页聚类相关硕士博士期刊学术论文

网页聚类相关论文

网络新闻中人物识别系统的设计与实现

近年来,互联网技术快速发展,各类信息剧增,互联网上每天有海量信息在生成、传播和存储。作为人的标识之一的人名,在互联网检索中有......

学位

新闻搜索特征选取网页聚类人名消歧

基于用户行为分析的网页目录自动构建

在过去的十多年里,互联网上的网站数量呈指数增长趋势,互联网上的网站数量已经突破1.5亿,而网页数量更是达到数百亿.用户往往需要......

会议

网页目录网页提取关键词权值用户行为自动构建网页聚类

基于Web数据挖掘技术的中文网页自动分类系统的研究

随着信息技术，特别是网络技术的飞速发展，网络带给人们的信息成爆炸式增长。作为Web数据挖掘的研究方向之一——中文网页自动分类在......

学位

数据挖掘网页分类向量空间模型权值计算 KNN算法网页聚类

搜索引擎中的网页自动聚类和多文档自动摘要技术

搜索引擎作为互联网上最主要的信息搜索工具之一，是广大网络用户用于查询信息的主要工具。然而，近年来，由于网络信息量迅猛增加和网络......

学位

搜索引擎网页聚类向量空间模型多文档自动摘要文本关系图相似度计算

基于LSA的Web内容挖掘和信息检索

万维网自20世纪90年代初有了第一个真正意义上的网页之后，其信息量与日俱增，速度发展之快，始料未及。人们在庆幸摆脱了信息匮乏的困境......

学位

Web内容挖掘信息检索 LSA 万维网搜索系统模型网页聚类

一种新的Web信息抽取模型的研究与实现

Web已经成为一个庞大而复杂的信息仓库。如何利用程序从海量的Web中快速抽取信息从而提高人们获取信息的效率变得越来越重要。Web......

学位

信息抽取数对序列网页聚类模糊矩阵网页结构数字图书馆

开源论坛信息抽取技术研究

互联网进入大数据时代，网络数据挖掘与分析系统应运而生。对于包括搜索引擎在内的所有网络数据挖掘与分析系统，网页都是它们重要的数......

学位

开源论坛信息抽取网页聚类异常检测

基于Web挖掘的网站逻辑结构生成系统

随着单个web站点的日益庞大，web超链结构的日趋复杂，传统的建立在单个网页和单纯超链结构上的web模型已很难适应基于各种不同应用需......

学位

网站结构网页聚类站点逻辑域导入路径

基于Web日志挖掘的个性化推荐方法研究

随着互联网的飞速发展，Web被广泛的应用于人们的日常生活、学习、工作以及娱乐活动中。Web可以比作为一个巨大的信息收集站，它存储着......

学位

Web日志挖掘个性化推荐马尔可夫链网页聚类

网页在线聚类的研究与实现

随着网络信息的爆炸式增长,搜索引擎日益成为信息时代不可或缺的工具。当前主流的搜索引擎主要是以与用户搜索的相关度来排序返回......

学位

网页聚类在线快速有向概率图算法模型

面向WEB个性化服务的用户建模技术

近十几年来,因特网上的各种信息以呈指数级的速度增长,使得因特网用户想要快速找到其真正所需要的资料信息变得越来越困难。在海量......

学位

个性化服务用户兴趣建模网页聚类遗传算法

基于网页与标签聚类的搜索方法研究

随着Internet技术的不断发展,如何从海量的Web信息中找到用户所关心的信息成为一个关键的研究问题。高效的检索工具对于帮助用户方......

学位

网页聚类社会标注超图谱聚类搜索系统

基于视觉与语义的网页识别技术研究

随着互联网技术的蓬勃发展,越来越多的用户都参与到其中。但互联网在丰富人们生活的同时也出现了令人堪忧的问题,比如大量的不良网......

学位

网页识别网页语义相似度网页视觉相似度网页聚类

一种基于网页块特征的多级网页聚类方法

利用网页的结构特征,提出一种多级网页聚类方法。该方法首先对网页进行分块,然后使用网页的块特征对网页进行聚类。在聚类过程中,......

期刊

网页聚类网页分块分块网页聚类 DOM 聚类过程超链接显示属性算法

基于Web挖掘技术的远程教学平台研究

从1999年起,教育部开始大力发展网络教育,几年来,网络教育已成为当今教育发展的新生长点和现代教育技术主流的发展方向。当前的网......

学位

远程教育 Web挖掘教学平台个性化推荐

链路结构的网页聚类研究

网页的链接关系反映了网页之间联系的紧密程度,这种紧密关系是网页聚类的重要依据.首先通过对网页链路结构的特点分析,提出网页节......

期刊

Web挖掘链接分析网页聚类

Web Fuzzy Clustering and a Case Study

We combine the web usage mining and fuzzy clustering and give the concept of web fuzzy clustering, and then put forward ......

期刊

WEB挖掘 web用法挖掘 web模糊聚类数据对象网页聚类 web mining web usage mining web fuzzy clustering

信息抽取技术在网页中的应用

在网络信息暴增的今天,我们想要找到一种能够智能的、可以把人们所需的信息抽取出来的方法、这就是信息抽取技术。本文中的信息抽......

期刊

网页抽取网页模板网页相似度网页聚类

基于网页超图分割的WEB聚类法

针对于建立个性化网页和在电子商务中分类宣传产品等问题.提出了基于网页超图分割的WEB网页和用户聚类方法.通过建立网站层次模型,......

期刊

网页聚类超图层次模型 WEB clustering hypergraph partitioning hierarchy model

基于最大频繁项集的搜索引擎查询结果聚类算法

现有的搜索引擎查询结果聚类算法大多针对用户查询生成的网页摘要进行聚类，由于网页摘要篇幅较短，质量良莠不齐，聚类效果难以有较大的......

期刊

计算机应用中文信息处理搜索引擎网页聚类频繁项集 computer application Chinese information processing

Web网页聚类Hamming算法的研究与改进

通过对Web日志数据的挖掘研究，应用两种聚类的算法，Hamming算法和K均值算法，将用户所访问的网页进行聚类。在这两种算法中，首先以Web站......

期刊

网页聚类数据挖掘 WEB日志 K均值算法 Hamming算法

社会标注系统自适应网页聚类算法研究

文中提出了一种社会标注系统自适应网页聚类算法,可以自适应找出类别数目k并完成聚类。将随机选择的15组网页语料进行聚类对比实验......

期刊

社会标注网页聚类网页相似度 social annotation webpage clustering web similarity

基于竞争凝聚的个性化网页推荐

为了提高网站访问效率并得到有价值的个性化网页推荐，针对Web日志的新特性，提出了一种新的基于竞争凝聚的聚类算法．新算法对K-paths聚......

期刊

个性化网页推荐竞争凝聚用户聚类网页聚类 personalized Web recommending competitive agglomeration

一种新型的网页去噪及网页类型判断方法

传统的网页聚类方法存在准确率不高和计算复杂度高的问题。因此,文章提出了一种新型的基于URL相似性和简单DOM树的网页聚类方法,使......

期刊

DOM树网页聚类结构相似度 DOM tree Web pages clustering configuration comparability

DOI和论文数据库抽取在文献元数据获取方面的应用

为了提高文献录入效率和准确率，减少录入文献的人工审核，提出一种基于DOI和论文数据库的在线文献元数据获取方法。设计DOI解析代理集......

期刊

数字对象标识符论文数据库 WEB信息抽取网页聚类 digital object identifier paper database Web inform

网页信息抽取方法的研究

一、相关技术1．常规抽取方法介绍基于定义规则的信息抽取是指由用户根据待抽取信息节点特征．定义一种抽取规则（例如用正则表达式来描......

期刊

网页抽取网页模板网页相似度网页聚类

基于局部标签树匹配的改进网页聚类算法

Web信息抽取中需要对目标网站的网页进行聚类分析,以检测并生成信息抽取所需的模板。传统的基于DOM树编辑距离的网页聚类算法不适......

期刊

WEB信息抽取网页聚类树编辑距离局部标签树匹配 Web information extraction Web page clustering tree e

网页数据的自动化抽取技术

随着Web技术的迅猛发展,使得Web网页成为信息发布的主要载体也是人们获取信息的主要渠道之一,大量的数据以Web网页形式存储在互联......

学位

Web数据抽取网页聚类节点密度包装器结构化数据抽取

垂直式网络教学资源采集系统研究

研究一种垂直式网络教学资源采集系统，从提高采集效率和及时有效性出发，通过网页聚类的方法垂直式地采集网络教学资源。有策略地选择......

期刊

资源采集网页聚类 HYPERTREE 映射规则

基于网页聚类的Web信息自动抽取

针对现今较流行的动态Web网页数量巨大、数据价值高，并且网页结构高度模板化的特点，设计了一个基于网页聚类的Web信息自动抽取系统。......

期刊

WEB信息抽取网页聚类包装器生成 Web information extraction page clustering wrapper generation

网页信息抽取方法的研究

信息抽取技术属于人工智能的一个分支。使用信息抽取技术可以人性化地从网页中把人们需要的信息抽取出来。文中提出的信息抽取技术......

期刊

网页抽取网页模板网页相似度网页聚类 Web extraction Web template Web similar Web cluster

一种高效的网页聚类方法

当前主流的搜索引擎主要是以与用户查询的相关度来顺序返回搜索结果的,用户往往需要花费较长的时间从结果列表中进行选择。为了解......

期刊

网页聚类网络挖掘有向图高频词语短语扩展 web clustering web mining directed graph frequent words

基于网页结构聚类的Web信息提取技术研究

Web已经成为世界上最大,类型最齐全的海量信息库。面对不断增长的网页数据,急需解决的问题是如何获取其中有价值的信息或者是所感......

学位

信息提取 DOM(Document Object Model) 网页结构相似度网页聚类

基于网页聚类的正文信息提取方法

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清......

期刊

网页聚类正文内容块节点密度

网页搜索结果聚类与可视化

搜索引擎成为当今在互联网上进行信息检索最常用的工具.主流搜索引擎以与用户查询的相关度排序返回搜索结果,且自然语言中存在的＂一......

期刊

网页聚类后缀树可视化短语簇算法

深度网络信息爬取关键技术研究与实现

随着互联网的不断发展,网络中的信息量呈现几何级的爆炸式增长。我们根据网络信息的获取方式不同可以把互联网分为浅层网络与深度......

学位

搜索引擎深度网络爬虫网页聚类最优查询词

复杂网络在网络新闻信息处理中的应用研究

随着我国互联网普及率的持续攀升,网络新闻作为一个较新的信息传播方式日益为人们所关注,网络新闻信息带来的多种问题也相继凸显,......

学位

网页聚类网页关键词抽取复杂网络社团结构

舆情系统中web信息抽取子系统的设计与实现

网络舆情反映了广大民众对各种事件的态度，是国家相关部门了解民意的重要渠道。Web信息抽取是舆情系统进行舆情信息分析的输入，它性......

学位

Web信息抽取自动生成模板网页聚类

基于Hadoop平台的网页聚类方法研究

网页是互联网中信息存在的主要形式，人们通过网页发布和查询信息。而随着信息时代的日益变迁，网页的数量呈现了爆炸式的增长。在数以......

学位

Normalized Cuts Multiclass谱聚类网页聚类 Hadoop MapReduce

针对开源论坛网页的信息抽取研究

互联网上大量论坛使用开源软件生成，针对这类论坛，提出了针对论坛网页信息抽取的基于模板的信息抽取方法。首先给出了基于网页结构相......

期刊

记录定位网页聚类模板抽取

一种面向高校招投标公告主题爬虫的设计

由于通用搜索引擎返回的信息过多且主题相关性不强,使部分企业未能及时获取高校招标公告,错失中标机会。针对这种情况,提出了高校......

期刊

主题爬虫搜索引擎招投标主题相关性网页聚类

看过本文同时还关注