文档聚类相关硕士博士期刊学术论文

文档聚类相关论文

基于Agent的个性化信息检索系统研究

近年来,随着Internet 的不断普及,越来越多的用户利用搜索引擎来搜索网上的信息,尽管搜索引擎的发展已经比较成熟,但人们却发现要......

学位

信息检索 Agent 向量空间模型相似度文档聚类

基于桌面的特定领域meta-search系统的研究

搜索引擎已成为网上使用率最高的工具之一。它的主要衡量指标有两个：覆盖率和精度。然而，调查显示，单独一个搜索引擎对网上信息的覆盖......

学位

元搜索个性化服务信息过滤文档聚类

文档分类和聚类方法及其在信息检索中应用的研究

本文对文档分类和聚类方法及其在信息检索中的应用进行了深入研究,主要包括以下几个方面的内容:通过对当前分类方法的分析,提出了......

学位

文档分类文档聚类信息检索层次分类超链接信息

多层次文档归类在挖掘及处理用户偏好中的应用

随着网络技术的迅猛发展,许多公司都企图借此以更贴近用户的服务提高各自的竞争力。用户到底偏好什么成了他们重点关注的问题。人......

学位

数据挖掘文档分类文档聚类用户偏好层级字典多层次描述多层次归类

用户偏好管理及其在网站开发中的应用

随着信息技术的发展,信息化已成为当今世界经济、社会和科技发展的大趋势。作为今后的发展方向和战略重点,军队也在积极推进以信息......

学位

网站建设数据挖掘文档分类文档聚类用户偏好层级字典

信息检索系统的算法库研究

伴随着万维网的发展,越来越多的人开始以网络进行生活、工作和学习.信息检索已经构成网络的一个不可或缺的因素.在进行信息检索时,......

学位

信息检索系统数据挖掘文档聚类元对象协议

基于术语簇和关联规则的文档聚类方法

聚类技术是数据挖掘领域具有重要价值的技术之一,随着网络在社会生活的不断深入,加之数据库技术的迅速发展和普及,Web挖掘日益受到......

学位

矢量空间模型关联规则文档聚类 Web挖掘术语簇

XML文档结构相似度研究及在文档聚类中应用

近几年来，随着社会信息化进程的不断深入发展，人类对信息的需求和依赖程度越来越高，如何从海量的信息资源中快速有效的获取有用的信息......

学位

XML 树路径结构相似度文档聚类

XML文档聚类研究与应用

XML(e Xtensible Markup Language)是因特网中信息描述、传输和交换的重要标准,而XML文档聚类是众多XML文档整合和管理技术中关注......

学位

相似度计算 XML文档聚类权重特征偏好机场噪声

Web搜索结果聚类研究

目前，大多数搜索引擎以线性列表的形式为用户返回搜索结果，而搜索结果往往数以万计，这就使得用户可能需要花费很长时间才能找到自己需......

学位

搜索引擎文档聚类后缀树搜索结果聚类非负矩阵分解

基于密度方法的XML文档聚类研究

随着社会信息化进程的不断深入发展,人类对信息的需求和依赖程度越来越高,如何从海量的信息资源中快速有效地获取有用的信息,已经......

学位

XML XML聚类相似度度量

频繁子树挖掘在XML挖掘中的应用

近年来,随着互联网的快速发展,网络上的数据越来越庞大,而且数据的类型也越来越繁多,如何有效地利用这些数据,从中提取用户所需要......

学位

数据挖掘频繁子树频繁子树挖掘 XML数据挖掘非确定树

P2P网络中基于查询的聚类的研究

随着Internet的飞速发展,搜索引擎成为人们在网络中频繁使用的工具。然而,随着网络中信息的急剧增加,传统集中式搜索引擎已经越来......

学位

P2P 聚类拉模式推模式 VSM

基于多向量的中文新闻话题检测

话题检测是处理互联网新闻的一种重要方法,使用聚类方法对新闻文档进行处理是实现话题检测的一条重要途径。凝聚层次聚类算法由于......

学位

话题检测多向量模型 TFIDF改进聚类个数估计

基于三角不等式的XML文档相对密度聚类

随着互联网技术迅猛发展,XML文档由于其自身的自描述性、半结构化、可扩展性等特点,已经成为当今网络时代的信息载体与交换方式,一......

学位

XML文档数据查询文档聚类软件设计

基于聚类与局部共现的相关反馈方法研究

互联网的快速发展导致了互联网上的信息量与日俱增。如何从互联网上获取用户所需要的信息已经成为了一个热门问题。在这个背景下，信......

学位

信息检索相关反馈聚类局部共现查询扩展

文档聚类在搜索引擎结果中应用的研究

随着的Intemet飞速发展，人们利用Intemet发展和共享各种信息，使得信息爆炸式增长，普通网络用户查找所需资料变得非常困难，搜索引擎正是......

学位

信息过载搜索引擎文档聚类 Google Web API

基于组织型P系统的DNA-GA算法研究及其在聚类中的应用

DNA-GA算法本质上是建立在DNA编码上的遗传算法,是将进化计算领域和DNA计算相结合的一种表现形式。DNA-GA算法所采用的DNA编码方式......

学位

P系统 DNA-GA 组织型P系统聚类分析文档聚类

半结构化数据的聚类研究及在产品设计中的应用

随着计算机网络以及数据库技术的快速发展,各领域积累的半结构化数据和信息急剧增加,迫切需要面向知识发现的方法,而数据挖掘的出......

学位

半结构化数据 XML文档标签语义相似度聚类

基于结构向量空间和树路径模型的XML文档聚类技术研究

XML(eXtensible Markup Language)是可扩展置标语言,在网络和其他领域的数据表示与交换方面显示出强大的数据表达能力。现在,越来......

学位

XML 数据挖掘文档聚类文档结构结构向量空间树路径相似度

基于频繁项集的Web文档聚类的应用改进

利用一种基于十字链表快速挖掘频繁项集的算法代替传统算法产生频繁项集,改进基于频繁项集的文档聚类方法在web文档上的应用.通过......

期刊

频繁项集文档聚类 Web文档十字链表

基于K中心点的文档聚类算法

K中心点算法是一个常用的聚类算法,它的主要缺陷是容易陷入局部极值,计算代价太高.本文先构造一个运用余弦相似度的K中心点文档聚......

期刊

K中心点算法文档聚类迭代局部搜索

基于潜在语义空间维度特性的多层文档聚类

为实现文档在不同概念层次下的自动聚类,研究了潜在语义空间中维度的统计特性,发现对应大奇异值的维度描述了语义元素间的共性,对......

期刊

信息处理潜在语义分析文档自检索矩阵文档聚类概念粒度

基于高性能特征选择函数的Web文档聚类算法

目前常用向量空间模型VSM(vector space model)表示文档,造成的高维问题制约了其实际应用的效果。采用了一种高性能特征选择函数,......

期刊

文档聚类 WEB挖掘特征选择降维 document clustering Web mining feature selection dimension

一种快速有效的Web文档聚类方法

以矢量空间模型VSM为Web文本的表示方法,提出了一种基于关联规则的Web文档聚类方法。实验证明:该方法能在保证文档聚类高精度的同......

期刊

WEB挖掘文档聚类矢量空间模型VSM 关联规则 Web Mining Document Clustering VSM( Vector Space Mo

一种基于SOM和K—means的文档聚类算法

提出了一种把自组织特征映射SOM和K-means算法结合的聚类组合算法。先用SOM对文档聚类,然后以SOM的输出权值初始化K-means的聚类中......

期刊

自组织特征映射 K-MEANS 聚类组合方法文档聚类 SOM（ Self-Organizing feature Map） K-means Cluste

一种基于形式概念分析的Web文档标签聚类方法

针对现有搜索引擎的搜索结果数目庞大要从中找到有用信息十分困难的问题，基于将Web搜索结果进行聚类可以方便用户快速浏览搜索结果......

期刊

Web搜索结果组织文档聚类形式概念分析 Web search result organization document clustering forma

文档聚类在Web搜索结果中的应用研究

随着互联网的迅猛发展，信息爆炸式增长，产生了信息过载，而在相当程度上，搜索是面临信息过载的唯一选择。但是，现在的搜索引擎缺陷也很明......

期刊

文档聚类搜索引擎信息检索 Document clustering Search engine Information retrieval

文档聚类技术在搜索引擎中的应用研究

随着互联网上信息数量的不断增长，传统的信息检索技术已经很难满足人们对查询质量的苛刻要求。为了方便用户从检索结果中快速、准确......

期刊

文档聚类聚类技术搜索引擎 document clustering clustering technology search engine

融合DSTM和USTM方法的主题模型

当前监督或半监督隐藏狄利克雷分配（latent Dirichlet allocation，LDA）模型多数采用DSTM（down-stream supervised topic model）或USTM（up......

期刊

隐藏狄利克雷分配(LDA) 监督主题模型文档聚类作者预测 LATENT DIRICHLET allocation (LDA) supervised topi

基于Web内容挖掘的个性化学习系统

基于Web的个性化学习是在远程学习和个性化服务相结合的基础之上发展起来的。利用Web挖掘的方法,针对用户的兴趣变化,搭建了个性化......

期刊

个性化服务用户兴趣模型文档聚类向量空间模型 personalization user interest model document clustering

融合模拟退火的遗传算法在文档聚类中的应用

为了准确高效地对网上获取的文档进行聚类，在布尔逻辑模型的基础上提出了一种改进的最优相似度搜索方法。该方法将模拟退火的思想融......

期刊

布尔模型向量空间模型文档聚类遗传算法模拟退火 Boolean model vector space model documents clustering

基于BP神经网络的文档聚类研究

1,引言近年来,随着互联网的迅速发展,基于Web的数据挖掘技术受到越来越多的关注,经常用在文本挖掘和信息检索等多个领域的聚类(Clu......

期刊

Internet BP神经网络文档聚类数据挖掘信息检索系统查准率查全率 Document clustering Vector Space Model

基于动态区间映射的文档聚类算法

随着信息数字化的快速发展，新兴的归档存储成为研究热点，空间利用率和扩展性是其关键问题。利用基于内容分块存储实现重复数据删除，是......

期刊

文档聚类归档存储动态区间映射空间利用率扩展性 Document clustering Archival storage Dynamic interva

基于模糊C均值和改进的LSA的文档聚类研究

文中研究的是文档聚类的方法,即将给定文档集合中的文档进行分类,以达到准确聚类的目的。提出了一种将模糊C均值（FCM）和改进的LSA（Lat......

期刊

模糊C均值 LSA 文档聚类 fuzzy c-means LSA document clustering

基于冰冻结构的XML文档聚类研究

为了挖掘XML（Extensible Markup Language）文档在历史变化过程中不经常发生变化的结构所蕴含的知识，给出了发现冰冻结构的方法，使用一......

期刊

XML文档文档聚类加权Jaccard系数冰冻结构 extensible markup language （XML） document document

XML文档的聚类研究

随着互联网的迅速发展,XML已经成为互联网中最常用的数据交换与存储语言,如何从大量的XML文档中提取有价值的信息是目前的研究热点......

学位

XML 文档聚类相似度计算

一种基于语义特征的Web文档检索方法

Web文档聚类在Web信息检索中起着重要的作用。文中提出了一种新的Web文档聚类和检索算法。该算法采用有序聚类的方法，根据Web文档的......

期刊

文档聚类语义结构信息检索文档检索 Web Internet 语义特征 and semantic character structure correspon

文档聚类综述

聚类作为一种自动化程度较高的无监督机器学习方法,近年来在信息检索、多文档自动文摘等领域获得了广泛的应用。本文首先讨论了文......

期刊

计算机应用中文信息处理综述文档聚类降维概念相关聚类算法

搜索引擎中的聚类浏览技术

搜索引擎大多以文档列表的形式将搜索结果显示给用户，随着Web文档数量的剧增，使得用户查找相关信息变得越来越困难，一种解决方法是对......

期刊

计算机应用中文信息处理搜索引擎文档聚类信息检索聚类标识 computer application Chinese information proce

一种基于LDA的潜在语义区划分及Web文档聚类算法

该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中......

期刊

LDA 潜在语义语义分布文档聚类 LDA latent semantic semantic distribution document cluster

PBC：一种基于路径的XML文档聚类方法

提出了一种基于路径的XML文档结构聚类方法(PBC).与其他方法直接计算XML文档结构距离不同,该方法通过对文档包含的路径聚类,间接完......

期刊

XML 信息检索文档聚类 XML information retrieval document clustering

基于向量空间模型的文档聚类研究

文档聚类在Web文本挖掘中占有重要地位．是聚类分析在文本处理领域的应用。文章介绍了基于向量空间模型的文本表示方法，分析并优化了......

期刊

文档聚类 K-MEANS算法向量空间模型权重评价函数最大最小距离 document clustering k-means algorithm Vect

一种基于关键特征的搜索引擎结果聚类算法

为了解决用户在搜索引擎结果列表中寻找所需信息困难的问题,帮助用户快速有效地定位有价值的Web文档,与向量空间模型方法不同,采用......

期刊

搜索引擎算法特征提取文档聚类向量空间模型VSM KFC算法 search engines algorithm feature extraction

基于互信息的Web文档聚类方法

由于网络信息的激增，如何充分利用大量的信息，并有效地为Web用户服务成为一个急需解决的问题。相关研究表明利用Web文档聚类的方法可......

期刊

信息检索文档聚类互信息特征选取向量空间模型 information retrieval document clustering mutual i

基于模糊概念图的文档聚类及其在Web中的应用

随着World Wide Web上数据量的日益庞大,现有的搜索引擎已经不能满足用户日益增长的需求.利用数据挖掘技术,提高搜索效率,实现了查......

期刊

模糊概念图文档聚类 WEB 计算机网络兴趣模式用户化智能搜索 fuzzy concept graph documental clustering in

一种基于本体的抽象度可调文档聚类

文档聚类随着网上文本数量的激增以及实际应用中的需求，引起了人们广泛的关注。针对目前文档聚类的主要缺陷，提出了一种新的基于本体......

期刊

本体文档聚类概念消歧抽象度 ontology text clustering concept disambiguation abstract degre

一种基于术语簇和关联规则的文档聚类方法

提出一种新的基于术语簇和关联规则的文档聚类方法。首先对文档集合进行分词，根据术语之间的平均互信息形成术语簇．用术语簇来表示文......

期刊

术语簇关联规则文档聚类 WEB挖掘矢量空间模型 term clustering association rules document clusteri

基于聚类BNR扩展模型的信息检索研究

使用聚类技术对BNR进行扩展，得到一个新的4层模型，该模型同时使用了术语间和文档间的相近和相似关系，将此扩展模型和简单的RNR、扩展......

期刊

BNR 扩展模型聚类技术信息检索文档聚类 BNR expansion model clustering approach informatio

基于词条之间关联关系的文档聚类

针对现有的空间向量模型在进行文档表示时忽略词条之间的语义关系的不足,提出了一种新的基于关联规则的文档向量表示方法。在广义......

期刊

文档聚类关联关系词条同现文档相似度潜在语义 document clustering association terms co-occurrence

看过本文同时还关注