主题Web挖掘研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:zhaimeng2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络已经成为人们获取知识的一个重要途径。然而面对巨大的Web资源库,用户若想获得所需要信息已不再是一件简单的事情。通用搜索引擎返回大量的无关信息.不能满足用户的特定信息检索需求。针对这个问题,Web信息检索领域出现了一个新的研究方向——主题驱动的Web资源发现。介绍了通用搜索引擎的基本结构、工作原理及现状。阐述了主题Web挖掘的研究背景、任务及目前研究技术的进展,并对其未来的发展方向进行了探讨。对通用搜索引擎和主题Web挖掘的关系进行了分析。
其他文献
ART2神经网络是按照自适应谐振理论建立的一种自组织、无监督的人工神经网络。通过分析经典自适应谐振神经网络聚类过程,针对传统ART2神经网络模型对分类的不确定性和网络权值
粗糙集理论是一种新的软计算方法,已成为知识发现和属性约简算法领域的一个研究热点。但经典的粗糙集理论是建立在等价关系基础之上的。从粗糙集理论出发,在优势关系之上给出了
关联规则是数据挖掘的重要研究内容之一。传统的关联规则挖掘算法仅适于处理二元属性与分类属性。为更好地处理数量属性,提出了一种自适应的基于模糊概念的量化关联规则挖掘算
函数依赖对关系数据库和XML文档都是一种重要的语义表达。文中对XML文档中存在的函数依赖、部分函数依赖和传递函数依赖进行分析,对规范部分函数依赖提出XML第二范式,对规范部
软件体系结构的提出对软件重用机制和软件开发效率的提高具有非常重要的意义。软件体系结构的使用是提高软件开发质量、减少软件开销和促进软件生产率提高的最有效方法之一。
面向服务的架构在实施中遇到了诸多困难,如增加系统的复杂性、难以与原有IT资源整合等,针对这些问题,在研究实现SOA的基本策略的基础上,分析了SOA的柔性,提出了通用权限管理服务、
数码谜题是人工智能领域中的经典问题。结合低阶数码谜题求解的具体实现过程,分析了求解高阶数码谜题的存储机制设计、可解性判断、移动规则设计及搜索策略。与传统搜索算法相
分类问题是数据挖掘和机器学习中的一个核心问题。为了得到最大程度的分类准确率,决策树分类过程中,非常关键的是结点分裂属性的选择。常见的分裂结点属性选择方法可以分为信息
为了在滤除椒盐噪声的同时能很好地保持图像的边缘细节,提出了一种新颖的图像椒盐噪声非线性滤波算法。利用局部统计信息,先将图像像素点分为信号点和可能的噪声点两类。然后将可能的噪声点进一步细分为边缘点、噪声点和信号点:利用方向信息、均方差来判断是否为边缘点,利用自适应阈值的方法来判断是否为噪声点,并且对边缘点和噪声点采取不同的方法进行滤波。经过仿真实验并与其它滤波算法进行比较表明,文中的算法具有更好的效
无线网络信道易变化,同时还有QoS的需求.传统的分层设计不能根据变化做动态调整.引入跨层设计的思想,可以提高交互性。对无线通信环境的特征进行介绍.结合QoS的要求.给出跨层设计的