面向主题的WWW信息挖掘系统

来源 :中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会 | 被引量 : 0次 | 上传用户:shb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
WWW规模的飞速发展对普通搜索引擎覆盖一切的目标提出了挑战.对于关注具体主题的用户,普通搜索引擎并不完全适用.近年来聚焦于单一主题的WWW检索逐渐受到重视,本文在此基础上结合数据挖掘技术提出一种面向主题的WWW信息挖掘框架,不仅能够在有限的软硬件和网络资源条件下,实时高效地完成主题相关的网页的收集,更重要的是能够对检索到的主题相关网页进行分析,最大限度的对主题进行挖掘,这是普通搜索引擎所不具备的.
其他文献
基桩作为桥梁基础部分的重要组成部分,其安全性直接关系整个桥梁的安全运营,保证基桩的完整性对桥梁结构具有重要意义。基于ANSYS/LS—DYNA有限元分析软件,并以正弦函数应力脉冲
了解连续箱梁的病害情况,针对病害情况提出相应的增加竖向预应力、张拉体外预应力、加宽腹板、裂缝注胶封闭等措施,希望通过该桥的加固施工工艺的介绍,为其它箱梁加固维修提
抗裂嵌挤型水稳是一种以连续级配粗集料形成相互嵌挤骨架、水泥及细集料充填空隙而形成的骨架密实型无机结合料。通过室内试验,分析了成型方式、振动时间及4.75mm通过率对成
针对既有铁路钢桁梁桥原有设计方案刚度不足的问题,提出了三种可行的加固设计方案。采用有限元软件MIDAS建立了加固前后桥梁结构空间振动分析模型并进行了动力模态分析,通过
Based on idea of virtual Web page for the HTML page[6], this paper proposes firstly a concept of VXMLF(Virtual XML File), which separates the structure of XML f
Text automatic classification has become an important technology along with development of Internet and the increment of information ,because of the complexity
With the rapid developments of cluster systems,the problem of I/O bottleneck becomes more and moresevere. A good file system is crucial to the whole systems. Th
Considering characters and requirements of the Cluster Surveillance and Control System, the networktopology structure of the system is presented and the hiberar
本文介绍了网格的基本概念,结合工作流任务的服务质量(QoS)需求,提出了基于服务质量的网格工作流调度算法,对GGWF算法中的LGSS算法做了改进,提出了ILGSS算法,对该算法的算法复杂度
This paper investigates and summarizes the basic concept of Web Service, covers how to set up the fundamental Web Service structure on WebSphere platform with t