基于领域本体实现Web文本挖掘研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:jshaczcl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为弥补改进传统Web文本挖掘方法缺乏对文本语义理解的不足,采用本体与Web文本挖掘相结合的方法,探讨基于领域本体的Web文本挖掘方法。首先创建Web文本的本体结构,然后引入领域本体“概念-概念”相似度矩阵,并就概念间关系识别进行描述,最后给出Web文本挖掘的实现方法,发现Web文本信息的内涵。实验中以网络媒体报道为例,通过文本挖掘得出相关结论。 In order to make up for the lack of improvement of traditional Web text mining methods, this paper uses a combination of ontology and Web text mining to explore the method of Web text mining based on domain ontology. First of all, we create the ontology structure of Web texts and then introduce domain ontology “concept - concept ” similarity matrix and describe the relationship between concepts. Finally, we present the method of Web text mining and find the connotation of Web text information. In the experiment, taking network media as an example, we draw relevant conclusions through text mining.
其他文献
GQFGJX改进型模数式伸缩装置作为一种新型的桥梁结构构件,广泛应用于都香高速公路六威段上.针对此种新型伸缩装置的中梁及横梁建立了3组足尺试验模型,并进行了静载试验,以研
互联网时代信息爆炸式的增长使得人们很难及时获取自己所需的信息。通用搜索引擎的出现为用户查找所需的信息提供巨大便利的同时,也给用户带来了很大的困扰。当用户提出检索任
通过过英国环城绿带的整体规划及发展历程的介绍,阐述了伦敦环城绿带的规划背景、目标、规划策略等内容,总结了伦敦环城绿带规划的理念与方法,并对我国山水城市的建设提出了
介绍信号的定义和分类,基于信号的三要素论述信号分析的内涵,阐述信号分析这一竞争情报方法的重要价值,尝试提出信号分析的方法步骤。着重以电纸书行业为例进行实证研究,剖析该行
开放式创新包括嵌入性、嵌出性以及双向复杂3种流程类型,不同的开放式创新流程类型需要不同的知识能力结构相匹配,并实现知识能力之间的协同。以朗讯和思科为例,探讨两家公司
高校作为典型的知识密集型组织,其科技管理系统中诸多知识流的有序与高效流动将直接影响高校科技工作成效和管理绩效。借助Petri网对高校科技管理系统中的知识流进行分析,描述
解析新兴技术主题的概念,同时结合专利文献的特点,利用专利文献提出识别新兴技术主题的初步技术框架,并以工业生物技术领域的专利文献为数据来源,采用文本聚类技术、共词战略
为克服知识管理综合评价过程的随机性与评价专家主观上的不确定性,把人工神经网络技术应用于企业知识管理评价中,设计评价指标及BP网络结构,提出多指标综合评价模型。通过仿
信息过滤是卫生政策知识服务平台建设中的核心技术,在系统研究信息过滤的几种经典方法的基础上,确立将向量空间模型作为该平台的信息过滤方法,并进行一定的改进,以避免传统向
从知识的视角介绍高技术产业集群创新过程中知识资源整合的知识基础,在融入高技术产业集群自主创新动态特点基础上对包括知识的获取与创造、知识的转移与扩散、知识的共享与