基于网页的知识元挖掘

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:taiyangkaimen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展和网络的普及,以网页形式表示的信息越来越多,基于网页的知识元挖掘就是从浩瀚的网页信息中发现潜在的有价值知识。网页知识元挖掘要处理大量的非结构化的文档信息和复杂的语义关系,采用全新的数据挖掘方法直接对非结构化数据进行挖掘,其基本流程包括:文件格式转换、分词与词性标注、文本知识元挖掘、知识元聚类以及推理与知识发现。 With the rapid development of information technology and the popularization of the Internet, more and more information is expressed in the form of web pages. Knowledge-based mining of web pages is to discover potential valuable knowledge from the vast web information. Web knowledge meta-mining has to deal with a large number of unstructured document information and complex semantic relations. The new data mining method is used to directly mine unstructured data. The basic process includes: file format conversion, word segmentation and part-of-speech tagging, text Knowledge element mining, knowledge element clustering and reasoning and knowledge discovery.
其他文献
目的了解学校水痘暴发疫情的临床特征和流行病学特征,探讨发病原因,为科学防治水痘提供依据。方法应用描述流行病学分析方法对发病儿童进行调查分析。结果本次水痘暴发疫情累
通过对我国近年有关FRBR研究文献进行调查分析,概述我国对FRBR研究的主要内容、研究成果,进而提出了研究中存在的问题以及今后研究发展的方向。 Through the investigation
北京青年报2014-08-21:国家卫计委日前发布《口岸埃博拉出血热留观病例与疑似病例转运工作方案》,要求口岸发现埃博拉疑似病例后,急救中心需在2小时内将病患转运至定点医院,
网络卫士防火墙系统NGFW4000为不同类型的Internet接入网络提供全方位的网络安全服务。本文介绍天融信NGFW4000产品的特色,探讨基于NGFW4000的双出口路由策略,并给出具体的实
人的价值在哪里?如果纯粹从自然科学的角度看,把区区人体内几十种化学元素全部提取出来制成日用品,只可制造7块肥皂,2200根火柴,一个铁钉,一桶可供粉刷一个小房间的石灰及20
The selective degradation of damaged or excessive mitochondria by autophagy is termed mitophagy. Mitophagy is crucial for mitochondrial quality control and has
“Blog”作为一种具有双向发布信息和信息交流功能的网络出版和发表文章的方式,它组涵了建构主义、过程学习、自主学习、反思性学习等先进教育理念。作为一种辅助教学工具,把
什么叫统驭能力?就是统揽、统率、统领。驾驭工作和主宰全局的能力,是一种令被领导者折服的权威力量。举一个例子,有一村支部书记李某,工作不负责任,威信很低,村风每况愈下,
山寨搜索引擎的使用方法和Google、百度一样,都是通过输入关键词来搜索要查询的内容。不同的是山寨搜索引擎利用独立搜索引擎的结果,然后把所得的搜索结果显示出来。山寨搜索
2016年7月19日,一个令多少人终生难忘的日子。“这辈子都没见过这么大的雨。”“天漏了吗?”当日零时开始,自西南至东北,我省先后普降暴雨到特大暴雨,至7月21日8时,全省平均