新一代Web搜索引擎中数据的抽取

来源 :昆明理工大学学报 | 被引量 : 0次 | 上传用户:sunyiyuki
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Internet上日新月异的大量信息资源充斥 ,这对搜索引擎提出更高要求 .为提高搜索引擎中Spider的智能化 ,引入一种新的数据模型和文档自动检索模型 ,其中文档自动检索主要由关键字提取和抽取文摘两部分组成 .在此模型基础之上构造全新的数据检索方法 ,用模型匹配的方法搜索网页为此模型提供带权值的信息资源 ,为精确描述WEB信息提供了依据 .这种检索方法同时增强了Spider的适应性 ,简化了编程维护工作量 . Due to the large amount of information resources on the Internet, the search engines make more demands.In order to improve the intelligence of Spider in search engines, a new data model and automatic document retrieval model are introduced, in which the automatic retrieval of documents is mainly carried out by keywords And extracted abstracts.This paper constructs a new data retrieval method based on this model and searches the web pages by using the model matching method to provide a weighted information resource for this model and provides a basis for the accurate description of the WEB information. The approach also enhances Spider’s adaptability and simplifies programming and maintenance efforts.
其他文献
我们身边的物质材料这篇课文的内容主要分为“世界由物质构成”“物质在变化”“让物质发生变化”,主要是呈现生活中物质变化的实例,从这些变化的实例中比较出两类不同的变化
一年前,来到这里,如今将要离开。  当初来的时候,并无长久待在这里的想法。一年,似乎比我预想的要长,可是这样日复一日地,光阴也就过去了。  该庆幸可以走了?  这一年的风物与人事,却留着很多可爱的、温情的印迹。也许是这些美好的人事,让时间过得从容些吧。  每天走的路很有限,所见也很有限。  附近的道路两旁,种着多是杜英与木棉,这两种树都是在秋冬就落了叶,光秃秃的。三月初的时候,在新叶还没长出之前,
初中生的英语听力训练,是初中英语教学的一个重要环节.在实际的教学中,很多教师都很烦恼听力课的教学方法,烦恼如何提高学生的听力水平.其实听力教学只要根据初中生的生理、
汉语是我国重要的语言,是我国各族民族交流的重要媒介。因此,除了要在汉族地区开展语文教学外,还要对少数民族进行汉语教育。只有这样,才能更好地增进民族交流,保证我国各族人民的
:针对医院管理工作中存在的大量动态模糊信息 ,难以用传统的方法进行处理 .从而引入动态模糊逻辑 (DFL)对这些问题进行分析 ,为医院决策提供一种新的思路和处理方法 . : In
对传统纵流式换热器和横流式换热器进行了抗振性能分析 ,提出了折流栅抗振型换热器和折流板抗振型换热器的结构 ,并对其抗振性能进行了研究分析 ,提出了一种新的管壳式换热器
采用有限差分数值计算方法 ,求解螺旋槽液体润滑的雷诺方程 ,获得了液体润滑螺旋槽机械密封端面的液膜二维压力分布 ,并计算分析了操作参数和结构参数对密封端面开启力和液膜
在阐述虚拟现实技术及其基本特点的基础上,从建立新的办学模式和直接服务于教学这两个方面论述了虚拟现实技术在教育中的具体应用,我国大学教育中虚拟现实技术的实现方法,并
【摘 要】中国植物保护科学技术的发展战略的研究是一个目前为止迫切需要解决的重大问题,具有综合性和专业性的性质。为此,笔者综合采用多学科的研究方法,从植物保护科学技术所面临的挑战和发展做出阐述。  【关键词】植物保護科学技术;战略发展研究;国家生物安全  0.前言  我国是农业生产大国,农业在我国经济发展中处于主导地位,粮食的稳定收益对国家发展,人民的生产生活起到重要的作用,病虫害是影响作物产量的因
介绍了一种在Web上通过ISAPI动态访问数据库,并且接收数据,写回数据库的方法,并给出了具体的实现策略.