基于自然语言处理的网页过滤方法研究

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:windFWF1992
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
www上的信息极大丰富,搜索引擎存在精确度低的问题.为准确地从搜索到的网页中提取有用信息,发展一个自动的过滤器已成为当务之急.本文提出的基于自然语言处理的网页过滤方法,从语法、语义和语境三个方面上分析网页的自然语言.实验表明,该方法在一定程度上提高了搜索引擎的精确度.
其他文献
在现存的网络考试系统中,有关题型均为标准化试题,这对于需严格考察学生程序设计能力的程序设计考试而言不太合适.本文从C语言的特点出发,探讨了机器自动批改C程序设计填空题
文章简要介绍了源同步接口总线和高速串行总线的测试难点和各种测试解决方法。
传统的生产力理论认为,生产力是人类征服和改造自然的能力。这种理解有其合理之处,也有不容忽视的问题。特别是在人与自然的关系上,它只看到了人对自然的征服和改造以及人与
本文讨论了规则体数据场的体绘制算法,将光线投射体绘制算法看作是对体数据立方体投影多边形的填充,减少了投射光线的数目。将Bresenham画线算法推广到三维空间,减少了光线投射算法的计算时间。本算法已应用于我所开发的三维核磁共振图像分析系统中,效果较好。
在素质教育和有效教学的推动下,高校教育体育教学迅猛发展,如何充分发挥体育教学的作用,培养学生的综合体育素养,是高校体育教师和体育教学管理面临的重要问题。特别是体育教
介绍Struts概念和体系结构,通过程序示例探讨Struts三个主要功能模块Controller,Model,View之间的内在联系及各自的处理流程,展现Struts能够更好帮助Java开发者利用J2EE开发
本文从研究农民增收的必要陆出发,剖析了农民收入低下、农民增收缓慢的原因,在于农业本身、工业化的产生、制度等因素,其中制度性原因是造成我国“三农”问题和农民增收缓慢的主
介绍搜索引擎的主要工作流程,并对其理论依据进行了描述。对向量空间模型的发展作详细介绍。最后对搜索引擎的发展趋势进行展望。
自20世纪90年代中期以来,随着农村改革的深入和经济的发展,我国出现了农民收入增长乏力、农民负担沉重和农村经济萎靡不振等不良形象,其中农民负担问题尤其突出,已成为影响我
CORBA规范被称为是面向2 1世纪的软件总线,它已经成为流行的分布对象计算规范.本文介绍了CORBA的体系结构和特点,详细描述了CORBA与Java语言的关系,重点探讨了如何在 JAVA中