【摘 要】
:
信息爆炸式的增加,导致处理和使用这些庞大的信息变得越来越困难。人们在面对“信息过载”和“资源迷向”的问题时,往往显得不知所措。现行的网络新闻信息检索系统面临很多问
论文部分内容阅读
信息爆炸式的增加,导致处理和使用这些庞大的信息变得越来越困难。人们在面对“信息过载”和“资源迷向”的问题时,往往显得不知所措。现行的网络新闻信息检索系统面临很多问题,主要是由于网络上信息的不断更新,就要求网络新闻信息检索对庞大的动态的信息要做出快速和准确的处理。同时通用搜索引擎很难满足不同背景,不同目的用户查询要求。为了解决这些问题,个性化智能搜索引擎应运而生。为了对有不同兴趣的用户准确地提供网络新闻信息,我们设计了个性化智能搜索引擎——AI times。AI times系统可以根据用户的不同兴趣返回不同的查询结果。同时,我们提出了一些改进和创新算法。如:优化的网络爬虫算法,模拟实验显示更新速度可以比传统的网络爬虫快6倍。基于关键标签的信息抽取算法,不光可以在最少的人工干预下,提取到有用信息,还同时根据重要性对文档分类,使网络爬虫可以重点回访和更新那些重要新闻信息。通过查询扩展方法改进了单一的向量空间模型,最后,我们提出了一个冗余信息推荐算法,模拟实验表明。该结构和算法能够有效地检索出与用户兴趣相关的信息,并且具有良好的可适应性。
其他文献
本文从国内外温湿度环境监测系统的研究现状出发,针对与工矿企业和日常生活中的环境参数监测的需要,提出了本课题的研究所要实现的功能,为课题的研究提出了目标。目前国内外的温
在计算机视觉研究领域中,人体动作识别一直是一个富有挑战性的课题,且有许多的研究者在此领域投入了大量的精力并取得了不错的成绩。然而,很多传统算法都是基于单一特征,单一
随着计算机的普及和多媒体技术的发展,计算机已经成为人们生活中不可或缺的工具,在各个领域发挥着不可替代的重要作用,影响并改变着人们的生活、工作、学习。随着因特网的日益普
建设网格首先要解决资源监测与资源发现问题。资源监测为其他的网格中间件提供了必要的与资源有关的性能数据,是资源发现和任务分配的基础。资源发现就是根据用户或应用的资
随着计算机技术的不断发展,应用于工业控制领域的软件与硬件设备的种类也越来越丰富,系统集成变得越来越复杂与困难。所以,无论是对于客户还是开发者而言,一套统一、通用的标
本体映射就是在不同的本体间搭建语义桥梁,以实现不同本体间的知识共享和信息交流。而对于大规模本体,由于其概念数量庞大、相互之间关系复杂,要实现它们之间的映射就变得更
随着互联网的高速发展与普及,电子商务作为计算机网络和商业结合的产物,正在改变着人们的生活方式。然而,由于互联网的开放性和匿名性,不可避免的存在着各种安全隐患,各种黑
Web已成为世界上最大的信息数据源,如何从海量Web数据中检索用户感兴趣的信息已成为工业界和学术界日益关注的热点问题之一。医疗一直是人们关注的热点话题,与人们的生活紧密相
当前信息技术飞速发展,对高等教育产生了巨大冲击,从教育环境、教育模式到教育理念、教育目标,都在这场冲击中发生着变革。根据自身发展的需要,顺应信息技术的发展潮流,采用先进的
多媒体技术和Internet技术的普及导致了大量图像信息的出现,传统的文本关键词检索方法已经不能适应图像信息的检索需求,基于内容的图像检索技术成为目前研究的热点。在简要介