基于RSS信息源的服务型机器人网络检索系统的设计与实现

来源 :天津师范大学 | 被引量 : 1次 | 上传用户:www6331758
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,网络信息过载问题越来越明显,如何快速地从海量信息中获取所需的部分,成为一个亟待解决的问题。RSS由于其自身的简洁性和通用性,改变了信息的获取方式,通过聚合网络中RSS信息,解决了用户需登录多个网站才能搜索到自己需要的内容这一问题。但多数RSS新闻内容具有很大的重复性,导致检索到的信息重复率比较高,内容的关联程度不是很好。本研究是以RSS信息源技术为支撑,结合2011中国机器人大赛家庭服务组比赛的实际应用为研究背景,为家庭服务型机器人量身设计了网络信息的检索功能。首先对网络中相关的XML文件进行解析,再使用中文分词和词性标注方法对XML标题进行词性标注和处理,然后按日期对新闻进行区分和分类存储,并在传统的RSS检索技术上完成了机器人根据用户给出的关键词来检索RSS新闻信息、相关新闻详细内容检索以及过滤新闻中相似内容等功能,使得本系统能够更准确的找到网络中相关的信息。最后经过系统运行以及详细的统计和对比分析,引入准确率和召回率,以及F值的评测指标,得到了较为理想的结果。该功能模块已成功应用于2011年中国机器人大赛家庭服务机器人比赛中,并取得了良好的效果。
其他文献
半监督学习是目前机器学习与数据挖掘的研究热点,通过较少的监督信息(如标注样本点或成对约束信息)和大量的未标注数据提供的数据分布信息,能对数据集内的点进行正确归类。大量研
资源预留协议(RSVP)使用户可以在互联网上为多媒体应用程序请求不同质量的带宽服务。然而,RSVP协议并没有提供一个灵活的支持安全服务质量(QoSS)的机制。将资源预留协议(RSVP)扩展为
在项目反应理论(IRT)中,参数估计对于建设题库﹑考察被试﹑考察考试质量起着重要的作用。随着IRT的不断发展,产生了多种不同的参数估计方法。但随着模型的越来越复杂,已有的参数
近年来机器视觉技术已经十分广泛的应用在印刷品缺陷检测领域,但是随着人们对印刷品质量的要求提高,传统的印刷品缺陷检测已经很难满足印刷品工业的需要,要想提高印刷品缺陷
无线传感器网络技术作为新兴技术之一,近年来得到了迅速发展。无线传感器网络主要由布置在监测区域中大量的廉价微型传感器节点组成,实时监测传感器网络中的环境信息,在当今军事
流媒体相关服务已经成为互联网中的主流应用,采用P2P技术的流媒体应用在提高流媒体系统的可扩展性、并发性和健壮性的同时,却面临着大量挤占骨干网络,资源安全和内容版权难以
面对海外设备厂商的市场垄断和技术封锁,自主研发半导体设备既是国内半导体设备市场的迫切需求,也是国家意志的体现。本文从控制程序设计、运动性能优化、控制功能升级以及通
随着分布式交互仿真技术的不断发展,HLA(HighLevelArchitecture)成为继DIS(Distributed Interactive Simulation)之后出现的新一代分布式交互仿真标准。为了满足大规模复杂系
近年来,互联网的整体规模越来越大,作为搜索引擎采集模块的爬虫的工作压力与日俱增,即使最专业的搜索引擎服务提供商,如谷歌、百度,也无法保证所有页面的时效性。而就单个页
在过去的四十年里,信息检索领域出现了很多经典的模型,诸如布尔模型、向量空间模型以及概率模型。随着Pnoet和Corft首次提出基于统计语言模型的检索模型,近十年来该模型得到了快