农业搜索引擎中的异常数据检测

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:yyaizy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着农业信息化的快速发展,互联网上的涉农信息快速增加。据不完全统计,目前我国有超过30000个涉农网站。然而这些网站上的信息大多是无组织、多结构、动态的,这严重影响了农业信息个性化服务的发展。在国家重大科技支撑项目子课题“基于本体的农业搜索引擎”(2006BAD10A0502)的支持下,我们研究开发出了针对农业的垂直搜索引擎“搜农”。实践证明,该垂直搜索引擎能够为用户提供完善的个性化服务。随着农业信息的爆炸式增长,异常数据也在大量增加,异常数据的存在大大降低了垂直搜索引擎个性化服务的质量。这些异常数据包括模糊数据、不完整数据以及取值异常的数据等。针对不完整数据,(刘峰等2009)提出了一种不完整数据的处理方法,并把此方法应用于“搜农”搜索引擎中。实际应用表明,该方法能够很好的工作。本文将重点研究如何识别农产品价格数据数值上的异常。本文重点研究了针对农产品价格数据的异常数据检测方法。本文首先简要介绍了常用异常数据检测方法,把这些常用的异常数据检测方法进行一定的修改以应用于农产品价格数据;同时本文对农产品价格数据的特征进行了详细的分析,并根据该数据特征提出了一种针对农产品价格数据的异常数据检测方法;最后对各个检测方法做了实验。实验表明,本文提出的针对农产品价格数据的异常数据检测算法能够很好的完成任务。同时,本文研究了如何把异常数据检测算法应用于垂直搜索引擎中。本文详细分析了该垂直搜索引擎的系统架构,并着重阐述了该搜索引擎的数据流向,在此分析基础上,详细讲述了如何把异常数据检测系统完好的融入已有系统,实现各子系统的对接。最后,本文分析了该异常数据检测系统的特性,详细分析了添加该异常数据检测系统后的垂直搜索引擎的数据流向。实际应用表明,添加了异常数据检测系统的垂直搜索引擎,能够为用户提供更高质量的个性化服务。
其他文献
车—车间无线通信是智能交通领域一个新的研究方向,对改善交通安全,提高出行效率,便于交通管理等都具有重要意义。当前很多车—车间通信的研究都更关心车载通信网络各层协议算法
城市道路问题是现代城市迫切需要解决的重要问题之一,交叉口是制约着城市交通通行能力的瓶颈,对交叉口的交通信号进行智能控制能够降低车辆的平均延误,提高交叉口的通行能力。交
轮廓和方向信息是图像的本质的几何特征。由于标准二维小波变换不能有效地检测图像的轮廓信息,并且只能获取有限的方向信息,所以它不是图像处理的最佳工具。Directionlet变换
汽车转向系统是汽车重要系统之一,直接关系到汽车行驶的操纵性及安全性。近年来,汽车EPS系统以节能、轻便、环保以及结构紧凑等诸多优点逐渐成为汽车转向系统一个快速发展方
设备系统的监控中,感兴趣的主要是反映设备状态的各类仪表及音频信号。随着设备系统日益复杂,传统的人工方法,由于效率低下、自动化程度不高,在一些场合已不能满足监控需要,特别是
褐煤是我国含量较为丰富的一种低阶煤。由于褐煤具有高含水率、低发热效率的特点,导致直接使用存在热效率低、污染严重等问题。对褐煤进行干燥提质是大规模利用的一种有效手
随着微电子技术,数字信号处理技术和多媒体技术的进步,数字视频的分辨率和清晰度逐渐提高,开始由标准清晰度进化到高清晰度。伴随着等离子、液晶等新一代显示技术的发展,高清影片
燃料电池发动机系统就是一种新能源发动机系统。多个传感器被应用到此系统中来采集这些数据。但是这些传感器一旦出现问题不仅会影响到数据的正常采集,如果问题出现的严重,而
水泥预分解窑生产工艺,代表了现今先进的水泥生产工艺。我国作为水泥生产大国,水泥预分解窑产量已占全国总水泥产量的60%以上,然而由于水泥预分解窑参数众多、大惯性、大滞后、非
单交叉口信号配时优化问题是交叉口信号优化控制的重要内容,也是区域交叉口信号协调控制的基础。本文分别以排队车辆数、平均停车延误、停车率以及通行能力等性能指标建立单