文本挖掘与推荐算法在农业信息服务平台中的应用研究

来源 :吉林农业大学 | 被引量 : 3次 | 上传用户:JAVA_Star
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科学技术对农业致富增收,提高农民科技素养起到了关键性作用,随着信息技术飞速发展,在互联网上累积了大量的农业信息资源。但由于农民对互联网知识与应用技能的缺乏,导致农业资源的利用率不高,推广率较低。针对如何高效的利用现有的农业信息资源,适应农业用户实际的阅读需求以及解决基于内容推荐算法特征提取不够准确和传统推荐算法对农业产品针对性不足等问题,本文从以下三方面展开研究。第一,基于关键词的文档相似度计算方法的改进。研究并分析了传统的基于关键词的文档相似度计算方法,为了提升基于关键词的文档相似度计算方法的准确度,在原有方法的基础上,通过引入多种关键词提取的方法并取均值的方式来提高文档相似度计算的准确度。最后并通过实验验证了改进算法的精确度。第二,农业技术文档专用停用词表的构建。农业技术类文档由于独特的专业领域和书写习惯,会产生一些特有的停用词比如“田间、品种”等类似的词,这些词可能经常出现但是对于农业技术类文档没有实际意见,同时由于现在发布的停用词表没有专门针对农业领域的,所以需要针对农业领域构建专用的停用词表。第三,基于多特征的农业web文档推荐方法研究。本文设计和实现了一个基于多特征的农业web文档推荐方法,该推荐方法从节气特征、主题特征和关键词特征三个维度进行文档相似度的计算,并将综合相似度最高的文档集推荐给用户,文档的评价方法与以基于内容的推荐方法和基于内容过滤的农业信息推荐方法进行对比。实验结果表明,该文提出的多特征的农业文本文档推荐方法推荐准确率较高。综上所述,本文提出一种结合用户浏览和收藏记录、关键词和24节气的多特征的农业web文档推荐方法。算法从用户过去浏览收藏和当前阅读文档主题特征、关键词特征、节气特征等三个维度分别进行相似度计算,将结果相加计算文档之间的综合相似度,并将相似度最高的文档集推荐给用户。实验结果表明,该文所提出的算法能提高对农业web文档推荐的准确度且对其他农业产品的推荐具有参考价值。
其他文献
学界对于"普世价值"和"价值论转向"的眷顾,使价值问题成为关注的焦点,而价值来源的讨论又是焦点中的热点。从价值论研究起步那天起,该问题的讨论就从未停止,时至今日仍未达成共识
在前人研究的基础上总结了活性炭在社会生活、工业生产中的应用。主要介绍了粉尘、废气、污水的处理方法。在此基础上对活性炭的应用和发展前景进行了总结,有利于环境的保护。
近 10 年来,每年省内有近千万外来流动人口,时常引起局部疟疾流行。1988~1997 年全省报告疟疾49 206例,疟疾年发病率在0.18% ~1.24% ;检出疟原虫阳性病人95 328 例,平均每年检出9 533 例,其中外来人口疟疾病人占 53.3% ,本省居
目的:了解博白县食品中食源性致病菌污染状况,确定易受污染的高危食品,为预防食源性疾病提供科学依据。方法依据《食源性致病菌监测工作手册》进行采样监测、分离培养和鉴定。结
目的:建立用高效液相色谱法测定三黄散中黄芩苷和盐酸小檗碱含量的方法。方法:采用Agilent-C18色谱柱(250mm×4.6 mm,5μm),流动相为乙腈-0.02 mol·L-1磷酸二氢钾溶液-三乙
<正>近代英国社会思想家斯宾塞认为:"良好的社会最终还是要靠它的公民的品质。"而现代美国思想家加尔布雷斯在《好社会》中则指出:"一个国家的前途并不取决于它的国库之殷实,
本文应用活塞式沉积挤出快速成型技术制备组织工程骨支架,由于材料混合种类影响骨支架力学性能,并且骨支架制备过程中工艺参数设置需要经过大量实验,为了能够完善组织工程骨
文章介绍了中核辽宁核电有限公司供方评价的分类、评价的形式和范围、对供方评价的要求、供方评价的流程、供方评价实施以及对分供方评价的审查和监督等内容,并对供方评价工
在河南开封对10亿&#183;g^-1枯草芽孢杆菌干粉种衣剂防治棉花黄萎病与促进棉花生长效果进行了田间试验研究。结果表明:“枯草芽孢杆菌”干粉种衣剂对棉花黄萎病有一定的防治效
目标跟踪是计算机视觉领域的研究热点之一,目前广泛应用于机器人、人机交互和安防等民用领域,以及武器的精确制导等军事领域。相关滤波跟踪算法因兼具速度和精度的优势引起广大研究人员的关注,近些年来,也取得了较为显著的效果。但与此同时,它仍面临诸多挑战,在复杂场景下(如目标遮挡、目标快速运动等)跟踪器性能下降,影响使用效果。本文以相关目标跟踪框架为基础,在跟踪中的边界效应,尺度估计和模型污染[1]问题上进行