农业文本知识推荐算法研究

来源 :湖南农业大学 | 被引量 : 0次 | 上传用户:fjiik
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
湖南国家农业农村信息化示范省建设的重要目标之一是把分散的农业知识收集起来集中存储在云平台,然后将有效的农业知识和有需求的农户进行撮合。正是在这种背景下,本文开展了对农业知识进行特征提取与向量化、对用户基于隐式评价的兴趣建模、将农业文本知识和用户进行协同推荐的研究,其主要工作如下:首先,依据用户对农业知识访问的关键词诉求,通过对关键词分频动态挖掘主题兴趣特征,将挖掘到的特征关键词重组为标准特征词库,对关键词与标准特征词进行相似度与TF-IDF值加权计算,将用户感兴趣知识向量化;使用湖南农业农村信息化综合服务平台知识库数据对比论证了传统向量空间模型,能有效降维,具有较高的相似性和良好的区分度。其次,根据挖掘到的兴趣主题特征空间和用户最常见的查询、浏览行为,构建兴趣主题特征树,以特征词浏览时间加权平均值浏览频率值、用户浏览内容兴趣度IR,对兴趣值进行度量;以基于兴趣主题与文本知识特征的相似度和用户对农业知识浏览兴趣度IR,构建基于隐式获取的用户-农业知识评价矩阵Gi,对用户兴趣建模。再次,提出了基于用户隐式评价的农业知识协同过滤推荐算法CIECF。该算法通过建立农业知识标准特征矩阵feaMatrix,用户评分项目内容权重矩阵UserMatrix,然后基于内容的特征对稀疏评价矩阵进行填充,再基于项目协同过滤算法推荐相应的知识。使用MovieLens数据集,分析了相似度及邻居规模对CIECF算法的影响,论证了该算法比基于用户的协同过滤UCF算法,基于项目的协同过滤ICF算法具有更高的预测精度。使用农业数据集论证了本文算法适合农业文本知识推荐。最后,基于android移动终端,设计和实现了一套农业知识推送原型系统。基于用户隐式评价的农业知识协同过滤推荐,对从农业生产中获取有用信息进行扩散,更好地指导农业生产经营实践,有着重要的研究和实用价值。本文的主要创新点:(1)基于关键词分频挖掘策略,通过特征重组和关键词与标准特征词相似度加权计算,设计了农业文本知识向量矩阵算法,用来挖掘用户兴趣主题和表示农业知识特征。(2)构建了基于用户兴趣矢量和浏览行为的用户-农业知识隐式评价矩阵,结合农业知识特征和用户浏览评价内容的权重值,对未评分的项目进行预测评分、填充,既改善了数据稀疏性,又反映了用户个性兴趣。
其他文献
在《手脑相长》一文中,陶行知指出中国人当时有两种病:一种是“软手软脚病”,一种是“笨头笨脑病”。好在随着义务教育普及和教育改革的深入,如今,这两种“病症”大有缓解,但
当前,人力资源管理水平较低已经成为制约民营企业发展的重要因素。本文深入分析了民营企业人力资源管理的现状,指出其存在的问题,并从人才战略、激励机制、员工培训、企业文化等
目的 讨论磁共振成像 (MRI)平扫联合磁共振扩散加权成像 (DWI) 在直肠癌诊断中的应用价值.方法 回顾性分析我院 86例直肠癌患者的临床资料, 以术后病理检查为金标准, 评价 MRI平
目的探讨适宜的血栓弹力图(TEG)室间质量评价(EQA)方法。方法用传统统计方法中位数(M)±1.96倍四分位间距(IQR)、M±2.58IQR,99.73%置信区间(k=3)的合成变异系数(SCV
为解决西部弱胶结软岩巷道支护难题,在内蒙古鲁新煤矿对典型弱胶结泥岩取样,并对其进行不同状态(天然状态、饱和状态和烘干状态)和不同围压水平的室内三轴压缩试验,分析其强
目的:探讨精浆抗精子抗体与精液黏度和液化时间的关系.方法:间接血凝法测定AsAb.结果:3 432例不育者AsAb呈阳性反应者350例,占10.20%.AsAb阳性组与AsAb阴性组比较,精液黏度增
笔触是油画艺术中重要的语言形式,是艺术家抒情写实的重要手段。笔触的发展史经历了时间和空间的历练,形成了丰富的多样的表现形式。通过对笔触这一油画艺术语言的研究和分析,我
近年来,我国出台的多项文件如《“十三五”国家老龄事业发展和养老体系建设规划的通知》(国发[2017]13号)等中多次提及老年健康及老年健康管理等内容,可见老年人的健康状况问
新课改实施以来,我国城镇中学语文教育发生了很大的变化,传统的教学理念和教学方式已悄然发生改变,取得了骄人的成绩。但是,农村中学语文教学的现状却是不容乐观的,还存在着很多问