论文部分内容阅读
湖南国家农业农村信息化示范省建设的重要目标之一是把分散的农业知识收集起来集中存储在云平台,然后将有效的农业知识和有需求的农户进行撮合。正是在这种背景下,本文开展了对农业知识进行特征提取与向量化、对用户基于隐式评价的兴趣建模、将农业文本知识和用户进行协同推荐的研究,其主要工作如下:首先,依据用户对农业知识访问的关键词诉求,通过对关键词分频动态挖掘主题兴趣特征,将挖掘到的特征关键词重组为标准特征词库,对关键词与标准特征词进行相似度与TF-IDF值加权计算,将用户感兴趣知识向量化;使用湖南农业农村信息化综合服务平台知识库数据对比论证了传统向量空间模型,能有效降维,具有较高的相似性和良好的区分度。其次,根据挖掘到的兴趣主题特征空间和用户最常见的查询、浏览行为,构建兴趣主题特征树,以特征词浏览时间加权平均值浏览频率值、用户浏览内容兴趣度IR,对兴趣值进行度量;以基于兴趣主题与文本知识特征的相似度和用户对农业知识浏览兴趣度IR,构建基于隐式获取的用户-农业知识评价矩阵Gi,对用户兴趣建模。再次,提出了基于用户隐式评价的农业知识协同过滤推荐算法CIECF。该算法通过建立农业知识标准特征矩阵feaMatrix,用户评分项目内容权重矩阵UserMatrix,然后基于内容的特征对稀疏评价矩阵进行填充,再基于项目协同过滤算法推荐相应的知识。使用MovieLens数据集,分析了相似度及邻居规模对CIECF算法的影响,论证了该算法比基于用户的协同过滤UCF算法,基于项目的协同过滤ICF算法具有更高的预测精度。使用农业数据集论证了本文算法适合农业文本知识推荐。最后,基于android移动终端,设计和实现了一套农业知识推送原型系统。基于用户隐式评价的农业知识协同过滤推荐,对从农业生产中获取有用信息进行扩散,更好地指导农业生产经营实践,有着重要的研究和实用价值。本文的主要创新点:(1)基于关键词分频挖掘策略,通过特征重组和关键词与标准特征词相似度加权计算,设计了农业文本知识向量矩阵算法,用来挖掘用户兴趣主题和表示农业知识特征。(2)构建了基于用户兴趣矢量和浏览行为的用户-农业知识隐式评价矩阵,结合农业知识特征和用户浏览评价内容的权重值,对未评分的项目进行预测评分、填充,既改善了数据稀疏性,又反映了用户个性兴趣。