论文部分内容阅读
在我国农业现代化发展过程中,农业信息化扮演着重要的推动作用。近年来,农业相关信息资源呈现爆炸性增长,导致严重的“信息过载”问题,使相关农业用户无法及时、准确且有效获取满足自身需求的资源。因此,利用当前信息技术实现信息资源个性化推荐服务,为农业用户提供所需的信息资源,以解决“信息过载”问题。本研究通过挖掘复杂农业网络中的社区结构,收集社区用户的历史行为信息文档,构建社区用户群体兴趣模型以预测用户不同时间段的兴趣偏好,并结合用户个性化兴趣特征提供推荐服务,有效改善了农业信息推荐服务的效率。本文主要完成工作如下:(1)改进深度稀疏自动编码器的农业社区发现研究。针对传统协同过滤算法在复杂农业网络中获取目标用户最近邻偏差较大的问题,本研究通过将复杂农业网络进行社区划分,获取用户关系紧密的社区结构。首先,对复杂农业网络图中节点相似度矩阵计算方法进行改进;然后,改进自动编码器中稀疏惩罚函数,通过构建深度稀疏自动编码器对网络图相似度矩阵进行特征提取;最终,利用K-means算法对提取的特征矩阵进行聚类,从而获取农业网络社区结构,以此作为后续研究的基础。实验证明,在仿真数据集上,本文改进的算法相比于DBCS算法、Deepwalk算法及CoDDA算法,在准确率上分别提升4.3%、15.6%、5.5%,且平均保持在70%左右,稳定性较好。(2)面向农业社区用户群体兴趣模型构建研究。针对复杂农业网络社区用户兴趣模型构建中数据标注的稀疏性问题,首先结合标签推荐与新标签提取方法对未标注文档集进行标签标注,并基于Hownet对社区用户标签进行语义相似度计算,消除标签语义模糊问题,再采用聚类算法对社区用户群体不同类别的兴趣进行聚合,最终采用空间向量法表示群体兴趣模型。实验表明,本文改进的文本标签标注算法比LDA算法、TextRank算法及LDA+TextRank算法在准确率上分别提高了9.9%、6.8%、2.3%。(3)面向农业社区的信息混合推荐算法研究。针对农业信息推荐中用户冷启动以及推荐质量较差的问题,首先,提出基于社区群体兴趣热门标签信息推荐算法,对系统新用户进行初始推荐,缓解用户冷启动问题;然后,以目标用户所在社区为背景,提出基于社区用户关系挖掘的协同过滤推荐算法;最后,融合基于社区群体热门标签信息推荐算法与基于社区用户关系挖掘的协同过滤算法,完成用户信息推荐。实验表明,基于社区用户关系挖掘的协同过滤推荐算法在最近邻为40时,推荐性能达到最佳,其准确率为76.8%,召回率为25.9%,相比CT算法、CS算法及UserCF算法,其准确率分别提高了16.0%、14.2%、10.4%,召回率分别提高了4.6%、5.1%、9.5%。当两种算法融合后,在保证推荐准确率的同时,推荐多样性提高了13.3%。