论文部分内容阅读
科技论文在线是一个论文快速发表与共享的知识平台,它面向的绝大部分用户来自各个科研单位的研究人员,通常有非常明确的知识领域,使用过程中具有很明确的目的。目前,科技论文在线系统在用户检索文献时,系统对所有用户采取同一对待,即对同一检索词返回一样的结果。对于同一查询,系统没有考虑用户之间由于不同知识背景和所处不同领域而存在不同的查询意图。系统的信息量大,层次分类结构复杂,给用户获取有效信息带来了困难。
本文针对该平台在文献检索中存在的上述问题,以及系统数据量大、获取信息难等问题,提出了个性化服务解决策略,包括个性化文献检索、个性化文献推荐。对于文献检索,结合传统的信息检索模型,构建基于用户行为的个性化科技论文检索模型;对于数据量大、层次结构复杂、“人找信息”越来越耗时,采用“向用户推送信息”模式进行文献推荐,构建基于用户行为的个性化科技论文推荐模型。对于个性化科技论文检索模型,本文首先对系统数据进行分析并抽取用户感兴趣的关键词;其次以关键词权重来形式化的描述用户的兴趣爱好,并对其进行建模;最后将用户的行为模型融合统计语言模型构建了个性化科技论文检索模型。针对系统中表征用户兴趣模型关键词稀疏的问题,提出了基于随机游走模型来对用户兴趣模型进行优化。对于个性化科技论文推荐模型,本文把问题分为两种推荐场景,根据不同的场景构建不同的推荐策略。场景一融入协同过滤推荐算法的思想完成个性化论文推荐;场景二采用基于协同过滤和内容的两阶段论文推荐模型完成个性化的论文推荐。针对个性化论文推荐中需要快速查找目标用户的K个邻居用户,本文对用户进行了聚类分析,在簇内搜索K邻居用户,减少搜索空间。
本文实现了个性化科技论文检索算法和个性化科技论文推荐算法,并采用科技论文在线的数据对算法进行了验证。对于个性化检索模型,采用传统的统计语言模型进行对比,其在各项评价指标上优于统计语言模型,验证了个性化检索模型的有效性,同时,实验结果验证了优化方法的有效性。对于个性化科技论文推荐模型,本文分别对两种推荐场景进行了实验验证,实验结果验证了推荐模型的有效性。