论文部分内容阅读
信息时代科技文献的出版速度逐年增加,科技文献以电子期刊和在线文档形式遍布于Internet之上,对科研教学人员来讲,如何充分利用现有的网络信息资源,从庞杂的电子文档中及时、准确地获知与自己研究领域相关的最新科技信息就显得非常必要。
网络技术的发展催生了电子商务,商业利益的驱动要求网站迎合用户的兴趣和发掘用户的需求,为其提供个性化的信息,技术的发展又促成了网站将Agent技术、Web数据挖掘技术等应用于针对单个客户的个性化的推荐系统中。当个性化服务理念和技术延伸到教育、科研领域,图书馆界也开始研究以用户为中心的个性化信息服务。
本文首先详细论述基于内容过滤的推荐技术中关键的用户兴趣建模技术,进而提出一种基于中图法的用户兴趣模型,使用形式化的描述刻画了用户兴趣模型的动态更新过程,并在此基础上设计和实现一个科技文献过滤系统,在应用中取得了不错的效果。
为了进一步优化系统性能,提高文献推荐服务质量,我们又研究了其他常用的推荐技术,重点是协同过滤技术及其在个性化推荐系统中的实现过程。在分析基于内容过滤的推荐系统和协同过滤推荐系统各自在实际应用中存在的不足之处之后,针对这些问题本文提出了一种基于内容过滤与协同过滤相结合的复合式推荐算法,能够有效的解决了协同过滤技术中出现的评分数据过于稀疏,缺乏初始评价,系统难于扩展等问题,成功的将协同过滤技术应用于该科技文献过滤系统。最后通过实验证明了该系统提高了文献推荐的品质,加快了用户兴趣模型的学习和更新,从而使模型能更精确的描述用户的实际兴趣。