基于用户行为建模的科技论文个性化检索和推荐研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:wori147258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
科技论文在线是一个论文快速发表与共享的知识平台,它面向的绝大部分用户来自各个科研单位的研究人员,通常有非常明确的知识领域,使用过程中具有很明确的目的。目前,科技论文在线系统在用户检索文献时,系统对所有用户采取同一对待,即对同一检索词返回一样的结果。对于同一查询,系统没有考虑用户之间由于不同知识背景和所处不同领域而存在不同的查询意图。系统的信息量大,层次分类结构复杂,给用户获取有效信息带来了困难。   本文针对该平台在文献检索中存在的上述问题,以及系统数据量大、获取信息难等问题,提出了个性化服务解决策略,包括个性化文献检索、个性化文献推荐。对于文献检索,结合传统的信息检索模型,构建基于用户行为的个性化科技论文检索模型;对于数据量大、层次结构复杂、“人找信息”越来越耗时,采用“向用户推送信息”模式进行文献推荐,构建基于用户行为的个性化科技论文推荐模型。对于个性化科技论文检索模型,本文首先对系统数据进行分析并抽取用户感兴趣的关键词;其次以关键词权重来形式化的描述用户的兴趣爱好,并对其进行建模;最后将用户的行为模型融合统计语言模型构建了个性化科技论文检索模型。针对系统中表征用户兴趣模型关键词稀疏的问题,提出了基于随机游走模型来对用户兴趣模型进行优化。对于个性化科技论文推荐模型,本文把问题分为两种推荐场景,根据不同的场景构建不同的推荐策略。场景一融入协同过滤推荐算法的思想完成个性化论文推荐;场景二采用基于协同过滤和内容的两阶段论文推荐模型完成个性化的论文推荐。针对个性化论文推荐中需要快速查找目标用户的K个邻居用户,本文对用户进行了聚类分析,在簇内搜索K邻居用户,减少搜索空间。   本文实现了个性化科技论文检索算法和个性化科技论文推荐算法,并采用科技论文在线的数据对算法进行了验证。对于个性化检索模型,采用传统的统计语言模型进行对比,其在各项评价指标上优于统计语言模型,验证了个性化检索模型的有效性,同时,实验结果验证了优化方法的有效性。对于个性化科技论文推荐模型,本文分别对两种推荐场景进行了实验验证,实验结果验证了推荐模型的有效性。
其他文献
一件装置艺术作品处于空间中,并不是作品被动地放置于空间之中,它是根据自身的需要来处置所占有的空间,并给予空间新的定义,甚至创造出它所需的空间。展出的空间其本身是一个已知的量,艺术品服从于这个已知的量,但艺术的形式与空间是可以塑造的,不断变化的。装置艺术与空间的关系不同于其他的艺术形式,它有着自身的独特性,而这种独特性的产生,其本身就是一种量变后产生的一个质变表现。  处于这样的一个互动关系,使得空
文章通过对变速恒频风力发电机发电原理研究的基础上,运用矢量变换控制技术对空载并网进行控制,并探讨了控制策略;通过仿真实验证明了空载并网方式对变速恒频发电机的有效性,
组蛋白H3与其他类型的组蛋白分子H2A, H2B, H4共同构成了真核生物核小体的八聚体核心。研究发现组蛋白H3的多种翻译修饰,如甲基化、乙酰化、磷酸化等在调控基因转录过程种发
静态图像和动态视频(帧)中的文本识别,分两个阶段进行:首先对图像中的文本进行检测与提取,从输入的原始图像中分割出文本区域,即文本检测;然后对检测出的文本区域进行识别,从输入的
随着当今我国经济和科技不断发展,我国的工业生产和人们日常生活对用电的需求量逐渐加大,对电能质量的要求也越来越高,这就给供电企业提出了更高的要求,我国的电力工程建设力
送电线路是整个供电过程中最主要的一个构成部分,会因为其运行的故障,而影响到用户的用电问题,一旦出现重大的安全隐患,容易造成大面积的停电,严重干预到系统的运行和企业的
针对水轮机调速器故障引发机组过速事故,介绍了PSWT型比例伺服数字微机调速器,事故的过程及处理,并详细分析了事故原因,提出防范对策.
ZigBee技术是一种新兴的无线通信技术,由于它本身的一些优越性,如低成本、低耗能、低速率、高安全等,使ZigBee技术一出现就等得到了诸多厂商的鼎力支持,所以发展非常迅速,在
火力发电厂以在锅炉燃煤为主要燃料,由于设计煤种和实际煤种有差距,现实中燃烧的有很多灰熔点低的煤种,特别容易结焦的煤种,这样给锅炉带来很不利的安全因素,危害机组的安全.
城市雕塑作为一种具体可感的艺术形象,处于城市公共空间环境之中,除具有审美价值之外,还包含着深刻的文化内涵,代表着一个城市的文化品位,反应一个城市的内涵和精神气质,是艺