面向个性化服务的用户兴趣挖掘方法研究与实现

来源 :北京交通大学 | 被引量 : 4次 | 上传用户:piaodedaocao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网应用技术飞速发展,信息的爆炸式增长使得信息过载问题日益严重,无论是用户还是信息服务提供商都面临着巨大的挑战。与此同时,信息化浪潮的来临使得各个领域产生了大量的数据。因此,如何从这些数据中发现有价值的知识和规律,成为目前理论与实践研究的热点与难点。针对网络资源快速增长导致的信息服务和需求失配问题,研究人员提出了以用户画像为基础的个性化服务解决方案,其核心在于基于文本挖掘和多源数据融合的用户兴趣模型构建。本文围绕用户兴趣建模这一目标,针对现有兴趣模型对不同用户间兴趣描述差异性较大和难以及时发现用户兴趣变化两大问题,提出了相应的改进措施。对上述问题,本文以用户生成内容和用户行为信息为分析对象,利用自然语言处理、知识仓库、数据融合等方法和技术,对基于文本挖掘和多源数据融合的用户兴趣挖掘关键技术进行研究。在此基础上,进一步探讨了用户兴趣的描述方法和用户兴趣迁移问题。最后,本文设计了一个面向个性化服务的用户兴趣挖掘系统模型,并通过系统实现验证了本文提出模型的有效性。本文主要研究内容包括:(1)兴趣描述方法。针对用户兴趣描述方法不统一、不同用户间兴趣描述差异较大导致用户兴趣维度过大的问题,本文提出了基于开放式分类目录的用户兴趣标签空间及兴趣映射的相关算法。此用户兴趣描述体系充分借鉴了现有开放式分类目录的结构体系,能够对用户兴趣进行有效分类。(2)用户兴趣建模。本文将用户兴趣视为长期兴趣和短期兴趣共同作用的结果,并由此提出了长、短期兴趣的发现和融合方法,并进而构建了能够准确反映用户长、短期兴趣变化的兴趣模型更新方法。此外,为描述用户兴趣的时变特性,本文充分考虑时间因子对兴趣迁移的影响,提出了基于兴趣历史相似度的用户兴趣迁移发现方法,实现对兴趣变化的捕捉。
其他文献
<正>从第十七届全国汉语方言学会学术年会开始,全国汉语方言学会将与主办单位联合举办"全国汉语方言学会国际音标记音比赛"。比赛举办时间与全国汉语方言学会学术年会同步进
技术移民是各国人力资源竞争的重要对象。中国财智外流严重的现状以及不完善的技术移民法律法规都影响了国际技术人才来华工作的积极性。通过欧美等发达移民国家的技术移民法
在是否应该把语素归入词汇范畴这个问题上分歧严重。通过一些有代表性的观点的分析比较,我们认为的确应该把语素作为词汇单位。词汇的定义应该是"一种语言(或特定范围)的所有
<正>以STR复合扩增检测为代表的法医DNA分型技术以其灵敏度高、核心序列小、可复合扩增、方法易于标准化等优势,已经成为当前法庭科学DNA检验的主要手段,在各国刑事案件侦破
利用双螺杆挤出机制备高流动性无卤阻燃PC/ABS合金,研究基材配比、不同相容剂及其用量、阻燃剂磷酸三苯酯(TPP)对PC/ABS共混合金力学性能、阻燃性能、流动性能的影响。结果表
对当前热门的课堂观察模式——“教师巡课”展开实践研究,发现阻碍巡课实施的三个关键问题。针对问题提出优化策略——整合构建共同体;引入SOLO分类理论合理选定实践问题;把巡课
麦子与麦地形象在海子诗歌中不断复现,构成了一个意象系统,寄寓和熔铸了诗人对生命意义多层面的思考和想象。"麦子/麦地"之于海子,首先,意味着延续肉体生命所必需的物质层面
<正>由全国汉语方言学会主办,杭州师范大学汉语言文字学学科、浙江大学汉语史研究中心承办的全国汉语方言学会第十四届学术年会暨汉语方言国际学术研讨会于2007年4月6日至4月
<正> 讨论主体性问题,首先要了解主体性的内涵。什么是主体性?主体性是指作为认识与实践主体的人的本质属性,是人性的进一步具体化。所以,主体性乃是作为主体的人的本质规定
介绍了化工企业工程设计中爆炸危险区域的划分方法和规范要求 ,以及如何在不同的爆炸危险区域中选用不同等级的防爆电气设备。