社会化标注中用户动态兴趣主题挖掘

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:lzhwei002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在社会化标注中,用户采用标签的方式对自己感兴趣的资源基于自身理解进行无约束标注,标签作为用户所选择的关键词,反映了用户对信息资源的看法及其兴趣所在。用户兴趣的发现获取是个性化推荐的基础和核心,现有研究主要聚焦于从数量和结构上考虑用户与标签的关系,而实际情况往往是,标签只是反映用户兴趣的一个单一词汇,用户的兴趣往往是由多个标签形成的集合所刻画的主题,而且标签随用户标注时序动态变化的特点也会影响用户兴趣的刻画。因此本文结合国家自然科学基金项目“泛在计算环境中社会化驱动的情境感知个性化信息服务研究”(项目编号:71471165),研究了社会化标注中用户动态兴趣主题的挖掘,系统地阐述了用户兴趣主题模型的构建方法,提出了基于动态标签关联指标来挖掘有效的用户兴趣主题并展开实验研究。本文的主要工作和贡献如下:(1)构建了主题模型获取标签主题。以“用户-标签”二元关系为基础,把用户标注信息作为语料库,标签被看作是这个语料库中的词,从而构建LDA模型挖掘潜在的标签主题。将原本杂乱无章、动态变化的标签划分成具有主题的簇,从而克服标签本身的不确定性和不一致性。(2)提出了动态关联指标获取用户标签兴趣。建立关联空间模型来描述用户与标签集的联系,通过分析社会化标签系统的具有时序特征的标注过程,考虑标签的时序特征,定义了反映数量特征的强度指标和反映时间变化的稳定性指标,通过动态关联指标获取用户动态标签兴趣。(3)用户动态兴趣主题挖掘。结合标签主题模型和用户动态标签兴趣,将两者进行相似性计算,得到用户动态兴趣主题,从而有效地实现了用户标签集到用户兴趣主题的动态对应。(4)选取来自Last.fm社会化标注平台中真实的用户标注数据,开展用户兴趣主题挖掘的实验研究,利用覆盖度Acc和准确率Rec对本文提出的基于动态关联指标挖掘的用户兴趣主题模型的有效性进行验证。研究表明,本文提出的基于动态关联指标挖掘的用户兴趣主题在有效性方面有较好表现,且明显优于基于TF方法和基于TF-IDF方法挖掘的用户兴趣主题,研究结果对于个性化推荐具有较高的实践应用价值。
其他文献
通过调查研究,发现徐州地区保护地番茄主要病虫害是番茄灰霉病、番茄叶霉病。笔者通过室内毒力测定试验和大田药效试验,分别筛选出了最佳药剂,为指导菜农生产提供服务。
游戏海报作为当代游戏产品与大众亲密接触的第一步,必然具有举足轻重的作用,因此,研究海报中图形的趣味性不仅有利于游戏发行商的产品推广,更有助于人们更好地了解游戏内容。
相对于普通本科院校学生,高职生具有自律性较差、自卑心理严重等特点。因此,有必要采取针对性的激励措施帮助他们增强自信心,树立正确的人生观、世界观和价值观,成为社会主义
从南丰蜜桔叶片和洋葱的健康植物组织提取液中筛选出3株对柑桔溃疡病(Xanthomonas campestris pv.Citri(Hasse)Dye)有拮抗作用的内生菌株Bb1、Bb2和YC1,通过拮抗菌株的抑菌活性试
政府作为社会的主要管理者,其政策的价值取向不可避免地会对社会的价值取向产生影响,当前社会不和谐现象的存在很大程度上就是由于政策的价值取向有失公平,造成了社会的失衡