【摘 要】
:
微博作为信息分享和传播的网络平台,近年来得到了广泛的应用。如何让用户在海量的微博中获取到感兴趣的微博内容成为了微博平台新的研究方向。目前的一些微博推荐系统大都针
论文部分内容阅读
微博作为信息分享和传播的网络平台,近年来得到了广泛的应用。如何让用户在海量的微博中获取到感兴趣的微博内容成为了微博平台新的研究方向。目前的一些微博推荐系统大都针对用户进行推荐,而对于微博平台来说,由于微博文本长度较短,用户兴趣多样,因此针对用户的推荐效果并不理想。本文提出了针对于微博的推荐系统,用户在浏览微博时可以订阅感兴趣的微博,系统将针对用户订阅的微博,结合用户的兴趣,推荐相关的微博。这样的推荐一方面更有针对性,推荐效果更好;另一方面也通过对于微博的推荐将类似的微博聚集起来形成了用户所感兴趣的话题。本文的推荐系统基于用户聚类和短文本相似性算法实现。首先通过收集用户过往所发表的微博为用户建立兴趣模型,在此基础之上对用户进行聚类。然后收集与当前用户所在同一簇中的用户所发表的微博,与用户订阅的微博进行相似度计算,将相似度较高的微博推荐给用户。在聚类算法中,本文改进了K-Means算法,解决了K-Means算法对于初始中心选取的依赖性这一问题。在相似性计算中,本文在短文本语义相似性的基础上,加入了单词权重和词序的因素,提高了相似性计算的准确率。实验结果表明,本文改进的K-Means聚类算法,在正确率和运行时间上都优于传统的K-Means算法。改进的微博相似性算法相比于语义相似性算法具有更好的区分度和准确率。最后,本文搭建了一个微博系统,融合了改进的聚类算法和文本相似性算法,实现了对于微博的订阅推荐功能。
其他文献
著作权制度通过保护作者对其创作的科学,文学,艺术等作品所享有的人身权和财产权,激励文化创新和促使信息资源的传播流通,最终促进经济增长,社会福利和人类思想进步。我国现行著作
随着经济一体化的进一步加深,企业越来越向纵深发展,由此带来的结果是关联企业大量出现。由于传统的法律规则都是围绕着单一企业展开的,所以在面对关联企业带来的众多复杂问题时
在党的十八大会议期间,习近平总书记提出“同心共铸中国梦”,中国处于伟大的民族发展之际,在中国经济体系中占有主导地位的国有上市公司,其改革和发展关系着国计民生,政府控制与上
毒品具有成瘾性、毒害性和违法性,不但会严重损害吸食者的身体健康,使其感染各种传染性疾病乃至危害生命,甚至会损害其神经系统,进而产生精神病症状;而且还会降低吸食者的工作能力
实践中行政机关适用代履行的频率越来越高,这是非常好的趋势,也符合《行政强制法》的最小侵害原则,但由于《行政强制法》对代履行的规定相对笼统,实践中存在很多需要行政机关
本文的的主要目标是研究非马氏(non-Markovian)随机内生增长经济中的均衡资本税问题。该经济中的随机性不仅仅包括传统的由布朗运动诱导的连续时间小规模冲击或波动,同时还包
目的:探讨强心饮对阿霉素所致心肌病心力衰竭大鼠的心肌保护作用。方法:雄性Wistar大鼠随即分为6组,除空白组外,均采用尾静脉每周注射阿霉素2mg/kg,共6周制备心肌病心力衰竭
工业园区的快速发展一方面加快了我国经济的腾飞,另一方面也带来了严重的资源短缺和环境污染,其中,水资源消耗和水污染就是一个不可忽视的方面。尽管废水通过集中处理以后达
古琴,自古以来在具体体现中国文人整体素质的“琴棋书画”中居于首位,与中国古代哲学思想及审美准则有着共同的文化底蕴,一直以来在中国古代传统社会中的文人士族阶层广泛传
随着我国海洋开发广度不断延伸和深度连续拓展,我国海域交易市场开始启动,在海域使用权取得、海域使用权流转、海洋开发融资等过程中的海域交易活动日渐频繁。然而我国海域价