基于级联过滤的SLIM模型的直播频道推荐方法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:chenzeqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
直播频道推荐方法是为满足直播观众的个性化观看需求、直播频道或直播平台的利益需求,然而当前直播频道推荐方法仅根据观看这种行为而针对观众的偏好进行分析,忽视了一些不可避免的噪音数据对推荐结果的影响,并且面对庞大且稀疏的真实数据不能保证较快的训练速度以及较优的推荐结果。因此,如何挖掘观众的潜在偏好表达,设计一个结果精度和实用性更高的直播频道推荐方法具有理论和实际意义。为解决现有的直播频道推荐方法对观众偏好分析的局限性,对直播场景下观众的重要行为数据进行了分析,认为观看行为、弹幕发送行为以及礼物赠送行为都对观众偏好表达有重要意义,因此构建了直播观众行为矩阵。而针对现有的直播频道推荐方法忽视噪音数据这一问题,在分析直播频道分类标签数据后,选择采用粗糙的分类标签信息来辅助过滤噪音数据,因此构建了直播频道标签矩阵。基于直播观众行为数据特征的分析,假设观众越喜欢一个频道则对该频道会花费的精力越多,并且不同行为对其偏好表达的影响有大小,基于此,构建了直播频道偏好评价模型。为达到高精度推荐、噪音数据过滤等目的,结合稀疏线性算法在稀疏数据下的优势,加上基于分类标签的级联混合特点,设计了基于级联过滤的SLIM模型的直播频道推荐方法。将基于级联过滤的SLIM模型的直播频道推荐方法与最新的直播频道推荐方法进行对比,设计了命中率、平均倒数命中排名、覆盖率等指标,实验结果表明其综合性能优于现有的直播频道推荐方法,即在保证推荐精度的同时,推荐结果覆盖了更多的直播频道,达到了推荐精度提升以及增加推荐多样性的实用性目的。
其他文献
雾霾天气下,许多交通场景都需要测量当前场景的能见度。传统方法一般都使用相关的硬件设备测量或者直接的人眼估计等方法。这些方法的往往具有硬件成本高、测量不够精确等缺点;不仅如此,由于其成本的限制,往往难以普及,无法及时地对特定场景的能见度进行测量。因此,本文提出了一种基于视频图像的测量方法,所提出的方法通过直接获取现有交通摄像头获取视频图像来计算能见度值,不需要额外硬件投入并且测量准确等优点,因此具有
近些年来,各种高传染,高致病性公共卫生问题频发,从2014年非洲爆发的埃博拉病毒到2019年底蔓延全球的新型冠状病毒,无一不极大的危害了人类社会的发展以及市民的身体健康。为了获得足够的防护,各种医用卫生用品的需求量激增,据统计,新冠肺炎爆发期间,国内的口罩单日产量可达7600万只,其数量十分庞大,却依旧无法完全满足国内需求。不难发现,在我国口罩等个人卫生防护用品的生产占据着很大的市场,因此围绕着相
比特币的出现掀起了区块链技术的热潮。随着不断的普及和推广区块链技术,其安全问题也日渐引人关注,如果无法保证区块链的安全性能将会影响其未来的应用和发展。Fabric平台的出现,满足了对特定行业的多种多样的需求,并引入了这个领域内的开拓者的经验。但是,fabric在其加密模块的设计上有一个很致命的问题,在最新的1.4版本乃至之前的版本都没有提供一套国产商用密码算法的支持,这将会极大地阻碍fabric在
乳腺癌是妇女癌症中最常见的一种,其中乳腺钙化灶的出现,是存在早期乳腺癌的重要信号。早发现,早诊断,早治疗能够在一定程度上降低乳腺癌的致死率。目前在临床上,进行乳腺癌早期筛查的主要手段是乳腺X线摄影技术,在乳腺钼靶图像中,钙化灶通常表现为较亮的点状区域,但由于钙化灶通常非常小,以及与周围环境之间难以分辨,使得钙化灶特别是微钙化灶的检测对于放射科医师来说,仍然存在一定的困难。同时有经验的放射科医生一般
情感分析是自然语言处理的一个重要领域,传统的情感分析是不考虑文本之间的链接关系的,然而现实世界中我们所分析的文本都是存在一定的链接关系的,例如在社交网络的场景中,我们就能够使用用户和用户的关注关系来获得文本之间的联系,然而一般的在社交网络中进行情感分析的方法却很少利用这些信息,或者是使用用户相似性去衡量文本的相似度。但是这些方法无法区分同一个用户下的不同文本的关注点。针对社交网络中情感分析的问题,
在中考语文能力的评测方式中,作文是最有代表性的测评能力的方式。在对语言能力的考试中,作文更是不可缺少的题型。相比于其他题型,作文占的分值之大使得在它的批改工作上,公平性和客观性必不可少。然而,作文篇幅长、识字困难、教师情感波动等因素导致语文作文的批改工作的难度大大提升。因此,有必要基于现有的人工智能技术和自然语言处理技术,通过对作文人工评卷过程的分析,设计并实现一套有实用价值的中考语文作文评分建议
由于云计算技术的快速发展,信息产业的商业模式也发生了巨大的改变,数据库外包逐渐成为数据管理的新范式。将数据外包到第三方云服务提供商,不仅能够在很大程度上降低企业和个人的成本和计算负担,而且可以提高资源的使用率。然而,第三方云服务提供商并不完全可信,数据在外包存储、管理和对外提供服务的过程中面临泄露、篡改的风险,这使得数据查询结果不可靠。数据库外包所带来的安全和隐私方面的问题已经成为外包数据库更广泛
随着科学技术的高速发展,学术信息爆炸式增长,相当多的学术网站不断涌现。这类学术网站主要关注学者的研究领域、学者间的合作关系等,为人员合作和科研合作奠定基础。由于学术型网站的内容主要是学术论文,如何从论文中抽取属性并进行推理分析是需要解决的关键问题。根据异构学术网络的特点,基于机器学习构建了合作关系预测模型。整个模型包括以下部分:首先,针对异构学术网络丰富的语义信息特点,设计了基于元路径的结构特征抽
移动互联网、物联网、云计算等技术的发展和运用,推动了线上医疗行业的发展。云环境下医疗大数据不仅提高了医疗咨询的精准度,而且打破了地域的限制,给患者就诊带来了便捷。一方面,由于医疗大数据云端存储,云服务器的安全无法保障,另一方面,医疗数据具有很大的研究价值,数据发布必不可少,系统中包含大量患者隐私信息,因此研究如何保护医疗数据保密性以及隐私性有重要的意义。通过现有方案的研究与分析,提出了一种基于云环
随着大数据的盛行以及分布式计算技术的逐渐成熟,运用分布式技术来进行数据的高效分析已成为了各企业的研究热点。近年来,随着内存计算的不断发展,Spark被广泛应用于大数据处理领域。Spark中的任务调度器决定了任务的数据分配以及任务执行路线,能够直接影响整个集群的执行效率。因此,开展对Spark任务调度器的优化研究能够提高Spark集群的性能。分析了目前Spark任务调度器未充分考虑洗牌(Shuffl