论文部分内容阅读
现在,越来越多的用户倾向于通过设备来感知信息和通信交流。许多公司因而建立了大量先进的信息管理系统,使用户的学习、生活更加方便快捷。在网络和物理的空间中互动时,用户留下的痕迹被称为“数字足迹”,这些记录正在以前所未有的广度,深度和规模累积着。而这些数据的爆炸性增长,也提供了一个前所未有的机会,使我们可以利用先进的信息技术,自动分析用户行为。此外,对许多互联网企业而言,分析用户的行为也至关重要,因为它可以揭示用户在个人,群体和社会层面上的行为模式,从而运用到各个应用中去。与传统的推荐系统不同的是,由于一些应用本身的特点,这些平台需要将用户的个人能力考虑在内。比如,一个用户想购买一款产品时,除了他自身的偏好之外,还需要有相应的购买力。因此,在做产品推荐的时候,不仅应该考虑到用户本身或是相似用户的偏好,还要考虑到他内在的能力属性与这些产品本身的特征是否匹配。在本文中,首先基于真实世界的用户数据,从多个角度提取属性和行为特征,并对用户数据进行建模。其中,用户数据主要包括了使用产品的一系列记录和移动轨迹。其次,通过这些行为数据的分析,我们能够了解用户的行为模式。基于上述的分析和理解,将能力的因素加入模型中可以进一步提高模型的效果,因为,在对于许多用户参与度高的场景中,能力因素起了非常关键的作用。结合用户的行为模式,同时将个性化的偏好和能力因素都考虑在内,本文提出了新的算法,以此提升推荐的准确率和用户体验。最后,对于任意给定的用户,都可以计算出用户和相关产品的匹配程度,来验证算法的有效性。本文的主要贡献和创新处可以概括为如下几点:·基于在校大学生的行为记录,从经济能力的角度,提出助学金发放的预测方法。具体而言,本文从多个角度观察了学生在校园内的日常行为,从中提取了多源异构的特征。为了更好的理解用户的行为,我们主要从三个方面的数据提取了判别特征:(1)智能卡的消费信息;(2)网络的使用记录;(3)校园内的移动轨迹。首先,在实际观察中发现,类似财务困难的学生会有着相似的表现,另外,通过访问互联网服务的方式(无线或有线),可以推断他是否使用移动设备,这是判断一个人的财务状况的另一个证据;通过整合学生的智能卡使用情况和互联网使用记录,加上进出宿舍的日志,可以提取学生在校园内的粗粒度的轨迹。对于这些轨迹,可以用更前沿的方法来分析特征。最后,通过利用学生之间的相似性关系和助学金(标签依赖)的相关性,来构建具体的算法,将该问题形式化为多标签学习问题,并构建了具体的算法框架,判定其是否需要资金帮助。·基于对多个产品的使用记录,从心理因素的角度,提出用户对新产品接受度的预测方法。这部分研究对于市场营销有着重要意义,也为公司开发新产品提供了用户信息。传统推荐算法通常会直接对相似产品的用户推荐产品。然而,基于实际的观察,我们发现相似产品有着互相竞争的行为,所以,即使对于两款相似产品,用户也会有不同的接受度。因此,本文着重评估了用户的个人偏好和使用习惯,来做个性化推荐。通过数据挖掘的方法,对用户的使用行为进行建模,然后结合新产品的特征,预测了用户对新产品的接受度。·基于用户的音频记录,从唱歌能力的角度,提出符合用户声音的歌曲推荐算法。与传统的音乐推荐不同的是,在线唱歌有其独有的性质,比如,唱歌系统会对用户的表现做出评价,选择与自身声音相匹配的歌曲,有助于获得较好的评分。因此,当用户选择一首歌曲时,他通常需要考虑歌曲的难度与自身的声音是否相匹配。基于音域分析的技术进展,我们首先从多个角度进行了特征提取。在处理了翻唱信息后,这些音频被重新进行了编码,以此可以解析了用户的声音能力。最后,本文将用户的偏好和声音特征联合建模,并对这些翻唱的评分进行预测,帮助用户选取更适合自身能力的歌曲,从而有较好的得分和用户体验。