论文部分内容阅读
近年来,随着移动互联网相关技术的高速发展,各种移动应用和服务在规模上呈现出前所未有的增长态势。种类繁多的移动应用和服务覆盖了诸如生活娱乐、在线社交、导航定位等各种功能层面,从而满足了移动用户在日常生活中各式各样的功能需求。与此同时,这些移动应用和服务也产生了海量的用户交互记录与历史商务数据,为研究者深入探索移动商务环境下的潜在价值、开发全新的移动商务应用和服务带来了全新的机遇和挑战。事实上,针对移动商务智能的研究方兴未艾,近年来在国际学术界和产业界均受到广泛的重视。基于以上背景,本文开展了针对移动商务的数据挖掘方法的一系列探索性研究。具体地,结合来自于智能移动应用程序(简称移动App)的新型商务数据,从用户理解、应用理解、应用孵化等三个层面开展了研究工作。基于这三个层面,分别提出了情境感知的移动用户个性化偏好挖掘方法、基于扩展信息的移动App分类方法、面向移动App的排名欺诈检测方法、面向移动App的流行度建模方法、安全隐私感知的移动App推荐方法等探索性工作。具体而言,本文的主要研究贡献总结如下:第一,通过分析来自于用户移动设备的丰富情境日志,提出了一种情境感知的移动用户个性化偏好挖掘方法,从而帮助实现基于情境感知的个性化移动推荐系统。针对情境日志缺乏显式评分、记录稀疏、特征复杂等挑战,设计了一种全新的基于多用户数据的偏好挖掘框架。在此框架下,首先通过对多用户情境数据的分析来挖掘移动用户的公共偏好。然后,将单个用户的个性化偏好表示为这些公共偏好上的概率分布。特别地,根据情境数据建模的需要,提出了两种不同的情境建模独立性假设,并且分别根据这两种假设设计了不同的方法来挖掘移动用户的个性化偏好。具体来说,当情境数据被认为是相互条件独立的,采用概率主题模型对情境数据和用户行为进行建模;如果情境数据被认为是相互依赖的,则采用行为模式挖掘算法和贝叶斯非负矩阵分解的办法来进行建模。最后,在一个真实世界的数据集上进行了实验,实验结果表明本文提出的方法相对于其他基准方法能够更好地为移动用户提供基于情境感知的个性化推荐。第二,通过扩展来自于Web和情境日志的辅助信息,提出了一种自动化的移动App分类方法,从而实现移动用户的行为理解以及移动App的管理需求。针对移动App缺乏必要的上下文信息训练分类器这一难题,提出了一个全新的分类框架。该框架可以利用外部的辅助信息扩充移动App本身稀少的上下文信息,从而使得我们能够对移动App进行有效的分类。具体来说,首先利用Web搜索引擎为移动App扩充必要的文本信息,并且基于此提出了多个有效的分类特征。其次,基于近年来在情境信息领域的研究成果,提出使用真实世界的情境日志来为移动App扩充上下文信息,并设计了多个有效的基于情境感知的分类特征。随后,将提取的各种特征整合到经典的最大熵分类模型中来训练一个高效的移动App分类器。最后,在一个真实的移动App数据集上测试了提出的分类方法,实验结果表明本文提出的方法相比其它基准方法能够更加有效地对移动App进行分类。第三,通过研究来自于在线移动App商店的长期商务数据,提出了一种面向移动App的排名欺诈检测方法,从而发现不良App开发商的恶意刷榜行为。具体而言,首先定义了面向移动App的排名欺诈问题,然后介绍和分析了解决这一问题所面临的诸多技术挑战,例如欺诈时间定位、欺诈自动化检测、欺诈证据提取等等。基于上述挑战,开发了一个全自动化的移动App排名欺诈检测系统。首先通过挖掘移动App在排行榜上的活跃周期来定位排名欺诈可能出现的时间段。然后通过对各个App在历史中的排名记录和用户评分、评论记录进行分析,提取出了三类共七种欺诈证据。进一步,提出了一种全新的非监督证据整合方法来实现最后的排名欺诈检测。最后,使用Apple Appstore中超过两年的App排行榜数据进行实验,结果证明本文提出的方法能够有效地检测出移动App排名欺诈现象。第四,通过整合来自于移动App的多种异构流行度信息,提出了一种面向移动App的流行度建模方法,从而帮助实现多种移动智能服务。目前基于移动App流行度的相关研究十分离散,主要分散在移动推荐系统、移动App异常检测等领域,缺乏一个综合的模型对相关信息和问题进行整合。针对这一挑战,提出了一种基于隐马尔科夫模型的扩展模型对App的排名、用户评分、用户评论等三种重要流行度信息进行综合建模。同时,提出了一种基于二部图聚类的模型参数估计方法,用以实现高效的模型训练。特别地,基于所提出的模型,展示了多种潜在的移动智能服务,比如基于趋势的移动App推荐等等。最后,在两个采集于Apple Appsotre的数据集中进行了丰富的实验,实验结果清晰地验证了本文所提出建模方法的有效性。最后,通过挖掘来自于移动App的数据访问权限和流行度信息,提出了一种安全隐私感知的移动App推荐方法,从而满足移动用户在安全隐私保护方面的需求,并促进移动App产业的健康发展。事实上,现有的移动App推荐系统仅仅考虑评分、下载量等流行度信息,而不考虑其潜在的安全隐私风险,因此很难满足移动用户对于安全隐私保护的需求。针对这一问题,设计了一种全新的移动App推荐系统,用来为用户推荐既流行又安全的移动App。首先,提出了一个扩展性良好的移动App安全隐私风险评估方法,这一方法可以自由整合各种关于安全隐私风险的先验信息,并且不需要任何的显式函数定义。紧接着,根据经济学中的投资组合理论,提出了一种全新的优化方法来实现移动App推荐时在流行度与用户安全偏好上的折中。特别地,进一步设计了一个新颖的数据存储结构App哈希树,用来实现海量移动App在不同类别和安全级别下的快速推荐和管理。最后,在一个采集自Google Play的大规模数据集上进行了实验,实验结果充分地验证了本文所提出的移动App安全风险评估方法,以及推荐算法的有效性。