论文部分内容阅读
随着移动互联网的快速发展,人们渐渐习惯通过移动端来进行搜索,因此每天产生了大量的用户行为和搜索日志,这些数据就可以用来分析用户的一些共有行为,通过分析就可以判断出用户的需求是什么,同时完善我们的产品,增加移动应用的用户粘性,让更多用户接受和使用,为项目经理在提出项目需求时给予数据支撑。本论文所论述的是通过对无线搜索的线上日志的统计和分析,将一些比较零散的用户行为日志,量化为数字进行统计,再将这些数字串连成用户行为轨迹,通过对大量用户行为轨迹的统计,会大体统计出几种用户行为非常相近的聚类,再根据这些聚类的主要特征分析出产品各个功能用户的使用程度,最后再将这些统计和分析出的数据通过一个软件进行展现。其中对大量日志的处理使用了包括URL防作弊的设计与实现和根据日志运用聚类进行用户行为分析。URL防作弊的设计是将要分析的线上日志中认为干扰分析的内容剔除掉,主要用在搜索功能的日志上。除此之外还采用了一种针对于聚类操作的改进算法,运用这个算法将不同的用户行为进行归类,挖掘出用户的喜好,使用习惯等指标。除此之外,软件还包括数据展现模块部分,它是将在整个用户行为分析过程中的数据及结论分别通过统计端和分析端进行展现,用户行为数据展现软件是将对线上日志进行处理,分类,入库后,将数据根据需求进行展现。通过本论文的研究和软件的设计、实现与测试,并能够运用聚类算法以及分析对用户行为进行深层次的研究,通过研究后的结果在软件上的展现来给予用户需求最直接的反馈,实现了课题的研究目的和对产品新增功能提供数据支撑。