在线个体特征识别和行为预测研究

来源 :西北师范大学 | 被引量 : 0次 | 上传用户:wl349682847
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人文社会科学通过人类行为来揭示社会现象和经济现象背后的规律。但受到网络应用不断深入的影响,人类在线行为越来越复杂,其背后隐藏的信息也越来越难以发掘。大数据技术的出现,为这一问题提供了新的解决思路。在线用户行为是人类行为在互联网上的表现方式。通过对在线用户行为数据的收集和分析,可以为政府及企业在决策等问题上提供较为准确的数据支撑,同时也可以为科研人员在研究人类行为时提供理论支撑。本文通过在线用户的点击流数据,结合在线用户的特征以及行为,研究了匿名用户识别问题与用户下一步点击行为预测问题,对影响识别及预测准确率的因素进行了分析。主要的研究内容包括以下两个方面:(1)基于多维轨迹集的匿名用户识别。通过实验验证了在用户的软件点击流数据中包含了用户的行为规律,对比网络浏览数据识别准确率有所提高。提出了一种基于关联规则改进的(Anonymous User Identification,AUI)算法,通过筛选异常数据和减少扫描数据集的次数,降低算法运行的时间成本。同时提出了一种多维轨迹集模型(Multidimensional Trajectory Set,MTS),通过AUI关联算法和向量化方法为每个用户建立独特的多维轨迹集,并结合最大熵自然语言处理方法识别用户。实验表明,MTS模型比基于用户文档的(Support-Based Profiling,SP)算法准确率平均提高5.09%,比C4.5决策树的准确率平均提高10.6%。(2)基于强化学习的用户点击行为预测模型。通过点击流网络构建基准奖励矩阵B-Reward用于分析总体点击行为规律,并通过频繁项集构建权重奖励矩阵W_i-Reward用于分析在特定点击链中的行为规律。结合两个矩阵提出(Combination Matrix Q-Learning,CMQ)预测算法。同时提出了一种基于强化学习的用户点击行为预测模型(Reinforcement Learning-Prediction,RL-P),通过分析影响预测准确率的参数并结合CMQ算法预测用户在当前状态时的下一步点击行为。实验表明,RL-P模型的平均预测准确率为88.28%。随着已知历史点击序列的增加,预测模型的准确率也随之增加,准确率平均提升2.61%。
其他文献
视觉跟踪是计算机视觉领域的一个重要研究方向,现在已经广泛用于军事、医疗、机器人、智能交通等领域。近年来,深度学习技术获得了极大的突破,深度神经网络强大的学习能力为
全卷积神经网络(FCN)的图像语义分割算法不仅能够直接处理任意尺寸的图像,省去繁琐的中间步骤,实现端对端像素级分割,而且提高了分割的准确率。但是全卷积神经网络中的池化层
随着互联网信息技术的快速发展,数字图像的数量显著增长,同时对于数字图像的处理也变得越来越简便,使得各个领域内出现大量的伪造图像,因此,图像的真实性受到人们的严重质疑
近年来,电阻层析成像技术(Electrical Resistance Tomography,ERT)是一项发展比较迅速的技术,具有低成本、无放射性、可视化和非入侵的特点,主要以电磁场的似稳场为理论基础,
中子探测技术被广泛应用在材料勘探、爆炸物的安全检测、环境污染的放射性检测、航天航空、核工业等领域,中子探测技术的广泛应用致使中子探测器也得到了快速发展。但是常用
视频中人体动作识别是计算机视觉领域内长期备受关注的课题,在视频监控、人机交互和视频理解等领域发挥着重要的作用,受到国内外学者的广泛关注。随着大数据时代的到来,视频
中国古建筑是精湛建造工艺与优秀传统文化的有机结合,是中华民族的宝贵财富。在古建筑结构中,木梁是主要抗弯承重构件,长期承受屋盖、楼板传来的积雪、人群等竖向荷载,在上百
国内外研究水流泥沙运动的动床模型中,为满足泥沙运动相似和河床变形相似,模型沙大多选用轻质沙。眼下由于对轻质沙运动理论的认识不够充分,仍无法有效避免在模型试验中出现
一氧化氮(NO),生物体内重要的神经递质分子,生物活性强且广泛存在于人体器官组织中。铜是自然界中广泛存在的金属元素,在生产生活中具有广泛应用。基于NO和Cu2+在生物体内的
微细电火花加工具有非接触、无毛刺、低应力等特点,在微细加工领域中占据重要地位,是微细孔、微沟槽及微三维结构等微小尺寸零件加工中不可替代的一种技术。脉冲电源为微细电