论文部分内容阅读
近年来,随着互联网的迅猛发展以及大数据时代的来临,传统互联网广告投放的粗放性和无目标性弊端越来越明显,使得市场对精准互联网广告的需求变得十分迫切。于是在此背景下诞生了一种新的广告模式—大数据环境下的网络定向广告,即通过一定的技术将广告定向推送给目标用户。而以定向广告为核心的网络广告推送服务也随之而来,虽然学术界目前对其已经取得了一些研究成果,但广告与目标用户失配的情况依然大量存在,如何有效提高推送服务中广告与目标用户匹配的准确度成了一个迫切需要解决的问题。广告与目标用户准确匹配的一个关键在于准确地分析出用户的兴趣点,进而才能向其投放与之兴趣吻合的广告。数据管理平台(DMP)是一个用户数据分析平台,也是整个网络广告推送服务体系的核心,其主要功能是分析出用户的上网兴趣特征。论文将目光集中在该平台中的行为定向广告模块,对其中用户行为特征分析所涉及的一些技术进行了认真研究,包括网页特征词提取技术、相似网页聚合方法、用户行为分析算法等,随后提出在原有相似网页聚合方法的基础上融入一种基于Redis的网页类别判定方法,形成一个旨在提高相似网页聚合准确性的优化策略。其准确性越好,分析出的用户兴趣越精确。该优化策略首先搜集各热门行业的词汇及其行业类别属性,统一建模,建立Redis知识库,然后依据该知识库以及相关判定算法实现对网页特征词的行业类别判定,之后综合所有特征词的行业类别并通过权重值计算得出网页的行业类别,最后将其与原相似网页聚合中用到的向量空间模型和聚类算法等结合,重新定义聚合标准,进而达到提高相似网页聚合准确性的目的。之后又参考该优化策略,将基于Redis的网页类别判定融入到用户兴趣与广告匹配的过程中,同样改善了广告与目标用户的匹配效果。最后,论文设计并实现了数据管理平台子模块,并选取北京交通大学信息中心部分网络日志作为数据源,以网页相似性聚合准确率和召回率、广告匹配准确率和召回率作为评价指标,分别对优化前后的相似网页聚合效果以及优化前后广告匹配效果进行对比分析,之后得出优化后的四个评价指标在一定程度上都有相应提高,最终验证了论文提出的优化方法对提高相似网页聚合准确性以及广告与目标用户匹配的准确度有所帮助。