基于用户兴趣的协同过滤算法的广告推荐研究

来源 :昆明理工大学 | 被引量 : 4次 | 上传用户:chino80
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网科技发展迅猛,互联网信息繁杂,如何针对特定兴趣的用户投放相关广告,提高广告回报率是目前学术界及商界关注的焦点。本文首先分析挖掘某大学城交友网站用户网络行为,然后改进协同过滤算法的预测和推荐机制,依据协同过滤算法预测用户兴趣及广告投放模式,并对其二者建立映射关系,从而达到针对具体用户投放更为精准广告的目的。本文研究工作主要包括数据获取与分析、用户兴趣模式提取、协同过滤算法改进和广告推荐验证。为使用户兴趣提取更精准,数据获取与分析是关键。本文的数据源采用静态和动态两部分;静态数据来自某大学城交友网站的注册信息,为保证静态数据的可读性,采用数据降噪技术,剔除无效字符、符号、语气词等;动态数据主要来自于网站后台记录的用户行为日志以及通过设计自适应含网页相似度多线程主题网络爬虫爬取的网页数据并进行分词,采用基于有向无环图(DAG)和动态规划最大概率提高分词精准度,采用压缩Trie树结构存储分词便于词语匹配,提高用户兴趣模式提取的效率。用户的兴趣模式提取工作分别从静态数据和动态数据出发,基于静态数据的规则性,使用N叉树结构的点存储处理后的静态数据,叶节点的父节点以及其它所有的非叶节点中存储进一步抽象化兴趣信息,利用关系树查找算法计算用户的兴趣属于N叉树中的哪一类兴趣集以初步提取用户的兴趣。动态数据部分在经过数据分析阶段的一系列处理后采用基于词频的策略提取用户的兴趣。本文在协同过滤算法的预测阶段,为了使预测结果更加精准,在预测阶段加入了用户兴趣模式,而不是简单的通过用户在本体网站的点击记录来预测用户对广告的点击率。采用回归的预测值计算方式来消除用户打分的惯性行为对预测结果准确性的影响。通过使协同过滤算法预测阶段数据源多元化,提高了算法就预测用户点击广告的精准度。针对以上的所有研究分析工作,编写了网络爬虫软件以及推荐系统,且将推荐系统应用于某某大学城交友网站上。实验证明,本论文的网络爬虫软件较其他常规爬虫软件具有较高的性能,爬取的网页与用户的关联度较大;推荐系统推荐的商品与用户的兴趣较为接近。
其他文献
人类社会发展过程中的每一次进步,无不是由创新所推动的。进入21世纪,随着经济全球化的发展,创新在经济和社会的发展中起到更为重要的作用。我国政府对此也高度重视,甚至将创
党员干部现代远程教育是信息化时代背景下,以使党员干部经常受教育、农民群众长期得实惠为目标实施的一项党员干部教育现代化、信息化工程。党员干部现代远程教育能进一步提高
目的:探索研究“补中益气加味汤”预防和治疗腹腔镜下腹膜外腹股沟疝修补术(totally extraperitoneal prosthetic, TEP)术后并发症的应用价值。方法:选取我科自2013年2月至2014
目的:观察具有补肾健脾活血之功效的芪贞降糖颗粒对糖尿病合并骨质疏松症胰岛素信号通路相关因子IGF-1、IRS-1、IRS-2mRNA表达的干预作用,从中医理论整体论治和分子生物学水平
改革开放以后,我国的中小型民营企业如雨后春笋一般涌现出来。现在我国企业面临着全球化与国内社会经济转型所带来的双重挑战,面对这些挑战中小型民营企业相对于大型企业和国营
研究目的:建立心肌缺血再灌注模型,观察尼可地尔对大鼠急性心肌缺血再灌注后无复流范围及心肌梗死范围的影响,评估药物对心肌损伤及纤维化程度的影响,并比较其与腺苷治疗作用
21世纪我国的社会经济快速发展,而传统的农业灌溉方式造成了大量的水资源浪费。随着我国人口数量的快速递增,粮食需求的增加以及城市化和工业化的发展,水资源的缺乏已对我国
目的:猴耳环(P. clypearia Benth.)是豆科(Leguminosae)含羞草亚科(Mimosoideae taub.)猴耳环属(Pithecellobium Mart.)植物,多为灌木,俗名又叫围涎树,在民间又叫婆劈树、鸡心
随着科学技术的发展和市场经济的建设,我国权威人格形成的家庭、社会环境发生巨大变化,但在此过程中,仍受到两千多年的封建专制制度和儒家文化的影响。因此权威人格在现当代大学
1.研究背景和目的虽然全球癌症总的发病及死亡率显出令人鼓舞的下降势头,但是,胃肠道肿瘤仍是一种顽固的癌症,其中大约2/3发生在发展中国家。中国的胃肠道肿瘤发生数占到了全