一种用于构建用户画像的二级融合算法框架

来源 :计算机科学 | 被引量 : 0次 | 上传用户:liu_mi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作是给用户贴"标签"。基于用户的查询词历史记录,提出一种用于预测用户多维标签的二级融合算法框架。在第一级模型中,分别在各个标签预测子任务上建立多种模型,使用传统机器学习方法与Trigram特征相结合来抽取用户用词习惯的差异,使用doc2vec浅层神经网络模型来抽取查询词的语义关联信息,使用卷积神经网络模型来抽取查询词之间的深层语义关联信息。实验表明,doc2vec在处理用户查询这样的短文本相关任务时有着相对较好的预测准确性。在第二级模型中,针对用户画像这样的多标签预测任务,使用XGBTree模型及Stacking多模型相融合的方法提取出用户各标签属性之间的关联信息,使得平均预测准确率进一步提高了2%左右。在2016年中国计算机学会(CCF)组织的大数据竞赛《大数据精准营销中搜狗用户画像挖掘》中,所提二级融合算法框架在894支队伍中夺得了冠军。
其他文献
目的探讨类风湿性关节炎(Rheumatoid arthritis, RA)患者与体检健康人外周血T淋巴细胞亚群、B淋巴细胞及自然杀伤(NK)细胞的频率分布及临床意义。方法收集2018年1月-2018年5
<正> 李××,女,26岁,四川人,公社社员。产后十三天,突患高热,体温39~40℃,头昏耳鸣,寒热往来,出汗多,面赤心烦,食纳不进,便秘十三天,曾用西药解热剂和抗菌素输液等,治疗一周,
针对我国垄作栽培的草莓采摘以手工方式进行,不仅效率低,还需果农弯腰或蹲着采摘的问题,研制了便携式草莓采摘工具,主要由草莓采摘剪和草莓运输车组成。草莓采摘剪主要由手柄
传统工业时代的时候,企业靠的是工人通过劳动力来获得报酬,建筑施工企业也是一样,而现在进入了知识经济时代,企业不仅仅是只有工人这个层面,知识型员工的出现为企业发展提高
脑死亡及其法医学意义谷振勇,韩业兴综述脑死亡(BrainDeath)是1968年才明确提出的现代死亡概念[1]。脑死亡不仅是医学、法医学的重要课题,还涉及法律、哲学及伦理等多学科,引起世人瞩目。作者就脑死
关于犯罪实行行为危险性的判断问题,历来争议颇大,相继有纯粹的主观说、抽象的危险说、具体的危险说以及客观的危险说、修正的客观危险说等对这一问题进行讨论。本文在深入研
<正>2006年12月,俄罗斯远东国立大学孔子学院正式揭牌成立。这是我国在俄罗斯联邦开设的第一所正式运营的孔子学院。经过中俄双方的共同努力,学院在几年的运营过程中,取得了
19世纪中期,安徽基层社会兴起了捻军与淮军。这两种原本对立的政治力量,在以宗族为背景、为基础方面,却全无二致。本文以此为出发点,进一步审视安徽基层社会的宗族势力及其与上层政
通过分析中等职业学校操行分管理的需求,设计学生操行分管理系统,使用VBA编程技术在Excel 2007环境下实现学生基本信息的导入、学生操行分的合并,以及学生处分表的生成与打印
电视摄像在科学发达的现代社会已经不再是神秘的事物,随着人们生活水平的提高,中、小型摄像机已经逐步走进千家万户,用摄像机来记录生活、工作中的点点滴滴已经成为一种时尚,