基于LDA特征扩展的用户画像

来源 :软件导刊 | 被引量 : 0次 | 上传用户:yelulsww910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用用户历史查询词构建用户画像时,现有向量空间模型存在特征稀疏和上下文依赖性强的问题。针对该问题,通过引入LDA主题模型,首先提取查询词潜在主题,得到查询词对应的主题分布;然后将概率最大的主题对应的词扩充到原始特征空间中,丰富用户特征;最后采用SVM分类算法对用户基本属性进行分类,构建用户画像。实验表明,利用LDA模型对用户特征进行扩展比传统向量空间模型用户画像精度提高了1.6%。
其他文献
红树植物是一类生长在热带、亚热带海岸潮间带的乔木、灌木或草本植物,根据其分布特征可分为真红树植物植物和半红树植物。为了探究两者对海岸潮间带高盐、高光和缺氧等环境
目的探讨cyclin L2基因在化疗药物顺铂(DDP)、5-氟尿嘧啶(5-FU)和多西紫杉醇(Doc)诱导的肝癌细胞凋亡中的作用。方法用肝癌SMMC7721细胞株进行培养传代,MTT试验检测DDP、5-FU
以新疆紫草为原料,乙醇作萃取剂,考察了超声波-微波协同萃取紫草总色素的工艺条件。并采用Cu2+络合纯化方法将萃取所得的总色素水解制备成了紫草素。在超声波功率内置为50W的
基于不同视角和情境特征的大数据定义诠释了大数据的5V特性,在扩展大数据价值空间与应用模式的同时催生了以"数据驱动+模型驱动"范式转变为代表的核心问题。为解决大数据分析
一、诉前财产保全中存在的问题$$必要性审查流于形式。我国《民事诉讼法》第九十二条、九十三条规定财产保全的条件为“因当事人一方的行为或者其他原因,使判决不能执行或难以
报纸
目的探究拔除低位阻生智齿中采取涡轮机联合微创拔牙器械的治疗效果。方法将该院自2018年6月—2019年8月期间收治的76例低位阻生智齿患者采取抽签法随机分为试验组(n=38)与参
为提高大型网络的FlexRay动态段带宽利用率,采用时隙复用的方法对FlexRay动态段消息调度进行优化。在深入分析FlexRay动态段带宽利用率表达式及整体消息最坏响应时间的基础上
中国作为全球第二大电影市场,电影产业链逐渐完善,各种类型电影制作经验也日益丰富。为了用更科学的方法分析我国电影行业发展现状,以统计的435个电影名称为节点、电影所属类
下载量是衡量开源安全软件质量的重要标志。研究下载量与工程因素间的关系,发现影响下载量的工程因素,对于开源安全软件发展具有重要意义。以世界最大的开源软件项目库为数据
2004年1月~2006年1月,我院泌尿外科应用输尿管气压弹道碎石术治疗输尿管结石21例,取得较好疗效,现报道如下。