【摘 要】
:
由于搜索引擎中用户数据的不完整性,导致在构建用户画像时标签缺失,提出预测多维用户标签的Stacking模型融合方法,以预测用户画像的三个标签为例,进行实验和分析。该模型为两
论文部分内容阅读
由于搜索引擎中用户数据的不完整性,导致在构建用户画像时标签缺失,提出预测多维用户标签的Stacking模型融合方法,以预测用户画像的三个标签为例,进行实验和分析。该模型为两层结构,第一级模型中使用TF-IDF算法提取用户搜索词特征并用多分类器训练,同时将Doc2Vec模型构建具有关联信息的文本特征并用BP神经网络训练,第一级模型的输出作为第二级模型的输入,用SVM支持向量机进行分类和预测,得到用户的标签信息。实验用该模型与传统模型进行了实验对比,证明该模型在搜索引擎数据的用户标签预测任务中有较高的准确率。
其他文献
玉环柚是玉环县的传统名果,已有130多年的栽培历史.自1982年以来,玉环柚连续8次荣获全国柚类评比桂冠,连续三届在农业部举办的中国国际农博会上夺得金奖,1996年玉环县获"中国
通过对网络化制造的内涵及东南大学网络化设计与制造平台的研究,对CAXA系列软件在网络化设计与制造中的应用进行了探索研究。利用CAXA提供的软件平台在网络化设计与制造实验室
本文以粮食主产区黑龙江省的农业大县巴彦县为例,通过对200户农户的实际调查走访,得到县域农村金融市场金融供给和金融需求基本情况,探讨了农村金融供求主体借贷行为及其影响因
慢性中性粒细胞白血病(CNL)是少见的慢性白血病,病程较长,程度较轻,诊断较复杂,易与其他类型的白血病和类白血病反应相混淆。白细胞数、中性成熟粒细胞持续明显增多,可见少数幼稚粒
针刺麻醉在肛门病手术术中、术后镇痛作用令人满意,针刺麻醉可以减少麻醉药物用量,延长术后镇痛时间,在肛门病手术中与传统麻醉方式比较有明显优势,现总结如下。
指出本世纪企业组建基于网络的虚拟企业的必要性,介绍了虚拟设计和虚拟制造技术,分析了互联网在虚拟设计和制造技术中的地位和作用,并对市场中虚拟企业的组建、工作及解体等
插值广泛应用于医学成像和图像多维重建中。本文首先对传统插值方法中基于形状的插值和弹性匹配插值作了比较深入的介绍 ,然后分析了旋转扫描超声心脏图像插值方法的特点、难
为了探索龙牙百合种球大棚营养钵基质繁殖技术,解决生产上种球繁殖周期长,种性退化,抗病能力差的技术难题,于2010~2013年进行了龙牙百合种球大棚营养钵基质繁殖试验研究.结果
本文通过电势教学设计,阐述了如何把握课堂教学的几个关键环节,如何深入浅出让学生更易理解内容。
基于SPOT和TM融合遥感影像和GIS技术,采用通用土壤流失方程RUSLE作为评价模型,计算了庆城项目区土壤侵蚀量,并结合土壤侵蚀强度分级标准,生成流域土壤侵蚀强度等级图。结果表明,项