基于搜索相关性的移动App排序算法及应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:tedloo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,移动互联网发展迅猛,移动用户和移动流量每年都在大幅增长。这主要得益于移动应用(App,Application的简称)的出现。现如今,各大应用商店每隔一段时间就会推出上十万的App,App总量也达到了千万级。应用商店呈现App的方式有两种:搜索和推荐。本文研究前者,用户有明确的搜索词(Query)来描述自己的需求。对于App搜索系统,Query明确地描述了用户的需求,搜索结果对相关性有硬性要求。但是,应用商店为了最大化商业价值,往往更关心搜索系统的转化率。如何在保证搜索相关性的前提下尽可能地提升系统转化率成为业界一大难题。传统的搜索排序主要是基于排序学习(LTR,Learning to Rank的简称)的方法。此类方法以相关性为优化目标,适合网页搜索场景。原因在于网页搜索用户的需求较难满足,相关性的提升会伴随着转化率的提升。但是,对于App搜索场景,用户精确地知道自己想要哪个App,它是个“精准搜索”场景。精准搜索场景的用户需求较容易满足,相关性达到一定程度后,相关性的提升未必会带来转化率的同步提升。同时,精准搜索使得App的大部分搜索流量被包含其名称的搜索词分流了,导致基于转化率的排序方法又会严重影响相关性。本文通过提取App相关性特征和依概率随机激活用户行为序列中的App来解决上述问题。具体研究工作包括:(1)通过对App搜索场景特点的分析,建立了多个App搜索相关性模型。各个相关性模型从不同角度衡量了Query与App之间的相关性,多个相关性模型的组合可以得到更好的相关;(2)将App搜索相关性特征加入基于Deep FM模型框架中,保证排序结果的相关性。同时,使用依概率随机激活的方式对用户行为序列建模,解决了因精准搜索分流现象导致的基于转化率的排序结果相关性不理想的问题;(3)设计并实现了App搜索系统,通过App搜索系统真实运行数据验证了系统和算法的有效性。从真实应用商店中的实验结果表明,本文研究的方法在保证App相关性的前提下,系统取得了很好的转化率表现。既兼顾了应用商店的收益,又不会伤害应用商店的用户搜索体验,适合真实商业场景下的应用商店搜索。
其他文献
心率变异性(HRV)指标数据可以对人体的应激水平(stress level)进行客观评估。当人体处于情绪波动、睡眠不良、压力过大和疲劳状态下都会导致HRV指标降低。反之,当人体处于静息状态并且心血管机能健康时,人体的HRV指标相对较高。本文的主要研究内容如下:通过压电传感器和光电传感器获取人体心率信号,运用信号特征提取算法获得HRV指标,并基于XGboost算法对人体的应激水平进行建模分析。本文的
学位
聚类肽(polypeptoid)是主链结构与聚肽相似的人工合成的生物大分子。其侧链取代基团在酰胺键的氮原子上而不是碳原子上。这使得主链上没有氢键供体和手性中心,消除了主链氢键的相互作用,因此在许多的溶剂中具有较好的溶解性,并且与生物细胞及其组织都有良好的生物相容性以及优异的可降解性。聚类肽的理化性质很大程度上取决于聚类肽侧链种类,通过对侧链的调节,可以改变其物化性质。当两亲性聚类肽嵌段共聚物的侧链
学位
伴随移动网络技术的发展与普及,电子竞技作为体育项目在世界范围内被广泛地接纳,电子竞技直播平台用户规模与日俱增,电子竞技内容社区陆续崛起。电子竞技视频中的关键场景片段在内容社区中备受欢迎,会引起用户点赞、评论和分享等活跃社区氛围的互动。如何从电子竞技直播视频中高效地抽取精彩的关键场景,成为内容社区运营中亟需解决的问题。传统的人工剪辑方法成本较高,无法满足高效运营诉求;基于游戏指令的抽取方法直接而有效
学位
具有1675 mAhg-1的超高理论比容量的锂硫电池(Li SB)被认为是未来最具有竞争力的新型电池系统之一。Li SB所采用的硫(S)正极具有环境友好、储量丰富等特点,使得Li SB既能够满足清洁能源要求也能带来较高的经济效益,这种巨大的优势促进了Li SB在商业上的开发。然而,Li SB的充放电产物多硫化物(Li PSs)的低导电性及穿梭效应,会导致Li SB容量的快速衰减,同时硫正极在充放电
学位
信息爆炸、信息过载引发了信息焦虑,人们越来越难从浩如烟海的信息海洋中找到自己需要的内容,而推荐系统能够较好的缓解这些问题,也因此在越来越多的行业得到了广泛的应用。传统的推荐算法通常是根据用户的历史数据建立模型,学习用户长期的兴趣偏好。然而在推荐的过程中,不仅需要考虑用户的长期兴趣,同时也应该结合用户当前行为考虑他的短期偏好。基于会话的推荐系统能够基于用户的隐式反馈信息,从中“揣摩”出用户的偏好,推
学位
纤维素作为大自然中最丰富的生物质原料,近几年已成为材料和化工领域的研究重点。由分子结构决定的强大的氢键作用使纤维素材料的熔融温度远高于分解温度,因此“溶解-再生”成为主要的加工方法。天然纤维素经过溶剂溶解,水、乙醇等大量反溶剂再生,在相对较短的结晶时间内得到的再生纤维素通常不表现出特征的规整形貌。近几年,伴随纤维素的绿色、高效溶剂——离子液体的开发,人们发现将纤维素溶解到离子液体中,在水等反溶剂存
学位
聚(4-羟基丁酸酯)(P4HB)作为一种生物可吸收材料,能够作为硬脑膜替代品应用于生物体,它不仅具有良好的力学性能、细胞相容性和生物相容性,而且降解时,它不会在人体内积累酸性降解产物。目前已经商业化的P4HB一般通过生物细菌发酵生产而来,但由于细胞内毒素限制比较高,使得其难以在脑脊髓系统中被应用,因此通过γ-丁内酯开环聚合制备的P4HB具有非常高的应用价值。本篇论文着重介绍了化学合成的P4HB纤维
学位
随着移动互联网、物联网等技术和业务的发展,公司项目管理过程中产生了大量的文档,为了提高项目的运营效率、节约人力成本,需要对文档进行快速的分类整理,同时提高文档检索效率。本文主要的工作是基于FastText的项目文档管理分类系统的研究与实现。传统机器学习方法用于文本分类系统时,在分类效果和训练速度等两方面难以达到较好的平衡。以卷积神经网络为代表的深度学习的方法引入文本分类之后确实获取了较好的分类效果
学位
羧基丁腈橡胶(XNBR)具有较好的拉伸强度、撕裂强度、硬度、耐磨性、粘合性、耐油性及抗臭氧老化性能。乙烯-醋酸乙烯酯橡胶(EVM)作为一种极性橡胶,由于含有极性侧基且主链饱和,具有优异的耐热、耐臭氧、耐油和耐候性能。EVM-GMA为乙烯、醋酸乙烯酯和甲基丙烯酸缩水甘油酯(GMA)无规共聚而成的三元共聚物,将EVM-GMA良好的耐油性和耐高温性与XNBR的优异综合性能结合起来,对于新型并用材料的开发
学位
反式-1,4-聚异戊二烯(TPI)有α、β、γ和δ四种晶型,但熔融结晶时仅生成α和β两种晶型。分子结构的对称性赋予TPI良好的结晶性能和高结晶度,使其在橡胶材料(轮胎、减震器材等)和医用材料领域(夹板、牙齿等)得到广泛应用,但同时也存在因基础研究不足而困扰应用发展的诸多问题。譬如,因链构象和链堆砌方式不同,α晶和β晶沿链轴方向的杨氏模量、线性压缩性和体积压缩性均存在差异性。其次,本课题组研究发现纯
学位