【摘 要】
:
搜索日志中蕴含海量的信息,利用搜索日志进行挖掘以及分析热点查询内容,对于提高搜索服务的质量有很大的价值和意义。在融合K-means聚类中心迭代优点和查询词向量长度信息的
【机 构】
:
北京信息科技大学网络文化与数字传播重点实验室,北京城市系统工程研究中心
【基金项目】
:
国家自然科学基金项目(61271304), 北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)
论文部分内容阅读
搜索日志中蕴含海量的信息,利用搜索日志进行挖掘以及分析热点查询内容,对于提高搜索服务的质量有很大的价值和意义。在融合K-means聚类中心迭代优点和查询词向量长度信息的基础上,提出SKHC(类K-means层次聚类)方法,并以该方法对搜索日志聚类。然后,分析聚类后的查询用户数、查询频次、查询累计时间、查询数、统计量特征与热点查询的关系,提出基于各类热度值进行热点查询内容抽取的方法,同时融合了日志热度值和倒排日志频率统计特征。通过对抽取出的结果进行统计分析,并和日志所在月份发生的热点事件进行相关性比较,发现
其他文献
财务内控是目前各个企业所普遍关注的一个突出性问题,唯有将其工作水平显著提升,才可以有效确保企业财务健康以及财务应用的科学性。而且,完善的财务内控制度还能够促使企业
本文着眼于现阶段经济背景下房地产开发企业财务成本核算与控制的重要性入手进行阐述,思考以往房地产开发企业财务成本核算与控制环节存在的不足,同时提出能够优化房地产开发
建筑项目施工过程中的造价控制能够提升建筑工程管理效率,实现动态实时管理。建筑工程全过程造价控制是建筑工程项目顺利进行的保障。因此在建筑工程管理中要重视全过程造价控
建筑电气是建筑工程的重要组成部分,对于建筑安全和建筑后期的使用作用显著。因此,人们对于建筑电气工程质量格外关注。影响建筑电气质量的因素很多,但大多可在管理中找到解决办
为了提高频繁项集挖掘算法的准确性,在不确定性数据流频繁项集挖掘算法SRUF-mine的基础上引入最大可能误差,提出一种基于滑动窗口的false-positive挖掘算法UFIM。UFIM算法对
(1)发动机启动后,阻风门全开,加油时发动机熄火.形成此原因是混合气过稀.其解决的办法是:进口的修剪机械可调整油门上的螺丝或化油器右下方的调整螺丝.国产修剪机在油门上的
在实际高光谱图像处理中,目标的先验信息往往较难获得,而非监督波段选择既能很好地完成海量光谱数据降维的任务,又不依赖于目标的先验信息,因而得到了广泛的应用。提出一种非监督波段选择算法:使用光谱信息散度作为相似性准则度量波段间的相似性,采用前向搜索算法作为波段搜索策略,逐步选出信息量丰富的波段集合。实验结果显示,采用该算法选出的波段集合与正交子空间投影算法和多元线性回归等非监督波段选择算法相比,拥有更
盈利能力分析是各个公司财务分析的核心内容,且要做到客观、准确的分析。恒顺醋业作为我国食品调味品行业上市公司,对其盈利能力的分析可以向管理领域的决策提供参考,并产生
<正>颅内静脉窦是静脉汇集的部位,是静脉血回流经过的重要部位,对保障颅内血液流通、血供稳定具有重要作用。现代医学对颅内动脉疾病研究甚多,而对颅内静脉窦疾病研究相对较
随着科技的发展,网络学习已经成为一种大众化的学习方式。然而在实际的开展中,网络学习的过程中却存在着信息超载和资源迷航的问题。智能Agent技术是解决这些问题的很好途径。