面向用户意图的博文重排序技术研究

被引量 : 0次 | 上传用户:wangdalu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0的迅速发展,博客作为其中一个典型的应用开始被越来越多的人所关注和使用。博文不同于普通web页面,它包含更加丰富的人工标注信息,而这些信息可以随时被博主重新编辑,使得博文的个性化程度很高。博客这种由用户自己自由管理的特点以及博客数量的迅速增加给博客信息的处理带来了非常大的挑战。如何帮助用户在众多的博文中找到符合自己目标的页面成为了当前的一个研究热点。已有的博客搜索的相关研究已经开始着眼于博客的特点来进行博文重排序,但是却很少从用户的角度出发来进行博文重排序,所以得到的重排序结果往往不能够满足用户兴趣,由此带来了面向用户意图的博文重排序技术的研究。本文提出的面向用户意图的博文重排序的研究方法是从用户行为和博文自身的特点出发,以一种特定的聚类和样本选取方式引导用户表达自己的搜索目标,并根据已明确的用户意图迭代地为用户返回结果集页面。本文首先分析博文的主要语义属性,在此基础上详细阐述面向用意图的博文重排序模型,并从整体上描述重排序的过程以及框架。然后,针对重排序过程中的关键算法,分别展开详细阐述。基于语义扩展的博文聚类算法的目标是将符合当前关键字的所有相关结果集进行类别划分,使得划分后的每个类别能够自成一个主题,整体类别划分的效果能够满足“平均”用户的兴趣。在对基于语义扩展的博文聚类算法的阐述中,首先给出整体的聚类过程,然后对聚类过程中的各个细节进行语言以及形式化的描述,并在最后给出基于此算法的实验对比结果和结论。面向用户意图的博文选取算法建立在聚类基础上,它的目标是从聚类划分好的类别中选取出一定数量符合当前用户兴趣的结果页面。该算法依据一些原则实现,首先根据启发式规则构建样本空间,然后以度量函数为标准进行择优选取,整个过程是一个贪婪选取的过程。本文在最后对面向用户意图的博文重排序技术的应用与测试细节进行阐述,并由此证明本文提出的算法的有效性。
其他文献
在语言文字规范化的实践中,影视作品在对方言的使用上,要保证方言的多样性与普通话的主体性的和谐统一。影视作品的方言需规范发展,方言的使用要和作品类型、人物角色以及使
本文以《上海大学生幸福感调查问卷》的数据分析为基础,首次从电脑网络使用和手机网络使用两个层面,考察了网络使用与大学生主观幸福感、社会支持的关系。研究显示,上海大学
<正>复习课是初中数学课堂的重要课型之一,是教师指导学生温习已学过的教材,强化知识,加深理解,使知识系统化,重新再建构的过程。然而,在课堂实践中,复习效果往往不太理想,存
本文将归有光的怀人散文风格定位为平淡,具体阐释了这种平淡风格主要表现在叙述平常事件、表现平常人情方面。归有光在叙事的过程中,注重运用不同的细节描写表现个性化的人物
本文就基于交通法规的智能交通模型主要进行了以下两个方面研究:1、提炼系统实体模型,进行了实体的数据定义。根据此架构可以方便进行违规判断。2、研究了智能公交站点的三级
我国加入WTO以来,高等教育服务市场的国门已经在很大程度上打开。山东省的高等教育服务贸易已经有了长足的发展,但理论研究和实证研究相对滞后。文章运用文献法、统计分析法和
在将赋权理解为权力在社会身份构织的社会结构间的流动,或在权力形态变化过程的基础上,本文对一个藏族村庄的阶层分化,权力集中与资源流动,职业、家庭等社会身份的情况作了呈
实验以硝酸银、硝酸钯为反应原料,采用液相化学还原法制备了主要应用于导电浆料的银钯粉。并通过优化反应条件,对银钯粉的形貌、颗粒大小及尺寸分布、松装密度、振实密度等性
本文结合听力理解基础理论、语言测试理论对中级阶段一次听力测试进行全面分析,进而揭示在影响听力理解的语言因素中构成中级阶段留学生听力难度的主要因素,并提出针对性的教学
理财市场发达国家和地区在金融市场、监管制度共同发展的过程中形成了可供借鉴的经验,突出地表现在强调投资者保护、理财机构受托义务和功能性监管等方面。相应,我国理财市场