基于社会化标注信息的个性化检索方法研究

来源 :湖南科技大学 | 被引量 : 0次 | 上传用户：yanjiawei2005

【摘要】

：

随着互联网技术的发展和信息时代的到来,海量数据呈现在人们面前,如何从如此浩瀚且日益增长的数据中快速而精准地获取用户所需要的信息,一直是信息检索领域中研究的关键问题

【作者】

：

吴谈

【出处】

：

湖南科技大学

【发表日期】

：

2004年期

【关键词】

：

信息检索个性化检索社会化标注用户兴趣偏好词向量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的发展和信息时代的到来,海量数据呈现在人们面前,如何从如此浩瀚且日益增长的数据中快速而精准地获取用户所需要的信息,一直是信息检索领域中研究的关键问题。在信息检索的过程中,查询词通常具有简短、概要以及不明确的特点,无法准确表达用户的查询意图,从而导致检索结果不精确。此外,由于用户的背景和需求存在差异性,传统的检索模型由于其通用性已无法满足不同用户在条件相同情况下的不同需求,难以得到因人而异的检索结果。近年来,由于社会化标注系统的出现以及个性化思想的提出,不少学者开始探究将社会化标注运用到个性化信息检索中,其有效性已经得到了很好的验证,但仍存在着一定的改善空间。本文主要探究如何更加高效地利用社会化标注信息来改善个性化信息检索的效果。用户利用标签对网页资源进行标注的行为通常代表了用户对于网页资源的见解,同时这些标签信息也可视为网页内容的有力扩充,利用它们对文档的个性化得分进行扩展,是现有个性化排序方法中一种常用的手段。但在现实中,一方面出于一些隐私保护机制,用户所标注的网页及其使用的标签极为有限,数据稀疏的问题在社会化标注系统中经常出现,这无疑给个性化信息检索带来了一定的困难;另一方面,用户的兴趣各异,对不同网页的偏好程度也不尽相同,而在已有的个性化排序方法中,并未过多考虑到用户与网页内容之间的关系,导致计算的文档个性化检索得分并不准确。基于此,本文在前人研究的基础上,主要有以下两个方面的贡献:(1)本文提出了一种结合词向量技术和用户相似网络的个性化排序方法。该方法首先利用用户共同标注过的网页构建用户相似网络,使相似用户的判断更为准确。之后为减少社会化标注信息稀疏性造成的影响,利用用户相似网络找出相似用户,对用户在不同文档上的标注信息进行扩充,以提高用户个性化得分部分的准确性。其次,考虑到词与词之间可能存在的语义联系,利用词向量技术将词转化为更细粒度的表现形式,使得语义相似的词语在该向量空间中距离更近,在查询信息与网页内容扩充部分进行匹配得分时,可以有效提高这部分得分的准确性。最后结合二者更新文档排序得分,得到更加精准的个性化信息检索结果。实验验证了该方法对于个性化信息检索的准确率有一定的提升,可以改善用户的检索体验。(2)针对当前个性化信息检索中没有充分考虑到用户与网页内容之间关系的问题,在前一步工作的基础上,尝试利用已有的社会化标注信息,挖掘出社会化标注系统中用户、标签及网页资源三者之间的关系,引入用户对网页内容的偏好信息,提出了一种融合用户兴趣偏好的个性化排序方法。该方法首先对网页资源进行分类,将不同类别的网页资源分开,然后通过构建用户兴趣模型计算得到用户对于不同类别网页的偏好程度,再利用得到的偏好程度对网页资源进行个性化处理,从而更好地改善信息检索的效果。在真实实验数据集上的实验表明,本文所提的方法能较好地提升个性化检索结果的准确率,从而提高用户的满意度。

其他文献

一道立体几何课本例题的变式教学设计

<正>变式教学是对数学中的问题进行不同角度、不同层次、不同情形、不同背景的变式,以暴露问题的本质特征,揭示不同知识点间的内在联系的一种教学设计方法．变式教学使一题多用

期刊

平面内内在联系变式教学平面外

智慧学习环境下大学生创造力培养模式探究

创新意识、创新方法和创新创造能力的培养,将成为决定一个国家发展命运的关键因素。智慧学习环境是将新一代信息技术全面融入学习环境中的高级形态,探究智慧学习环境下大学生

学位

创造力课立方OBE人本主义活动设计理论

朱文藻之《金鼓洞志》编撰特点论略

朱文藻是一位浸染于乾嘉考据之风的学者兼作家型人物,他的这种特质在《金鼓洞志》的编纂中得以体现。《金鼓洞志》以鹤林道院为轴心,叙考了清代全真教龙门派金鼓洞支派的发展

期刊

朱文藻《金鼓洞志》鹤林道院编撰特点乾嘉学风

S公司定制家居服务管理改进研究

随着制造智能化、柔性化的发展,产品同质化程度越来越高,传统的成品家居大规模制造已经满足不了市场客户的个性化需求,根据客户需求进行家居产品定制,已经成为家居制造业转型

学位

客户服务服务管理评价体系考核管理管理改进

王夫之气论研究

对“气”的强调是王夫之哲学思想的重要特点。本文从探究王夫之气论的思想来源出发,重点研究其本体论、宇宙论、人性论等哲学思想。王夫之气论的思想来源主要有两个:一是易学

学位

王夫之气论本体论宇宙论人性论

冷冻胚胎复苏移植女性不孕症患者心理健康现状及其干预研究

[目的]评估冷冻胚胎复苏移植女性不孕症患者的心理健康现状,探究可能影响其心理健康状况的因素;并评价实施不同心理健康干预方案对冷冻胚胎复苏移植女性不孕症患者的治疗结

学位

冷冻胚胎复苏移植女性不孕症心理健康90项症状自评量表心理干预

鸽子位置细胞功能网络对目标导向行为的信息编码机制

空间位置感知和运动导航是大脑的基本功能,对于动物的生存至关重要。自然界中生物大部分空间导航行为都是目标导向的,比如觅食、归巢、求偶、迁徙等等。目标导向行为神经机制

学位

鸽子目标导向行为位置细胞神经元功能网络信息编码机制

数学思想方法在中学数学教学中的应用例谈

新课程改革中,数学思想方法的培养成为现在教学的关键所在,也是学生学习数学基础知识的重要组成部分,成为学生学习知识和解决数学问题的指导思想。那么本文将在对初中教学的

期刊

数学思想方法化归数形结合分类讨论函数方程

G20峰会,让我们的城市更美好

<正>G20对于杭州来说,是一次城市基础设施发展速度的腾飞。2016年的杭州,注定要翻开新的一页。自从国家主席习近平在土耳其安塔利亚宣布将于2016年9月在杭州举办二十国集团领

期刊

武林广场G20

常规微溶性气体杂质对结晶过程影响探究

结晶过程中杂质的存在是难以避免的。溶液中存在的杂质不仅会影响溶质在溶液体系中的热力学性质,也会影响结晶成核与晶体生长等动力学特性。杂质的概念较为广泛,在通常结晶过

学位

微溶性气体杂质七水硫酸镁溶解度生长动力学

基于社会化标注信息的个性化检索方法研究

与本文相关的学术论文