数字图书馆个性化中文文本信息服务系统研究

被引量 : 0次 | 上传用户：zhaoshi88

【摘要】

：

Internet极大地扩展了用户的信息获取范围，WWW更以其超强的链接能力将各种信息组织成为一个巨量的信息空间，世界各地的各类信息服务机构纷纷利用它开展信息交流与传递工作，人们

【作者】

：

王艳

【发表日期】

：

2003年期

【关键词】

：

数字图书馆个性化信息服务中文信息处理用户模型 Web 数据挖掘

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Internet极大地扩展了用户的信息获取范围，WWW更以其超强的链接能力将各种信息组织成为一个巨量的信息空间，世界各地的各类信息服务机构纷纷利用它开展信息交流与传递工作，人们可以通过网络快捷方便地获取各种信息。长期以来作为信息集散地的图书馆，面临着极大的挑战，因此，传统图书馆凭借自身的资源、组织、技术等优势，利用网络这一强势平台开展服务，向数字图书馆嬗变。然而近年来的数字图书馆建设，单纯重视数字资源的建设和组织，忽略作为信息使用主体的人的感受，使得用户查找信息困难，陷入“被信息淹没，却饥渴于知识”的困境。事实上，与个人兴趣相关的信息领域，相对于广袤的全局信息空间而言，永远只能算是一个狭小的范围，在全局信息空间中信息实体对每个用户都是等距的，用户难于获取与己相关的信息。因此，发展个性化信息服务，按照特定用户的特定信息需求，为其提供特定的信息内容和服务成为目前的研究趋势之一。个性化服务以用户为中心，其关键在于分析用户的信息行为及需求特征，记录和推导用户的潜在兴趣偏好，并根据用户兴趣主动推送相关信息。基于这种背景，论文在分析已有个性化信息服务系统的基础上，引入用户建模技术、Web数据挖掘技术和协同过滤技术，针对中文文本自身的特点及由这些特点带来的信息处理的特殊性，构建了一个数字图书馆个性化中文文本信息服务系统，力图在用户的最小努力下，为其提供更多、更贴近其需求的信息。论文首先论述了数字图书馆信息服务的研究背景及现有个性化信息服务系统的研究现状和存在的不足，提出了本系统的解决思路；在此基础上，对与系统研究相关的理论和方法进行研究和分析；接着，论文分析了本系统研究对象的特点，并基于这些特点提出了系统所应实现的目标和系统的概要设计。第三章是论文的重点，论文在前述分析的基础上构建了系统核心部分（个性化服务）的工作模型，并阐释了其中各模块的功能，之后分节详细说明了各模块的工作过程。在文档特征表示中，为了深入内容层次揭示文档特征，本系统利用中文信息处理技术对文档进行分词处理，并借助主词典、同义词典和蕴涵词典解决汉语的语义问题，将每篇文档用主词典中的统一的、规范的词条表示威特征向量，将语义转换为可以进行数学运算的形式。在用户建模中，系统从三方面获取用户信息需求特征，第一，用户主动地向系统提供需求信息；第二，系统检测用户检索行为，从用户检索词分析其需求；第三，系统通过分析Web访问日志，得到用户的兴趣所在及兴趣的变化状况，并进一步利用对用户访问文档内容的分析来追踪其兴趣变化，将用户兴趣同样表示为兴趣特征向量，聚类相似用户。与以往系统不同，系统无需用户直接反馈，而是通过其对文档的访问频度、驻留时间及操作行为等来隐式获取用户的评价信息；同时，系统也利用用户候选兴趣特征向量来记录和累计用户潜在的、非主要的兴趣的变化过程，精度更高。在推荐引擎中，系统采用混合推荐方式，一方面利用用户的兴趣特征向量和文档的特征向量进行相似度比较，另一方面利用相似用户的信息测览情况为当前用户推荐潜在有用的信息，并针对用户和页面分别进行推荐。在检索引擎中，系统利用用户模型扩展用户查询，将与用户兴趣相关信息提供给用户而屏蔽不相关信息，减轻了用户构造复杂检索表达式和选择信息的负担，也提高了检全率和检准率。最后，论文做了一些相关实验，并对当前工作作出总结，提出了进一步的改进意见。

其他文献

自发电池激发的电致化学发光的分析应用研究

本论文由综述和研究报告两部分组成。综述部分简单概述了电致化学发光的历史、原理、电致化学发光体系、电致化学发光近期的进展以及电致化学发光仪器的微型化趋势。研究报告

学位

电致化学发光自发电池微电池流动注射

证券欺诈民事责任研究

有证券市场就必有证券欺诈行为。证券欺诈行为在我国一般是指内幕交易、操纵市场、虚假陈述、欺诈客户四种行为，这几种欺诈行为在我国证券市场都大量的存在着，其危害性巨大。一

学位

证券欺诈民事责任

试析两宋时期盟约的制定与履行

在10世纪~13世纪,两宋与辽、西夏、金、蒙古等周边政权多次通过缔结盟约的方式确定彼此的权利义务关系,这一时期的盟约在很大程度上对缔约双方都有约束力。在围绕盟约展开的

期刊

两宋盟约签订履行誓词

人民币升值对进出口和通货膨胀的影响

截止2014年1月30日,人民币对美元的汇率为1美元等于6.0581人民币元,这一态势意味着人民币对美元的汇率在加速朝着"5"时代进军。本文选取自1999年1月到2013年9月的月度统计数

期刊

人民币升值协整检验脉冲响应VECM模型

儿童哮喘与情志因素的相关性研究

期刊

儿童哮喘情志因素哮喘患儿哮喘儿童父母养育方式评价量表家庭养育方式心理社会因素社会生活能力量表相关性研究

白藜三醇及国产红葡萄酒抗动脉粥样硬化作用的实验研究

研究背景：流行病学研究提示：饮用适量红葡萄酒比饮用其他酒精饮料，能更大程度地减少缺血性心脏病的发生率和死亡率，提示红葡萄酒具有心脏保护作用。国外进一步的研究表明，红葡萄酒

学位

白藜三醇红葡萄酒高胆固醇血症动脉粥样硬化内皮功能一氧化氮内皮素血栓烷血小板聚集诱生型一氧化氮合酶

司法中的民意考量

民意,作为非政府社会公众对于公共事务或现象的一种表达,随着社会言论自由的发展程度越来越多地参与到社会问题的决策中。近年来,其在法律范畴上对于法律制定和判决的影响越

期刊

民意法律效果社会影响

第14届世界男子篮球锦标赛上中国男篮进攻速度研究

攻守对抗是篮球运动发展的内部动力。比赛双方在同一场地上、规定的时间内进行着心理、技术、战术等全方位的对抗，其中速度的竞争是很重要的一部分。在强对抗、高速度的基础上

学位

中国男篮14届世锦赛进攻速度

血管紧张素转换酶抑制剂的分子设计

目前,高血压已成为严重危害人类健康的主要疾病之一。在医药市场的药物销售种类中,心血管药物占18%。有调查结果表明,自建国以来,全国高血压患病率不断增加,目前仍呈上涨趋势

学位

计算机辅助药物设计血管紧张素转换酶抑制剂受体配体分子对接

长城汉语课堂教学模式设计与研究

为了适应国际上学习汉语的迫切需要,我国的汉语国际化推广也正在发生着一些重大的转变,对外汉语教学进入了一个快速发展的阶段,原有的教学模式已经不能适应新形势下的教学需

期刊

长城汉语课堂教学应用模式

数字图书馆个性化中文文本信息服务系统研究

与本文相关的学术论文