面向博客的个性化检索系统的设计与实现

来源 :天津大学 | 被引量 : 0次 | 上传用户:qleeanna
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着Internet的飞速发展,博客系统作为一种社会性软件,在互联网上得到了广泛的应用,同时Internet上的各类信息资源和博客用户群也在迅速激增,面对互联网上丰富的信息资源,针对博客用户的个性化信息服务越来越成为信息检索领域中研究的热点,而博客系统中的数据检索存在两方面不足:一方面基于简单的关键词匹配来推荐信息,不能准确的挖掘用户的兴趣偏好,另一方面在博客标签中不提供关键词检索,使个性化标签在博客检索中没有发挥真正作用。因此基于博客系统的个性化推荐服务技术的设计与开发成为广大博客用户急需的产品。本文提出面向博客用户的个性化检索方法,该方法使博客用户在检索信息时借助于搜索引擎来满足用户的意图,传统搜索引擎是一个面向大众的没有体现个性化的检索工具,由于博客中的用户标签可以反映用户的兴趣,所以在搜索引擎中应用博客标签来实现博客用户个性化信息检索。综合利用内容过滤和协作过滤两种技术的优势,建立了基于博客的个性化搜索引擎系统的体系结构。为此首先利用博客用户标签建立用户模型,然后为了动态跟踪用户的行为,挖掘用户隐含兴趣,根据用户聚类的算法计算相似用户群,建立用户群兴趣模型,基于该两种用户模型本文提出了多级常规索引方法,将模型中的兴趣标签作为搜索引擎的关键词进行多次反复迭代过滤匹配,从而为博客用户提供个性化的检索服务。在上述工作的基础上,设计和实现了面向博客的个性化检索系统。该系统很大程度上克服了目前博客检索中存在的不足,克服了传统搜索引擎技术上的缺点,使该系统能够深层次挖掘用户兴趣,迎合用户偏好,实现对博客用户在搜索引擎中的个性化推荐服务。
其他文献
随着Internet及其相关技术的飞速发展,网站安全问题也越来越突出,网站发布前的安全测试,能测试和修复可能存在的安全漏洞,有效防止攻击,无疑是网站安全防范非常有效的方法,安全测试
煤矿安全信息是一种活跃的、动态变化的与空间位置密切相关的信息,其预测和防治研究是一项系统工程,所涉及的数据信息量十分巨大,科学、高效、实时的对安全信息进行系统管理备受
随着主网自动化的逐步成熟,配电网自动化也从之前的试点逐步过渡到现在的推广阶段。由于国家一直没有推出相应数据模型标准,因此各地情况不尽相同,但随着IEC61970标准在我国电力行业的逐步推广,数据和模型的统一成为必然趋势。数据标准的统一为之后基于这些在线和离线数据进行分析的配网高级应用软件打下了良好的基础,本文就将基于该标准设计实现一个高级应用软件的公共数据平台。本数据平台采用三层架构,分为数据存储
草图识别系统往往使用多个识别器并行识别,它们的识别结果整体通常是不一致的。对草图识别结果之间的不一致性进行建模和处理是一个很困难的问题。基于Agent的草图识别方法把
随着信息技术的不断发展与高等教育规模的快速增长,各高校都相继建立了自己的教务管理信息系统,这些信息系统的使用,很大程度上提高了教务管理的水平,而且积累了大量的教学运
随着计算在科学研究和实际应用中发挥越来越大的作用,许多课题需要由大容量、高速度的计算机系统来完成。并行技术是当前高性能计算机发展的最为现实的道路。 并行机内部
心电信号的自动分析诊断技术,是通过模式识别方法来提取心电信号中的有效特征,并给出辅助结论,从而帮助医生更加快速准确地给出诊断结论,提高诊断效率并减少误诊率。传统的心电信
近年来,表情识别技术作为一种新型的人机交互方式,受到了越来越多研究者的关注。本文对国内外现有的人脸表情识别技术和方法进行了分析,在比较现有的表情识别方法的基础的上,在针
可信赖性已形成较为成熟的理论体系,是度量各种分布式系统服务质量的重要指标。随机Petri网(Stochastic Petri net,SPN)对系统的并发性、异步性和不确定性具有很强的动态分析
主观试题自动批改技术作为自然语言理解中重要课题之一,对于学生自侧作业、大规模在线考试方面具有非常重要的意义。目前针对客观题的自动批改技术己经相当成熟,但是,对于论述、