网络信息提取系统关键技术研究与实现

来源 :中南大学 | 被引量 : 0次 | 上传用户:xz376004565
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,特别是因特网应用的普及,出现了“信息过载”和“信息迷失”的问题。如何管理因特网上的大量信息,提供个性化服务成为当前信息服务领域的研究热点之一。论文主要研究网络信息提取系统中的用户兴趣模型,解决了已有系统不能向单个用户提供个性化服务的问题。论文在分析研究建模技术的基础上,提出了一种由短期兴趣模型和长期兴趣模型组成的混合用户兴趣模型,主要介绍了用户兴趣模型的建立和更新方法。通过在二层树状结构中加入时间向量来精确描述用户兴趣模型,使它不但具有层次性,而且能区分用户的短期和长期兴趣。同时采用层次和划分结合的聚类算法进行文本聚类,提高了聚类效率。为了准确收集用户的浏览行为,通过相关性分析归纳出反映用户兴趣的浏览行为最小组合,并提出基于优化时间窗的兴趣漂移算法来更新模型,它通过分类错误率的显著变化跟踪用户兴趣的改变和通过优化时间窗口处理用户兴趣漂移。系统通过“显式”收集用户浏览内容和浏览行为调整用户兴趣度,建立用户兴趣模型,同时通过基于优化时间窗的兴趣漂移算法“隐式”更新用户兴趣模型。实验结果表明,基于此兴趣模型的网络信息提取系统能对检索结果做出个性化过滤处理,提高用户的查准率和查全率,满足用户的个性化需求。
其他文献
HAZOP(Hazard and Operability Study)中文的意思是“危险性和可操作性分析”,是在化工过程中常见的一种危险性分析方法。它是一种基于引导词的结构化分析方法,将引导词应用
无论在计算机系统硬件设计方面还是在软件设计方面,随着设计规模越来越复杂和庞大,会产生越来越多的设计缺陷和错误等。用一些传统的方法往往是代价很高,但还难以检测出它们。形
纹理的自相似性度量是近年来国内外一个比较活跃的研究领域,在纹理分析、编辑、合成与绘制等计算机视觉、图像处理及计算机图形学领域都占有重要的地位,有着非常广阔的应用前
构件技术是实现软件复用的有效途径,能大幅度提高软件的生产效率、降低软件开发和维护成本、提高软件质量。构件的描述和检索是实现软件复用的关键技术,对解决软件复用、降低软
三维服装虚拟穿衣是一种近年来兴起的三维体验,利用计算机模拟虚拟的场景和服装为虚拟人物着装,达到预览真实服装的效果。在虚拟试衣过程中,最终生成唯美的三维动画是决定服
目前语音网络技术(Voice over Internet Protocol.VoIP)在公司企业里应用广泛,其成本低廉,传输快捷的特点使其逐渐取代传统的模拟电话模式,具有很强的发展潜力。SIP协议是VoIP语
在当今高度信息化的社会中,视力缺陷的残疾人因为其生理上的缺陷,不能像普通群体一样,享受到互联网时代所带来的高效和便捷。网站无障碍改造技术旨在帮助残疾人群体,使他们便
一个完整的测控系统可以分为管理层、控制层和设备层。目前控制层和设备层可以很好的进行集成,但对于控制层和管理层,由于它们使用了不同的协议,影响了两者之间的交互,不方便集成
计算机辅助技术在医学领域尤其在骨科和牙科方面得到了广泛的应用。本文通过将三维模型处理的一些算法应用到骨科和牙科中,来解决骨科膝盖手术治疗中及牙齿隐形矫治遇到的一
实时数据库系统除了用于采集、处理、保存、实时查询工业现场的海量生产数据之外,还利用系统收集的各个重要事件、操作、运行状态和报警信息进行系统错误分析和性能调优,从而