文本内容过滤的关键技术研究

来源 :东北师范大学 | 被引量 : 17次 | 上传用户:belive
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪是信息时代,也是网络时代。随着信息科学的进步和因特网的普及,网络信息资源越来越丰富,网上信息呈爆炸式增长。这一方面给用户发现信息、利用信息带来了方便,另一方面,无序、极其庞大的信息世界和成千上万的超级链接,又常常使用户在查找其所需信息时感到力不从心。网络信息过滤,就是根据用户的信息需求,利用一定的工具从大规模的动态信息流中自动筛选出满足用户需求的信息,同时屏蔽掉无用的信息的过程。信息过滤是实现信息的个性化主动服务的前提。个性化服务的实质是针对性,即针对不同的用户采取不同的服务策略,提供不同的服务内容。主动服务的实质是主动性,即系统自动按照用户的信息需求提供相应的服务。个性化主动服务将使用户通过尽可能小的投入获得尽可能好的服务回报。本文从基本概念入手,阐述网络信息过滤的基本问题,包括信息过滤基本原理、过滤系统的一般处理流程、过滤系统的分类、相关信息检索模型以及过滤系统的性能评价指标等。然后,着重对文本内容过滤中涉及的关键技术进行深入地分析和探讨。主要包括中文自动分词技术、文本特征抽取技术、用户需求模板的表示和文本分类技术。在此研究基础上,设计一个文本内容过滤原型系统,并对系统总体框架、功能模块以及系统实现的主要方法进行详细阐述。
其他文献
将现代计算机和网络技术应用于政府机构,实现其管理服务的电子化、自动化、无纸化是当前我国信息化建设的重要环节。互连网发展的日新月异,带动了该领域内应用技术的更新,为
随着计算机中央处理器的运算能力、硬盘储存容量的不断提高和视频采集设备的多样化发展,视频数据也被人们广泛的应用在生活中,人们通过网络来分享各种有趣的视频,使得网络上
随着虚拟现实应用需求的上升,出现了许多关于虚拟现实的建模方法或工具,这些建模方法或工具可以划分为两种:自动建模和手动建模。当前的建模方法还不够完善,自动建模方法缺乏大范
随着移动终端产品的迅速发展,应用程序的复杂性以及用户对界面的要求也越来越高,然而构建用户界面却是费时和昂贵的工作。为了提高用户界面开发的效率,一些支持用户界面自动生成
机器人足球比赛是近年来在国际上迅速开展起来的高科技对抗活动,是把高科技和人们喜爱的足球运动结合在一起的产物,是集机器人学、智能控制、无线通讯、图像处理、机械学等多种
虚拟内窥镜技术是随着计算机技术、计算机图形学、计算机图像处理尤其是虚拟现实等学科的发展而逐步形成的一种独特的技术。它属于医学虚拟现实的范畴,是医学技术在虚拟现实中
SDSM操作系统(Single Data Storage Model Operating System—单一数据存储模型操作系统)结合了传统操作系统、单地址空间操作系统以及永久性操作系统的数据存储模型的特点,
随着国民经济的增长,对煤矿资源的需求日益增加,同时由煤矿深度开发诱发的安全问题亟待解决。微震监测技术能够及时准确地监测出紧急事件发生的位置,而该技术需要有效的微震
在企业信息化建设过程中,各个部门往往根据自身的信息要求和特定的应用系统需求而采用了不同的数据组织模式从而构建了各种异构的数据源。这些独立数据源并不一定遵守一致的
Web服务是新形式的因特网软件,它统一使用因特网协议布置和调用,来自不同服务商的服务被整合以提供一个组合服务。随着Web服务技术日新月异的发展,服务提供者之间竞争的加剧,