【摘 要】
:
随着互联网的迅猛发展和普及,网络已经成为信息传播的主要渠道,人们可以方便的从网络上获得各种信息,但由于信息量巨大,并且网络信息的爆炸式增长,给人们快速准确地获取所需
论文部分内容阅读
随着互联网的迅猛发展和普及,网络已经成为信息传播的主要渠道,人们可以方便的从网络上获得各种信息,但由于信息量巨大,并且网络信息的爆炸式增长,给人们快速准确地获取所需信息带来了很大困难。面对这样海量的信息资源,信息检索越来越显示出其重要性,但原有的检索系统存在一个很严重的问题,对于不同用户查询的相同关键字返回的结果是相同的,并没有考虑到用户的知识背景和用户兴趣。针对在一段时间内需求相对稳定的用户,为满足他们的个性化信息需求,系统必须能快速准确的获得其个人信息,从而使检索系统实现个性化信息服务。个性化信息服务系统通过显式和隐式两种方法最广泛搜集获取用户的信息,根据这些信息构造用户兴趣描述,兴趣描述越准确,系统提供给用户的信息就越符合用户的需求。本文首先讨论和分析了个性化信息服务系统的特点、系统的三种实现方式与所涉及到的关键技术,包括文本自动分词、词性标注、特征提取和机器学习等技术之后提出了系统的整体设计。系统分为四个功能模块——个性化信息收集模块、文本预处理及特征提取模块、用户兴趣模型创建模块和用户兴趣模型更新模块。本文重点讨论并实现了以下三方面内容:特征提取技术、用户兴趣描述技术和用户兴趣训练与更新技术。本系统的特点是在人机交互的基础上实现了模型与用户同步学习,通过训练与更新模块使用户兴趣表示对用户可见,用户通过系统生成的用户兴趣描述直接对其进行修改,使其对自身的需求认识越来越明确,同时用户的操作对系统进行了优化,使系统对用户兴趣的表达越来越准确。
其他文献
基于内容的图像检索技术(Content‐based image retrieval),即CBIR是当前一个热门的研究课题。它的提出能够更高效地解决在海量图像库中找到所需内容的问题。在基于内容的图像检
时间同步是无线传感器网络(Wireless Sensor Network,WSN)的一项关键技术,它为分布式系统提供了一个共同的时间基准,在数据融合、功率管理、传输调度、定位跟踪等方面都具有重要意
在过去的十几年间研究人员对频繁集挖掘进行了深入广泛的研究,取得了一系列研究成果.这些研究成果已被广泛应用到关联规则挖掘、关联分类和序列模式挖掘等具体应用中.频繁集
自动文本分类技术就是对大量的自然语言文本按照一定的主题类别进行自动分类,它是自然语言处理的一个十分重要的问题。文本分类任务的特点之一即文本经过向量空间模型(VSM)表
IP城域网数据流状态的检测和流量控制技术是一门新兴的的流量管理领域技术。随着P2P应用的发展,互联网的控制机制和行为特征也日趋复杂,由此导致了Internet数据传送质量无法
随着医疗成像技术的发展,医学图像被广泛应用到临床诊断和辅助治疗,它可以协助医护人员直观理解组织结构。为了统一不同医疗设备产生的医学图像的存储格式和传输方式的差异而开
随着分布式计算和计算机网络技术的发展,分布式系统的应用及其设计技术成为计算机科学研究领域的热点。分布式实时系统的应用也日益进入人们的日常生活,这些应用包括虚拟现实
本文的写作基于如下的观点和事实:XML只是类型化值的多种表示方法中的一种,软件代理程序可以利用其进行数据互换和互操作,把XML语法视为次要的细节。XML 的Xpath 规范维持原
组态软件是指数据采集与过程控制的软件,可以非常容易地实现和完成监控层的各项功能,并能同时支持各种硬件厂家的计算机和I/O设备,与高可靠的工控计算机和网络系统结合,可向控制
当前我国正在大力普及高等教育,并提倡终生学习和继续教育,而我国目前的传统教育很难满足这一要求。进入90年代,Internet在我国得到了迅猛的发展,对人们的日常生活产生了重大