Internet信息过滤Agent的研究和实现

来源 :广东工业大学 | 被引量 : 2次 | 上传用户:wenhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的飞速发展,网络上的信息呈指数增长,其内容之丰富,种类之繁多堪称世界上最大的图书馆,如何有效地查询到符合用户兴趣的内容,关系到我们能否充分利用这个巨大的信息资源的问题,也是本文的研究目标。在此我们采用了多种机器学习方法和Agent技术,旨在开发一种具有智能性、主动性、高效的信息过滤Agent。本文主要研究内容为以下两个部分:信息过滤系统和兴趣学习系统。 信息过滤系统分成两个部分:中文分词部分和信息过滤部分。 中文分词部分采用了利用汉字的特点对文档进行预处理的方法和基于词库的最大匹配法和无词库的频度统计法相结合的方法。 信息过滤部分采用了基于关键词向量的信息过滤方法。并作了一些改进:其中文档方面针对Web文档的特点对文档不同标签处的关键字赋予不同的权值。用户方面用户可以直接修改模板关键字串中不同关键字的权值,得到更加精确的用户兴趣,使过滤的结果能准确的反映用户的兴趣,从而提高文档过滤的准确性。 兴趣学习系统中,我们采用了基于向量空间法的用户兴趣学习方法和基于ID3算法的用户兴趣学习法两种方法。并采用了基于用户反馈的学习方法、后台观察用户行为学习用户兴趣的方法和用户兴趣主动服务功能。 本文采用了以下几种机器学习技术:基于用户反馈的机器学习技术、基于观察记忆的机器学习方法、基于ID3算法的归纳推理、启发式学习方法、知识库技术,系统具有较好的自主性和代理性。
其他文献
本论文构造了一个轨道仿真软件,介绍了轨道仿真软件的设计思想和实现过程。轨道仿真程序核心部分是轨道计算,本文首先介绍了轨道动力学基础,包括轨道摄动问题,以及飞行器姿态控制
演化计算是模拟自然界生物演化过程产生的启发式优化策略与技术.由于它具有稳健性、通用性等优点和自组织、自适应、自学习等智能特征,已广泛应用于许多领域.该文主要研究了
多传感器数据融合是现代CI系统中的一项关键技术,在军事和民用方面有着极为广泛的应用背景,是目前科技界的一个热门研究领域.该文对多传感器数据融合中几个关键技术进行了较
彩色图象分割是智能交通系统工程中视频检测技术的重要组成部分,本论文为图象分割技术的应用探索切实可用的方法。论文对彩色图象分割算法的研究进行了三个步骤的工作:1、色彩
该篇论文是根据作者在台湾DLINK公司成都研发中心实习期间开发Linux-based Two Port Router(LTPR)项目的辅助项目“基于ARM7TDMI芯片和uCliunx系统的软件调试器”而写成的.论文
随着互联网的发展,分布式应用的需求不断增长。从MapReduce产生开始,各种数据并行的分布式计算系统层出不穷,如Microsoft的Dryad,Google的Pregel,UC Berkeley的Spark。针对不同的
该文首先讲明作者对家庭网络系统整体架构的设计.该文的工作是数字化家电网络控制平台SOPCA第二期工作的前期准备部分. 其次,该文根据家庭网络的特点,从多种联网技术中选择蓝
该文从XML的主要技术特征和原理出发,研究了主要几种XML文档转换技术,包括利用DOM的标准API来操作XML文档,利用XML查询语言来操作XML文档及利用XSLT转换XML文档,并对各自的适
随着计算机网络的开放性、共享性、互连程度的扩大,使得网络与信息系统的安全与保密问题显得越来越重要,成了制约其发展关键之所在.该文旨在给出基于实体模型的计算机网络安
该文详细讨论了如何开发一套具有高度可扩展性、可重用性和高度可维护性的住院管理系统.Windows DNA体系结构是开发高度可扩展性系统的优秀框架.它以COM组件为基础,结合COM+