论文部分内容阅读
应用于文本挖掘的agent的建模与设计是一个实用性和前瞻性都很强的研究课题。研究的重点置于挖掘界面agent、数据转化agent和数据挖掘agent的建模与设计,意在构筑一个基本的应用框架,为agent开发人员提供一种实用的工程方法。agent的结构具有对象化的特征。时下agent的对象化会更好地为软件业服务,一些用Java实现的各种agent平台不断涌现。AOP是OOP的特例,不同之处只是作为对象的agent具有心智状态、信念和能力而已。与基于属性和行为的面向对象软件的建模与设计不同,面向agent软件的建模是基于模式的。agent抽象结构的各个元素是研究和设计agent应用的基石。本文归纳了36个抽象元素,可分为agent和服务两大类,除编码服务外,切实相关的服务包含agent目录服务、消息传输服务和服务目录服务。PAC架构吻合了文本挖掘系统的目标和需求。文本挖掘系统主要包括用户界面、数据转换、数据挖掘等功能模块,各模块可实现为抽象层次较高的agent,能有效地满足各模块之间的智能交互,进而进行任务规划。界面agent强调自主性、学习性和自适应性,它可作为人的助手,通过与用户协作替用户完成决策任务。数据转化是首要的。文本挖掘的基石——数据仓库的主要特征是从运行的资源到一个数据仓库或数据集市获取、转换和装载数据。获取、转换和装载可总称为转化。事实上,无论何时需要从一个数据仓库转换到另一个数据仓库,是否存储、检索或显示都会涉及到转化。文本挖掘agent是一个数理统计过程的应用程序,主要功能是完成数据模式的识别,发现新的模式或规则。挖掘的主要任务是分类、聚类和关联规则的发现,其目的是从海量数据集中抽取隐藏的知识。实用的agent建模与设计方法使研发过程更加简捷、清晰、有效。