基于模糊逻辑和神经网络的文本分类方法

来源 :南昌大学 | 被引量 : 0次 | 上传用户:hrbqian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前互联网高速发展,使得海量的、内容丰富的文字信息以计算机可读的形式存在,并且其数量每天仍在急剧增加。为了有效的管理和利用这些分布的海量信息,基于内容的信息检索和文本挖掘已经成为备受关注的研究领域。文本分类技术是信息检索和文本挖掘的基础,其任务是在给定的分类体系下,根据文本内容判断其所属的类别。目前文本分类已经取得了丰硕的成果,但一般文本分类方法是将一给定文本映射到一个给定的文本类别,对于某些文本属于多类问题处理不太理想。本文将模糊逻辑和神经网络相结合用于文本分类,该方法将训练文本的特征向量特征模糊化,同时将每个类中心向量特征模糊化,从模糊化的文本向量和模糊化的类中心得到该文本对每个类的距离,通过距离定义一个隶属函数,得到文本对每个类的隶属度。用模糊化的文本特征向量和该文本对每个类的隶属度向量训练神经网络。将测试文本特征向量模糊化后通过训练好神经网络可以得到该文本相对于每个类别的隶属度,通过文本属于每个类的隶属度就可以判断文本类别。最后给出了基于模糊逻辑和神经网络模型的一个具体实现,给出了相关数据结构和功能函数的说明。并将对两个样本集进行了测试评估。
其他文献
网格计算是伴随着互联网而迅速发展起来的专门针对复杂科学计算的新型计算模型,被称为第三代Internet。网格计算将地理上分布的计算资源充分利用起来,协同解决复杂的大规模问
基于表格的影像文档类型识别是影像文档识别的一个重要组成部分,是图像处理与模式识别领域内一个重要的研究课题。随着表格识别过程中信息域定位和提取、字符切分、字符识别技
随着无线通信和个人通信系统的不断发展,针对移动自组网(Mobile Ad Hoc Networks,MANETs)的研究成为热点课题之一。在Ad Hoc网络中,MAC(Medium Access Control)协议是所有报文在
目前,国内基于数据挖掘在中医证治的研究尚不完善,基本上都是基于单一数据挖掘算法的研究,未见有采用半开放的挖掘模型组技术,更未见有建立基于互联网的证治规律挖掘与应用软件。
体绘制技术是科学计算可视化的一种重要方法,它能够从体数据集中抽取内在的本质信息,并借助交互式图形图像技术展现出来。由于体绘制是将三维空间的离散数据直接转换为二维图
云计算是近几年IT领域比较热门的研究方向,云计算时代的到来,不仅仅改变了互联网的技术基础,而且还对整个IT行业产生深远的影响。云计算将数据存放在数据中心中,应用所需要的
P2P网络中所出现的各种攻击成为威胁网络正常运作的主要因素,而这都是因为有恶意节点的恶意行为存在所导致的。如何在P2P网络中识别出恶意节点,约束和杜绝节点的恶意行为成为
随着大规模网络的激增,网络的复杂性和异构性的特点日益突出,加强电信网络资源管理成为当前各级电信企业迫切需要解决的重要任务。然而,传统电信网络资源管理大部分只停留在
无线传感器网络融合了网络、信息、通信以及半导体等先进技术,在环境监测、国防军事、工业、公共卫生事业以及野生动物保护方面得到了广泛的应用。长期以来,无线传感器网络的
在网络管理中普遍存在信息安全保障和资源有效分配等方面的问题,这些问题都与用户的操作行为密切相关。本文针对基于Web日志的用户访问模式挖掘问题进行了较为深入的分析和研