基于人工免疫系统的中文文本分类器的建立和实现

来源 :中山大学 | 被引量 : 0次 | 上传用户:ABC20090907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工免疫系统是当前计算机人工智能领域的新兴研究热点。近年来人工免疫算法已经在控制领域取得了理想的效果,应用领域不断扩大,本课题以人工免疫系统为研究对象,探索具有可执行性、一定通用性的人工免疫算法,并将其引入中文文本分类系统,旨在建立一个分类时间复杂度低和分类准确率高的系统。 本文采用较多的篇幅对中文文本分类系统算法和人工免疫算法进行论述,重点研究和探索中文文本分类技术具有指导意义的人工免疫系统的建模方法,阐述基于人工免疫原理的中文文本分类器的结构设计和免疫算法流程、算法模块,详细分析了实验数据和算法参数对分类性能的影响。 本文以人工免疫算法aiNet算法和AIRS算法为基础,提出一种可用于分类的NAINC算法。但在理论分析和应用仿真中看出NAINC算法存在着某些缺陷,本文在NAINC算法的基础上对其进行了改进,并与相关分类及SVM算法相结合构成新人工免疫算法AIS-C和AIS-SVM算法,建立中文文本分类系统。除此之外,本文重新对特征属性的重要程度进行评估,建立了三种二次降维处理模型:基于期望、标准差倒数和相关系数模型。 本文首先对人工免疫系统以及中文文本分类领域的当前研究现状进行阐述,随后对人工免疫系统的生物学背景、中文文本分类算法的基本理论、传统的人工免疫算法模型和改进的人工免疫算法模型进行了简要的介绍,最后通过对理想数据集Iris和收集于网络的中文文本数据集对各种改进的人工免疫算法模型进行仿真测试。 实验仿真测试人工免疫算法模型在中文文本分类系统中的性能指标,实验数据表明提出的模型均取得了理想的效果。
其他文献
摘要:建筑工程管理作为管理科学的重要分支,在我国已经有近30 年的发展历程。不可否认我国的建筑管理水平有了很大的提高,也建造了许多在国际上也具有影响力的项目,但是由于发展时间过短等原因,使得我国的工程管理的水平仍然落后于发达国家。本文从这一方面出发,对工程项目建设中应该遵循的原则进行阐述,然后对目前我国在建筑工程管理方面存在的问题进行分析,最后提出了相应的对策。  关键词:建筑工程 施工管理 有效
期刊
随着全国汽车保有量的急剧增长,停车难已经成为各大城市亟需解决的问题。高质量的停车诱导服务是缓解这一难题的有效方法。作为停车诱导服务平台的基础组成部分,停车信息系统的
随着国民经济的迅速发展,我国的汽车数量迅速增加。虽然我国政府在基础设施建设上加快了步伐,高等级公路、停车场越来越多,但配套的道路、车辆管理系统却显得相对滞后,仍旧停
随着通信技术的发展,全球卫星导航系统(Global Navigation Satellite System,GNSS)在不同领域正发挥着越来越重要的作用,已经成为世界各国科学家研究的焦点,所以对于GNSS卫星信号
生物识别技术是根据身体或行为特征来鉴别一个人的有效的方法,如指纹、声音、虹膜和笔迹等。依靠这些身体特征进行身份验证的技术即是生物识别技术。其中指纹识别凭借其使用方
本文针对ITS领域中的关键技术,研究了基于视频车辆跟踪的交通事件检测系统中的车辆违规检测算法。在车辆检测方法中,采用了一种对称差分和背景相减法相混合的新方法,研究了车辆
随着网络技术和多媒体技术的飞速发展,多媒体数据逐渐成为人们获取信息的重要来源,成为人们生活的重要组成部分,数字产品的版权保护和完整性认证问题显得越来越重要。数字水印技
近年来,随着计算机技术的迅速发展,在军事领域,构建分布式仿真平台在武器系统的研制、测试、验证等方面都起着关键的作用。本文针对高炮仿真系统的特点,提出了一种基于以太网
3G时代日益临近,各种新颖的3G通信增值业务呼之欲出。无论是运营商服务器端部署,还是用户终端应用,都在向IMS体系靠拢。IMS是具有全球接入独立性的基于IP标准的通信业务控制
摘要:随着我国水利行业的快速、持续发展,水利工程的投入也进入了一崭新时期,但在水利工程建设中仍然有一些不足之处,需要水利工程建设人员加以把握、控制,采取正确的施工办法和措施保证工程质量。  关键词:水利工程;质量管理  中图分类号:TV 文献标识码:A 文章编号:  近年来,国家对水利基础设施建设越来越重视。水利工程建设的重要性已被提到了前所未有的高度,随着十二五规划和国家积极财政政策的推动,进一
期刊