【摘 要】
:
本文首先对文本分类的发展现状及存在的问题进行了系统性阐述,按文本分类的一般过程对文本分类相关技术进行了介绍和探讨。重点分析和研究了文本表示、特征选择技术以及文本
论文部分内容阅读
本文首先对文本分类的发展现状及存在的问题进行了系统性阐述,按文本分类的一般过程对文本分类相关技术进行了介绍和探讨。重点分析和研究了文本表示、特征选择技术以及文本分类算法等文本分类关键技术。本文较为系统地阐述了遗传算法、BP神经网络算法的基本原理,并分别就自适应遗传算法、BP神经网络学习训练和分类算法等问题加以讨论。结合遗传算法和BP神经网络的各自优点,提出了基于自适应遗传算法与BP神经网络相结合的文本分类方法,虽然BP神经网络相比于其它算法有稳定性、抗干扰性强等优点,较适合用于文本分类,但仍存在学习效率低,收敛速度慢,并易陷入局部极小点等缺点。因此,本文将遗传算法引进BP神经网络中,构建自适应遗传BP神经网络模型。但遗传算法在进化过程中,由于变异和交叉的随机性、无目的性,导致算法效率低,本文引入自适应遗传算子,控制种群进化的方向,同时探讨了多个群体遗传等问题。据此设计和实现了一个结合自适应遗传算法和BP神经网络算法的文本分类实验系统。实验结果表明,采用本文算法的文本分类方法取得了较好的分类效果。最后,对本文取得的成果以及不足进行了总结,并对下一步的研究工作进行了展望。
其他文献
<正>问题教学法是指教师在教学过程中,以学生为中心,以问题为主线,通过创设问题情景,引导学生对问题进行思考、探索、求解、延伸,从而自主构建知识,提升学习能力的一种教学方
他克莫司(tacrolimus,FK506,商品名Prograf)属于大环内酯类免疫抑制剂。最早由日本藤泽药品工业公司探索研究所于1984年自日本筑波山土壤中分离的筑波链霉菌(Streptomyces ts
失眠是一种常见的生理、心理疾患,长期失眠会影响人的正常生活和工作,甚至造成严重的意外事故。多年的临床使用证明,酒石酸唑吡坦是一个可作为首选药物的安眠药,但市售的普通
固体脂质纳米粒(solid lipid nanoparticles,SLN)和纳米结构脂质载体(nanostructered lipid carriers,NLC)是近年来研究非常活跃的脂质纳米给药系统。本研究采用硬脂胺-异硫氰基
研究背景:缺血和再灌注可严重破坏心肌细胞超微结构,阻碍心肌组织能量代谢,导致心肌细胞凋亡和坏死,降低缺血再灌注损伤后心肌收缩和舒张功能。预处理(缺血或药物)是目前研究最
随着我国信息化建设的大力发展,计算机技术和计算机网络技术日新月异,校园网的应用日益广泛和普及。其中,学校网上成绩管理系统是一个网络化、便捷化、公开化的工作平台,其安
本文对于经济学田野实验的研究方法、核心思想、发展脉络、分类界定进行了细致梳理,进而系统全面地介绍了近年来田野实验在四个重要的经济学科领域的应用实例,并展望了田野实
<正>当代"做中学"教育思想源于美国教育学家杜威的"从做中学"理论,其精髓在于动手实践,在实践中观察和思考,以悟得新知.实践"做中学"教学有利于激发学生的求知欲和学习兴趣,
继王健林在采访中讲出一句火遍全网的“先定一个小目标,先赚一个亿”后,2018年,小米创始人雷军又喊出新口号:在未来的一年里,连睡觉都是浪费时间!然而,相对于这些踌躇满志、
在橡胶制品生产中硫化是一道非常重要的工艺过程,其中硫化工艺的最优化参数的确定是一个比较复杂的问题。随着橡胶制品产业进步与发展,对硫化工艺的精确性、可靠性、成本控制