一种改进的基于神经网络的文本分类算法

来源 :计算机应用研究 | 被引量 : 22次 | 上传用户:luzhiqing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出并实现了一种结合前馈型神经网络和K最近邻的文本分类算法。其中,在选取特征项时考虑到Web文本不同标签组所代表的意义和权重有所区别,采用了一种改进的TFIDF特征选择法。最后对设计的分类器进行了开放性测试,实验结果表明该分类器显著地提高了文本分类的查全率和查准率。
其他文献
为了在中小型制造企业实现全面且快捷的物料跟踪功能以支持精益生产的实施,针对中小型制造企业生产过程中存在物料替代、返工、分批和合批等特殊环节的多样性特点,建立了物料状态转换的一般映射和特殊映射的模型,提出了根据具体情形下的物料跟踪目的对特殊映射进行处理的方法,并通过应用钩子原理进行复合映射求解。以产品档案为例说明了物料跟踪映射模型的应用方法,并给出了基于xBOM的"半矩阵式"物料跟踪系统的结构设计。
针对构件检索的特点,结合模式分析中的树匹配思想,提出了构件树匹配模型,并在此基础上针对基于XML的刻面描述构件表示,实现了基于XML的树匹配构件匹配检索算法。该算法可以在保持构件查准率的前提下有效提高构件的查全率。实验结果证明了该算法的可行性与有效性。
用激光多普勒技术测量了二维扩压器中不可压湍流边层分离流动,得到了时均速度和雷诺剪应力分布。实验结果分析表明:以Coles速度律发展的Bardina速度分布可以描述瞬时间歇分离点以前和瞬时间
本文介绍了平面运动激波和单个旋涡二维相互作用的实验。实验在方截面激波管中进行,实验中拍摄了激波和旋涡相互作用全过程的纹影照片,实验结果发现,运动激波通过涡核时发生激烈
企业知识管理系统中的知识地图面临知识存储分散、来源复杂、类型多样且不断变化等问题,严重影响了企业知识共享和知识重用。提出一种基于企业本体自动构建知识地图,并根据用户
多机器人路径规划仿真平台(multi-robot path planning simulation platform)是通用的多机器人路径规划及协调与合作系统。该系统能将机器人状态数据及时地以二维图形方式显示,并且能模拟现实工作环境,监测机器人动作,检测机器人与环境物体间的碰撞,通过一系列仿真技术,使得原来必须用实际机器人作为对象的研究活动在一定程度上转移到计算机中虚拟进行。比较详细地描述了仿真平
为了解决无线传感网络中簇结构的基础安全问题,提出一种二层二项式密钥预分配方案,它能够很好地完成两簇头间密钥对的生成,满足对节点极小的能量损耗、极少的通信负载和存储空间要求。它有效地解决了节点获取攻击问题,提高了网络恢复度,同时成功地解决了多项式密钥预分配方案中的"K-security"问题。
本文主要概述80年代中期以来我国气动测试技术在气动力天平(简称天平)、传感器、流动显示和风洞自动化等几个主要方面的进展情况,并提出看法和建议。
在对热膜流速仪的探头标定及两相信号分离的方法等特性进行研究的基础上,测定了V-V浮阀塔板的流动特性。对于水,提出标定数据的两段线性拟合法,能够准确,快捷地用于流速测量。对气液
在对电子政务系统模型综述的基础上,提出并构建了面向对象的电子政务系统模型。该模型中将电子政务系统分解为三个对象,即政府、企(事)业单位和公民,建立了面向对象电子政务系统模型中各对象之间直接和间接的互动关系,结合上海社会保障卡应用实例,对面向对象的电子政务系统模型进行了系统分析。通过分析,该模型具有融合性、可扩展性、可管理性等特点,易于扩展、成本低且效率高,对电子政务的研究及实践具有一定的指导意义。