基于改进模糊语法增量式算法的文本分类方法

来源 :计算机应用研究 | 被引量 : 8次 | 上传用户:poppytao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对现有很多文本分类算法必须进行训练—测试—再训练的缺点以及通用模型的语法表现度较差等问题,提出一种改进的模糊语法算法(IFGA)。根据一些选取的文本片段建立学习模型;为了适应轻微变化,采用增量式模型,将选取的文本片段转换到底层架构中,形成模糊语法;利用模糊联合操作将单个文本片段语法进行整合,并将所学习的文本片段转换成更加一般的表示形式。与决策表算法、改进的朴素贝叶斯算法等进行了两组对比实验,第一个实验结果表明,IFGA和其他机器学习算法性能并无明显差异;第二个实验结果说明,增量式学习算法比标准机器
其他文献
为了解决城市轨道车辆阻力公式经验参数不易精确求解的问题,提出了一种改进的文化基因优化算法。首先,基于城市轨道车辆运行阻力经验公式和实际的运行数据,建立了城市轨道车辆运行阻力经验参数最优化问题的数学模型。为提升算法性能以提高求解精度,结合了遗传算法全局搜索能力强与粒子群算法收敛速度快的特点,进行优势互补,构造了一种混合算法以便于全局搜索。其次,结合方程组求解法求解速度快和爬山法局部搜索能力强的特点,
Min-Min任务调度算法的思路总是优先调度执行时间较短的小任务,无法得到理想的最优跨度及资源负载平衡。针对该问题,提出基于资源分级的自适应Min-Min算法。分配任务前,先参考现有资源的属性进行分级处理,再与任务在资源中的最小完成时间作乘积得到的最小任务资源组合进行调度;在任务调度过程中,引入自适应阈值,调节长任务的调度等级,从而达到优化效果。通过模拟仿真实验,表明该算法在时间跨度和负载平衡上均
作者采用社会支持量表对100例住院精神疾病病人和100全钠科疾病的病人进行测试,结果发现,精神病组所获得的社会支持低于内科病组,具有显著性差异。精神病组多次住院病人社会支持利用不
通过对161例糖尿病(DM)患者进行健康需求调查和对多次住院的42例糖尿病患者进行入院原因分析,了解糖尿病患者的健康需求以及患者在家庭自我护理中存在的问题,在调查分析资料的基础上,采取
了解护士对待ICU护理工作的态度和工作行为。方法:采用问卷、调查的方式对本院150名护士进行了调查分析,结果:在调查的150名正式护士中,愿意长期从事ICU护理工作为19%,不愿意长期
1995年4月~1998年6月,我院收治肾综合征出血热(HFRS)64例,对其中33例危重型HFRS急性肾功能衰竭(ARF)患者进行了血液透析(HD),现报告如下:1临床资料诊断与分型依据卫生部1987年颁发的《流行性出血热防治方案》。HFRS—AR... Fro
卵巢癌在妇女生殖道癌瘤中,死亡率最高.约60%~70%的患者在得到诊断时已属晚期,严重危害妇女的生命.卵巢癌多系卵巢上皮细胞恶变发展而来.导致细胞恶变的生物学机制尚不明确.随
针对目前的贪婪类算法在实际应用中出现的重构遮挡和虚假等问题,在分析该问题产生的原因基础上,提出了一种新的贪婪回溯子空间追踪(greedy backtracking subspace pursuit,GBSP)算法。该算法的基本思想是在每次的迭代过程中,采用回溯反馈和贪婪精选的思路进行支撑集选择。具体而言,在原子识别阶段,从残差投影中挑选出绝对值最大的K(K是信号稀疏度)个投影值位置,添加到候选支撑
针对现有非线性控制方案的一些瓶颈问题,从线性控制的角度出发,开展了一种用于WMR的线性二次型最优控制方法设计的研究。基于WMR的运动学模型采用动态反馈线性化技术将非线性运动学模型转换为线性模型;然后选取跟踪误差及误差收敛速度作为设计指标;同时考虑实现渐进跟踪,针对不同形式的参考轨迹,根据内模原理对控制器模态进行扩展,利用线性模型设计基于内模扩展LQ最优轨迹跟踪控制器;最后通过动态反馈反变换得到实际
针对细菌觅食优化算法中,以往的自适应步长公式引入参数过多,统一的经验性参数无法适应各类不同问题的情况,提出了改进的自适应步长公式,通过在步长公式中引入当前细菌的进化