【摘 要】
:
近年来,特征选择在机器学习领域中应用十分广泛.为提高文本计算效率,改善数据分类性能,提出两步法解决特征选择问题.结合过滤式中CEA算法和封装式中Boruta算法,引入参数p控制
【机 构】
:
郑州轻工业大学计算机与通信工程学院
【基金项目】
:
河南省高等学校重点科研项目(19A520009).
论文部分内容阅读
近年来,特征选择在机器学习领域中应用十分广泛.为提高文本计算效率,改善数据分类性能,提出两步法解决特征选择问题.结合过滤式中CEA算法和封装式中Boruta算法,引入参数p控制Boruta算法中阴影部分比例,提高封装阶段效率,降低整体算法时间复杂度,筛选出较优的候选特征集.在三个数据集上利用随机森林分类器进行实验,结果表明,该算法在平均分类错误率,召回率,准确率和F1值上均优于传统的Boruta和CEA算法,能够有效地减少最终选择的特征子集中的特征数量,提高文本分类效率和预测性能.
其他文献
言语行为理论是语用学的一个重要课题。在交际中,人们总是试图通过实施一定的施事行为,来达到一定的言后结果。然而由于文化的差异,一方通过施事行为所表达的言外之意往往被另一
Langrange对偶理论是将约束优化问题转化为无约束优化问题,通过Langrange函数再作出对偶目标函数,而对偶目标函数提供原问题的下界,通过极大化对偶目标函数进而得到原问题的
翻译的主体间性是目前翻译界研究的重点。译者的伦理意识也是翻译界新兴热点。从主体间性的角度审视译者的伦理意识可以给翻译研究带来新的启示。
传统的串串型感应式功率传输系统为了保持软开关技术,一般变换器的调制深度浅.为了提高调制深度可以采用Buck-SSIPT的拓扑结构进行改进.当所设计的Buck-SSIPT系统线圈的等效
研究了数论函数方程S(SL(n^13))=φ2(n)的可解性问题,其中S(n)为Smarandache函数,SL(n)为Smarandache LCM函数,φ2(n)为广义欧拉函数,利用初等数论内容方法及计算技巧得到上
Merrifield-Simmons指标表示图的独立集的数目,记M-S指标.本文定义几类特殊图,研究这些图类的M-S指标,得到了相应的M-S指标表达式.在此基础上,得到了路与完全图的笛卡尔积、
目的:探讨血液标本采集、保存不当对凝血四项检测结果的影响,以提高临床检验的可靠性和准确性。方法:选择本院2015年6月至2016年6月进行凝血四项检查中不合格血液标本210例作为
受限于经济结构,经济增长政策易于满足产出需求,但难以满足就业需求。明斯基等人提出的“最后雇主”就业理论认为政府可通过直接雇用劳动力和营建“劳动力缓冲储备”的方式解决
针对传统比例复数积分控制只能应用于三相正交坐标系而无法应用于单相坐标系的问题,提出了将广义二阶比例复数积分控制引入到单相并网逆变器的控制中.次单相并网逆变器与电网
偏远山区和旅游景区地带由于远离城市中心电网,通常缺乏可靠的电力供应来维持基本的用电需求.为了解决这一问题,本文设计并实现了一种以STM32单片机为控制核心的离网型光伏电