【摘 要】
:
针对如何精准识别僵尸企业的问题,借助湖南科创信息有限公司公开的企业信息数据集,提出了一种决策树-逻辑回归的僵尸企业识别方法.该方法用中位数填充缺失数和离群值,然后分
【机 构】
:
河海大学计算机与信息学院,江苏南京211100;河海大学商学院,江苏南京211100
论文部分内容阅读
针对如何精准识别僵尸企业的问题,借助湖南科创信息有限公司公开的企业信息数据集,提出了一种决策树-逻辑回归的僵尸企业识别方法.该方法用中位数填充缺失数和离群值,然后分析数据集并进行特征衍生,最后使用多元线性回归和卡方检验等方法完成特征筛选.为了验证所提出方法的有效性,分别在阿里云环境和本地环境下将该方法与过度借贷法、连续亏损法、随机森林算法、BP神经网络算法、XGBoost算法进行比较.每个模型均训练50次,每次训练按一定比例随机选取数据,最终取各个指标的平均值作为最终实验结果.实验结果表明:所提出的决策树-逻辑回归模型对于僵尸企业的识别准确率最高,达到99.98%;并且模型的运行速度相对各种集成模型的速度有较大优势,平均执行时间约为1.5 s.在各实验环境中,实验结果差异较小,验证了该模型的有效性和稳定性.
其他文献
现有的检测方法对轨道板细微裂缝和夜间拍摄的裂缝图像存在误检和漏检的现象,为此提出了一种基于卷积神经网络的改进方法。将特征图分组后用注意力机制强化各组向量的特征表达,以动态聚合弱分类器预测结果的方式得到最终的裂缝置信度。借助投票机制有效降低最终的预测偏差,提升模型的鲁棒性。实验结果表明:该改进方法在减少模型参数的情况下,在裂缝数据集上的准确率提升1.6%,在CIFAR-10数据集上的准确率提升2.8
随着互联网技术的普遍发展,世界进入了信息爆炸时代.将无结构的文本信息结构化使其能够充分地表现文本语义信息是文本挖掘、信息检索的关键基础性问题.文本表示效果的好坏将
DZ/T 0339-2020《矿床工业指标论证技术要求》是一部系统、全面规范矿床工业指标论证工作的标准,内容涵盖了矿床工业指标体系的确定、论证方法的选择、矿体的试圈试算以及矿
提出了一种基于三维卷积和卷积长短期记忆(convolutional long short-term mem-ory,CLSTM)神经网络的水产养殖溶解氧预测模型.首先,将输入向量及其转置相乘形成一个单通道矩
无人机拍摄的图像具有分辨率高、视野大以及目标小的特点,而现有的目标检测方法对小目标特征的提取能力不足。为此,首先采用以中心点表示目标的检测网络CenterNet,引入可变形双重注意力机制,以提高对小目标的特征表达能力;然后针对原始非极大值抑制难以处理嵌套型冗余框的问题,在冗余检测剔除过程中提出了广义非极大值抑制方法;最后引入LegoNet卷积单元,减少了卷积参数,实现了精度与速度的平衡。实验主要采
针对传统的特征选择算法只专注于特征间的相关性和冗余性而没有考虑特征之间交互作用的问题,提出一种基于交互信息的混合特征选择(hybrid feature selection based on mutual
针对传统无线传感器网络能量供应问题,提出了基于射频能量捕获的无线传感器网络介质访问控制(medium access control,MAC)协议.首先在相邻节点之间运用时分多址(time divisio
提出了一种针对竹笛技巧分类的数据集Breath和两个用于竹笛技巧分类的神经网络参考模型Breath1d和Breath2d,并针对此数据集的不同分类任务给出了最佳方法.将Breath数据集划分
鉴于传统的异质信息网络通常存在的高维稀疏性缺点,首先提出将异质信息网络的高维顶点嵌入低维向量空间的无监督学习模型—— 基于生成对抗网络的异质网络表征学习(heterogen
以佛山市高明区三洲盆地作为研究区,在系统收集区内区域地质、构造、工程、水文、环境、历史灾害等基础上,通过野外走访调查,查明了研究区岩溶塌陷发育特征,并对其时空分布规律进行了分析。结果表明:(1)区内岩溶塌陷规模以小型为主,其平面形态以圆形、似圆形为主,其剖面形态以漏斗状居多,并且剖面形态随覆盖层厚度增大总体呈现由圆柱状—坛状—漏斗状—碟状的变化规律;(2)空间上岩溶塌陷的分布受地层岩性、地质构造、覆盖层厚度及结构、地下水迳流和人类工程活动等影响;(3)时间上人为塌陷的发生主要与采矿活动和钻探施工时间关系密