【摘 要】
:
为对广东省投资项目在线审批监管平台积累的近40万个固定资产投资项目的产业类别进行分类,利于政府内部统计管理.在专家识别的人工打标签的方法基础上,进一步采用了线性支持向量机等分类算法,并基于反馈式文本分类机器学习原理再次识别了所有项目的标签类别,项目标签分类准确率由82%提升到91%.结果表明,反馈式文本分类技术,显著提高了项目分类的准确性.
【机 构】
:
广东省投资和信用中心,广东 广州 510030;广东中标数据科技股份有限公司,广东 广州 510030
论文部分内容阅读
为对广东省投资项目在线审批监管平台积累的近40万个固定资产投资项目的产业类别进行分类,利于政府内部统计管理.在专家识别的人工打标签的方法基础上,进一步采用了线性支持向量机等分类算法,并基于反馈式文本分类机器学习原理再次识别了所有项目的标签类别,项目标签分类准确率由82%提升到91%.结果表明,反馈式文本分类技术,显著提高了项目分类的准确性.
其他文献
为解决网络应用层流量所带来的安全隐患与传统检测方法极大地消耗设备性能的问题,提出一种基于自编码器算法的网络正常流量过滤的解决方案.该方案对数据流量集进行规则预处理后,提取流行为上的统计特征,对提取的特征进行自编码器算法的模型过滤.实验结果表明,该方案可过滤掉大部分网络中的正常流量,相较于传统的流量检测方法,整体的过滤性能显著提升.
计算机博弈是人工智能的重要分支之一,文章对人工智能算法黑白棋中的应用进行了研究.首先介绍了计算机博弈中的经典黑白棋算法,然后介绍深度强化学习中两种典型的时间差分算法的定义和实现过程,以及两者的区别和联系.最后评测蒙特卡洛树搜索算法、Q学习算法和SARSA算法三种算法在黑白棋实际应用的表现,以及后续改进的方向.
文章通过对沈阳地区已并网运行的不同装机容量分布式光伏发电数据进行数据分析,得出该地区分布式光伏发电单位装机容量在一个年度中各月份,以及重点月份中每天,与各时段的实际发电效率变化规律和特点.进而分析出该地区分布式光伏发电项目单位装机容量的实际最大发电效率.文章研究结果可为光伏发电技术经济分析及商业化运营决策提供依据,对促进碳中和背景下分布式光伏产业发展提供参考价值.
轨道交通供电系统通过共享主变电站和换乘站间环网联络等建立起线与线间网络化关联,搭建了供电网络化的框架结构,为了达到调度指挥自动化体系与供电系统网络化适配的目的,结合国内轨道交通供电系统传统调度自动化系统建设经验、供电系统网络化对供电线网调度自动化系统需求,提出了供电线网调度自动化系统技术路线、监控范围和各线接入方案、总结架构及主要功能,得到供电线网调度自动化系统设计必要且具备可行性的结论.
文章介绍了分布式布里渊光时域反射仪(BOTDR)的原理和结构,用于检测雷击光纤复合架空地线(OPGW)时产生的温升变化和获取OPGW断股导致的应力变化.利用高压输电线的双OPGW结构来消除外界环境产生的共模干扰和解决布里渊频移存在的交叉敏感,提高了OPGW雷击定位的可靠性.通过模拟试验,验证了BOTDR能检测雷击OPGW时产生的同等光纤温升变化,为OPGW雷击定位研究提供参考.
机载激光雷达(LiDAR)是一种集成激光、全球导航卫星系统和惯导系统的多传感器移动测量系统,系统精度受多个因素影响,不仅取决核心传感器精度,还受到激光与IMU的安置参数影响.对低成本的多线激光雷达进行研究,分析激光雷达定位原理和安置参数的影响,提出一种基于特征匹配的检校方法.通过不同航带的点云进行特征匹配,计算出航带间的偏移,根据偏差与安置参数的关系求出安置参数,实验证明该方法能够有效消除安置误差影响.
文章针对多标签文本分类这一热点问题,采用“预先训练模型+微调策略”模式,即研究持续学习语义理解框架ERNIE 2.0和基于知识蒸馏的压缩模型ERNIE Tiny预先训练模型,以及倾斜的三角学习率STLR微调策略在用户评论多标签文本数据集中的实践.相对经典语义表征模型BERT,采用ERNIE 2.0模型的效果可提高1%以上,采用ERNIE Tiny模型的速率可提升3倍左右;相对默认微调策略,采用倾斜的三角学习率STLR微调策略的效果同样可再提高1%左右.
以东风柳州汽车有限公司某款纯电动商用车为研究对象,研究了商用车制动能量回收策略及理论.以制动踏板开度和制动踏板开度变化率为模糊控制器的输入变量,以再生制动力分配因子为输出变量.在Matlab/simulink软件中搭建控制策略模型,在AVL Cruise软件中搭建纯电动商用车的整车模型,并进行联合仿真与验证.
为提高垃圾分类效率,应对日益繁杂的垃圾分类工作,使垃圾分类智能化,高效化.运用卷积神经网络解决垃圾分类问题,对YOLOv3基础算法进行研究改进,并制作垃圾种类数据集,结合参数迁移学习训练垃圾分类识别模型.实验表明样本多的种类识别准确率较高,而对于样本少的种类,准确率就下降了.相较于现有常用的垃圾分类识别算法,所提出的垃圾分类识别算法,识别性能更优,更适合广泛推广应用.
在视频监控场景中,由于车辆外观的多样性、车辆间的相似性以及应用场景的复杂性,导致算法难以区分不同的车辆目标;同时,实际应用对车辆重识别算法的实时性也提出了要求.为兼顾精度和速度,进行了以下工作:首先,构建了一个场景复杂、含有近百万张车辆图片的数据集;其次,对车辆重识别算法的数据预处理、网络结构、后处理三个方面进行详细实验;最后,对模型进行蒸馏与量化,在保证模型精度的情况下提高模型速度.最终在自研测试集上的重识别精度达到了93.35%Rank1和76.30%mAP,推理速度达到了400.6 FPS,满足了实