基于不平衡文本分类的改进Stacking模型

来源 :计算机与数字工程 | 被引量 : 0次 | 上传用户:xtmpjordan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情绪分类中消极情绪往往对决策者有着很重要的借鉴作用,然而很多情况下,消极情绪是难以识别的少部分。为了提高消极情绪的分类效果,提出了一种融合随机森林和逻辑回归的改进Stacking模型。该模型采用多次欠采样训练多个随机森林作为初级分类器,采用逻辑回归作为次级分类器,基于Amazon电子商务平台的购物评论数据集进行了验证。实验结果表明,该模型能够有效提高不平衡文本分类的分类效率。
其他文献
前向安全的有序聚合(Fss-Agg)签名兼顾前向安全签名和有序聚合签名的优势。自2007年提出以来,前向安全的有序聚合签名已被广泛应用于日志系统、电子商务、电子政务、区块链等众多应用场景中。目前现存的几个前向安全的有序聚合签名都是基于传统数论问题,而这些问题随着量子计算机逐渐成为现实,将会变得不再困难。因而,寻找量子计算环境下前向安全的有序聚合签名已迫在眉睫。给出了前向安全有序聚合签名方案的定义,并将前向安全性和存在性不可伪造性两个特性结合,定义了选择消息攻击下有序聚合签名的前向安全的存在性不可伪造性;基
为了使船舶跟踪算法更适用于工程实践,降低杂波、风浪带来的影响,结合工程经验提出一种融合凝聚耦合度与航迹成长值的船舶跟踪算法。根据LSTM模型的“遗忘门”、“细胞状态”思想,提出“暂时航迹成长值”概念,用于计算暂时航迹的可靠性,同时利用多个波门过滤航迹,结合点迹凝聚的耦合度,量化出凝聚点迹质量,剔除虚假航迹,降低虚警率,实现航迹的正确起始。通过仿真结果表明,该算法跟踪效果良好,验证了其可行性和有效性。
社交网络用户立场检测指判断用户对于某一事件所持有的观点。以往的立场检测研究主要是以文本作为唯一研究对象,忽略了其它对用户立场检测有用的因素。根据认知理论研究,用户立场主要是在用户先验立场和外界环境的共同作用下形成的。基于此论文提出一种基于社交网络拓扑结构的立场检测算法。首先进行社区划分,提取用户的社交网络拓扑结构特征来衡量外部环境影响力;其次借文本语义提取技术分析用户先验立场,最后由两者共同作用判断用户最终立场。基于真实微博数据的实验结果表明,论文提出的新算法可以有效提高立场检测的准确性。
行人重新识别(Re-ID)是一种基于人体整体特征的身份识别方法,是指在图像或者视频序列中判断是否存在特定行人的技术。对于行人重识别方法来说,行人所穿着的衣服特征具有十分重要的影响。然而在某些特殊情况下(例如罪犯为了摆脱跟踪,更换衣服后逃跑等),目标行人在查询图像和图像库中的衣服特征是不同的,这使得目前的行人重识别方法难以将目标人物的图像与图像库中的人物相匹配。为了解决这一问题,提出了一种基于衣服特
近几年,联合聚类划分和表示学习的深度聚类方法提供了出色的聚类性能,但随着图像质量的下降(比如噪声图像),聚类结果还不能令人满意。为此,提出一种新的深度聚类算法(DDC)。深度卷积降噪自编码器学习噪声数据的特征表示;自注意力机制提高网络捕获局部关键信息的能力;端到端的联合训练得到合适的特征表示并完成聚类分配;对数据点和类中心的相似度赋予不同的权重,扩大同类和异类之间的差异。在公开图像数据集上的实验表
针对传统轨道扣件定位算法容易受光照等外界条件的影响,很难准确定位轨道扣件快速弹条的具体位置。结合无砟轨道扣件快速弹条的特征提出一种基于卷积神经网络SSD(Single-Shot MultiBox Detector)的轨道扣件快速弹条状态检测方法。利用快速弹条和钢轨的形态特征优化SSD算法中先验框的尺度和宽高比。同时,使用数据扩充和迁移学习方法对模型进行训练,有效缓解了训练过程中的过拟合现象。与传统
复句关系识别是对分句间语义关系的甄别,是复句语义分析的关键。由于非充盈态汉语复句存在隐式关系的特点,给语义关系识别造成了困难。因此,为了深度挖掘复句中隐含的语义信息实现正确的关系分类,该文提出了一种基于词聚类的CNN与Bi-LSTM相结合的网络结构BCCNN。其中,通过使用词聚类算法对单词向量建模提取单词间的语义相似特征,并在此基础上使用CNN对复句进行深度建模以获得复句的局部特征。另外,该文将CNN中的池化层替换为Bi-LSTM网络层,在减少池化操作所带来语义信息丢失的同时又得到了全局的长距离语义依赖特
针对行人重识别(Person-ReID)过程中,基于局部特征的方法在提取行人特征时因信息缺失导致鲁棒性和判别力不足的问题,提出一种多层级重叠条纹特征融合的行人重识别算法。训练阶段,对骨架网络不同阶段的输出特征图进行水平均等分割,再提取重叠条纹特征以弥补丢失的信息;使用三种损失函数对不同的特征向量进行监督训练,以约束类内距离。此外,设计组归一化模块来消除不同损失函数在优化方向上存在的差异,从而提取到
针对复杂道路环境下前方车辆检测识别率低、实时性差的问题,提出一种基于改进tiny-YOLOv3的前方车辆检测算法。以tiny-YOLOv3为基础,利用Inception模块改进特征提取网络,增加网络宽度,提升网络特征提取能力;将tiny-YOLOv3的两个尺度检测增加至三个,融合上下文特征信息;利用K-means聚类方法确定目标候选框个数和尺寸,进行多尺度训练得到最优检测模型。基于KITTI数据集
为应对传统蚁群算法在解决旅行商问题(TSP)中求解精度不高、算法易早熟等问题,提出融合奖惩学习策略的动态分级蚁群算法(DHL-ACS)。首先将蚁群动态划分为帝国蚁、殖民蚁及国王蚁,其中帝国蚁与殖民蚁执行局部信息素更新,国王蚁执行全局信息素更新,在局部信息素更新中帝国蚁执行较大权重系数,负责对较优解的开发增强算法导向性,殖民蚁执行较小权重系数,负责对次优解的探索保证算法多样性,并利用帝国蚁与殖民蚁交换优质解的方式提高解的精度。其次提出一种改进的学习策略,通过奖励帝国蚁与殖民蚁的公共路径以实现较优解的同化作用