【摘 要】
:
在多标记分类中,标签与标签之间的相关关系是影响分类效果的一个重要因子。传统的经典多标签分类方法如BR算法、ML-KNN算法等,忽略了标签之间的相关关系对实际分类的影响,分
【机 构】
:
昆明理工大学信息工程与自动化学院,昆明理工大学教育技术与网络中心,云南省计算机技术应用重点实验室
【基金项目】
:
国家自然科学基金资助项目(81360230), 国家科技部科技型中小企业技术创新基金资助项目(13C26215305404)
论文部分内容阅读
在多标记分类中,标签与标签之间的相关关系是影响分类效果的一个重要因子。传统的经典多标签分类方法如BR算法、ML-KNN算法等,忽略了标签之间的相关关系对实际分类的影响,分类效果一直不能令人满意;面对类别关联度极高的不良信息的多标签分类,分类效果更是大打折扣。针对上述问题,通过改进经典的多标签分类算法RAk EL,首先根据训练文本计算出各标签之间的相似度系数,然后再根据自定义不良信息层次关系计算出综合标签相似度系数矩阵,最后在RAk EL算法投票过程中根据综合标签相似度与中心标签重新确定最终的结果标签集合。
其他文献
在社会网络话题模型中,一些频繁出现的单词往往出现在不同的话题中。用户对这些单词感兴趣,因而分析时不能省略,这给话题分析带来了严重的挑战。为了解决这一问题,对话题模型中的节点流行性进行建模,提出了一种考虑节点重要性的LDA(latent Dirichlet allocation)社会网络话题模型。在该模型中,提出了流行性组件的概念,并提出了一种包含了流行性组件的扩展话题模型。通过实验结果表明,提出的
科研合作关系分析和预测针对网络的结构信息预测未来哪些学者间会产生合作关系进行研究,对于理解网络信息传播和动态变化具有重要的意义。在主流的基于拓扑属性的关系预测算
监督学习算法是当前进行文本情感分类的主要方法,往往要求训练集与测试集的数据分布相同,然而在实际情况下已标注数据与测试数据常常不属于同一个领域,这种数据分布差异导致文本情感分类准确率下降。针对这一问题,提出了一种基于EM算法的跨领域情感分类方法。首先从多个源领域结合目标领域生成一个情感倾向参考表;其次利用改进的EM算法参考该表迭代调节目标领域分类器的分类结果,直到该结果可以与参考表匹配;最后在公开数
为应对网络故障,提升网络的可靠性,针对SDN环境设计了节点的可靠度指标,提出了基于节点可靠度的虚拟SDN映射算法。在初始可靠映射阶段,该算法根据节点可靠度指标进行v SDN映射,部署控制器时兼顾了控制器与交换机的时延,同时考虑控制网络的重要性,为控制网络构建相应的备份资源;在故障恢复阶段,针对物理SDN单节点或单链路故障,算法使用迁移方法应对控制节点失效的情况,使用重映射方法应对其他故障。仿真结果
为降低帧聚合机制开销,提高无线局域网的网络吞吐率,设计了一种改进的基于MPDU最小帧间间距的帧聚合机制。首先分析了帧聚合机制开销受数据帧长度的影响,根据最小MPDU帧间间距设定聚合门限来选择聚合方式,并进一步提出了一种自适应A-MSDU聚合算法。通过仿真分析验证了所提出的改进帧聚合机制可以保证较高且平稳的吞吐率性能。
同步定位与地图构建(SLAM)是实现机器人自主定位的核心问题之一,Rao-Blackwellised粒子滤波器(RBPF)作为一种SLAM定位的有效方法,被广泛应用在实时定位领域中,但由于其随着粒子数目的增加会频繁重采样从而导致粒子退化问题。为了解决该问题,改善SLAM性能,提出了一种基于改进小生境遗传优化的RBPF SLAM算法INGO-RBPF,采用改进的Rao-Blackwellised粒子