基于标签相关性的多标签分类算法

来源 :计算机仿真 | 被引量 : 0次 | 上传用户:caj978879947
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多标签分类算法已广泛应用于文本分类、图像识别、基因功能分类等领域,为了解决多标签分类算法较少考量标签之间的相关性等问题,提出一种基于标签相关性的多标签分类算法.首先对BP神经网络进行改进以适应多标签分类算法,然后对标签集分别使用皮尔逊相关系数和关联规则进行二阶、高阶相关性分析,最后将标签的相关性与改进的BP神经网络算法得到的概率做线性插值,得到样本属于某标签的最终概率.通过在4个真实数据集上利用5个多标签分类指标做对比实验,验证了提出的算法分类效果明显优于现有的多标签分类算法.
其他文献
学位
不良地质条件对工程建设带来诸多危害,因此工程实践中必须对其所在地段的承载条件进行处理改善。灌浆加固是工程中常用的地基土加固处理方法,水玻璃又是其常用的固砂灌浆材料。因此,有必要开展水玻璃固砂效果试验,不断优化参数,提升固砂效果。论文基于水玻璃的性质,在分析总结水玻璃浆液影响因素、影响特征的基础上,通过土工试验、模拟试验,分析研究了水玻璃固砂土的物理力学特征及其渗透扩散特征,并取得以下主要认识成果。
针对多段支持度数据加密后存在数据安全指标较低,加密所用的时间较长的问题,提出高速网络多段支持度数据自动加密算法.首先通过DHA去噪方法去除多段支持度数据中存在的噪声,消除噪声对加密过程造成的干扰,去噪后测试节点密度,减少多段支持度数据加密所用的时间.然后结合椭圆曲线数据签名算法和椭圆曲线加密算法对多段支持度数据进行加密,提高加密后数据的安全性.最后设置仿真,结果表明,所提方法加密后的数据安全性高、加密效率高,在短时间内可有效完成多段支持度数据的自动加密.
利用当前算法滤除数据冗余点时,缺少对数据冗余点特征的提取、分类处理过程,导致滤除效率差、准确率低、存储开销过大.于是设计了基于HDFS的海量日志数据冗余点过滤算法.引入HDFS体系架构,利用数据采样时间序列获取数据冗余点的特征,并进行分类处理,提升冗余点的滤除效率;计算滤除前含有冗余特征的数据字节数与普通字节数之比的缩减率、误判率,减少存储开销量;为提高准确率、消除性能,采用相似度概念,根据冗余点的突出特征计算整体相似度,再通过均值漂移传递函数实现对数据冗余点的滤除.实验结果表明:上述算法滤出效率更好、准
针对当前多变量时间序列分类方法未考虑降维处理多变量时间序列,导致多变量时间序列分类精度较低,分类时间较长的问题,提出了基于深度置信网络的多变量时间序列分类方法.通过构建深度置信网络模型结构,基于受限玻尔兹曼机,提取可见单元与隐藏单元特征信息,采用Isomap算法,在深度置信网络内进行优先特征提取操作,通过附加约束构造半正定矩阵,降维处理多变量时间序列.在低维特征空间内,利用支持向量机中分线性分类函数,计算得到拉格朗日乘子,根据正则化参数特性,通过高斯核函数,计算得到最优核函数,完成多变量时间序列分类.实验