一种双重特征选择的不平衡复杂网络链接分类模型

来源 :计算机应用研究 | 被引量 : 1次 | 上传用户:chunling329
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于有监督学习思想的链接分类是复杂网络分析领域的主要研究问题,该思想的核心在于把网络分成训练网络和目标网络,通过分类模型学习训练集合并对目标集合进行预测。然而在复杂网络链接分类这一场景中,正类别样本和负类别样本的分布是不平衡的,特征之间会存在冗余信息,这一现象往往制约着分类性能的有效提升。针对该问题,提出了一种双重特征选择的分类模型。该方法借助Relief赋予特征权重并使用K-means聚类算法对不平衡样本进行采样,解决数据不平衡问题,然后引入极小冗余—极大相关(mRMR)衡量特征与特征之间和特征与
其他文献
为了找到一条最短路径,并克服传统算法在路径规划中不适合离散域求解以及收敛速度慢等问题,提出一种改进的狼群算法。通过在初始化阶段引入位置—次序编码的方法,研究了离散域的路径优化;同时在迭代过程中引入二次搜索来提高算法求解速度与精度,以实现在达到最大迭代次数前出现最优解。结果表明,改进的狼群算法相比已有的算法求解精度更高,收敛速度更快,更加有效地避免陷入局部最优。可见改进狼群算法可以很好地应用于求解最
为了增强特征敏感度,提高人体日常行为识别准确率,针对行为识别特征进行了研究,提出一种基于自相关函数特征的人体行为识别方法。首先对预先采集的人体行为数据进行预处理,然后从时域和频域提取特征后计算得到自相关函数特征,同时采取互相关函数的步进式方法在自相关函数上进行降噪操作。分别使用C4.5决策树、K最近邻、支持向量机、朴素贝叶斯四种分类器进行分类。实验结果表明,与选取纯粹的时、频域特征集进行识别分类的
在大规模网络中发现稠密子图具有极其广泛的应用,如社区发现、垃圾邮件检测等。针对大规模网络数据中快速、有效地发现稠密子图,提出了一种基于GAS(gather-apply-scatter)编程模型的分布式k-truss算法——GASTruss。算法采用GAS的模式完成数据同步和算法迭代,有效地克服了传统并行算法重复性计算及不能有效处理依赖关系大的数据等问题。实验选择在Graph Lab平台上进行,结果
查阅相关畜牧养殖管理的文献资料,总结相关的研究经验,针对出现的问题,针对性的提出了:注意严格管理规程,满足不同阶段发育需求;精心选址,合理布局;严把引种关,确保品种质量;