【摘 要】
:
信息化时代,来自社交平台的数据每天在源源不断的生成,许多数据可建模为大规模网络,基于这些网络数据快速、准确地识别其潜在的多类型聚类结构,有利于实际的应用,如推荐系统可利用用户聚类信息进行推荐,舆情分析可利用用户聚类发现用户交互模式。目前存在的社区结构发现算法只能识别网络的社区结构,而对于网络的多类型结构,无监督网络结构发现算法虽可以发现其结构,但准确性不高。先验信息有助于提高网络结构发现的准确率,
论文部分内容阅读
信息化时代,来自社交平台的数据每天在源源不断的生成,许多数据可建模为大规模网络,基于这些网络数据快速、准确地识别其潜在的多类型聚类结构,有利于实际的应用,如推荐系统可利用用户聚类信息进行推荐,舆情分析可利用用户聚类发现用户交互模式。目前存在的社区结构发现算法只能识别网络的社区结构,而对于网络的多类型结构,无监督网络结构发现算法虽可以发现其结构,但准确性不高。先验信息有助于提高网络结构发现的准确率,但先验信息很难获得,且需要很大的代价花销。主动学习基于采样策略选择使模型性能提升最大的监督信息,可花费较少代价得到高质量先验,进一步提高网络结构发现算法的准确性。因此,主动半监督网络结构发现算法更加具有研究与应用价值。无监督在线EM算法onlineVEM(online Variational Expectation Maximization)可以发现大规模网络多类型结构,但是其十分依赖模型初始参数的优劣,尤其是在网络结构复杂时结果不稳定且不准确。因此,将onlineVEM算法与不确定性采样策略相结合,提出一种基于迭代框架的主动半监督网络结构发现方法ASonlineVEM(Active Semi-supervised onlineVEM)。该算法基于代表节点初始化模型,然后迭代执行三个任务:运行在线算法onlineVEM、主动选节点、标记节点及更新模型参数,直至算法达到设定阈值或收敛。在具有不同结构的人工网络和真实网络上,ASonlineVEM算法优于同类算法。ASonlineVEM算法在一定程度上改善了发现网络多类型聚类结构的准确性,但是其只根据不确定性采样准则选择先验信息,导致无法使网络结构发现性能提升最大。对此,将onlineVEM算法与基于批量主动学习的BALN(Batch Active Learning)算法相结合,提出一种多策略节点选择的主动半监督网络结构发现算法BAOE(Batch Active onlineVEM),该算法融合不确定性、代表性和中心性三种节点重要性准则主动选择节点标记,并基于随机游走策略扩大选择节点集合。在人工网络和真实网络上的实验结果表明:BAOE算法能够选择使算法性能提升最大的节点集合。最后,为了进一步验证BAOE算法的有效性与实用性,将设计的算法应用于CSDN用户网络结构发现中,识别用户网络潜在的聚类结构,利用聚类结果分析网络用户特征。实验结果表明BAOE算法有一定的实际应用价值。
其他文献
轮式移动机器人是非线性、受非完整性约束、欠驱动系统。轮式移动机器人的轨迹跟踪问题始终是研究热点。近年来,学者们在轨迹跟踪领域获得了一些研究成果。但是现有方法仍然存在一些影响跟踪器性能、有待解决的问题,如初始速度超出机器人速度约束范围,机器人动力学建模存在着参数不确定性与未建模干扰,以及轨迹跟踪过程中机器人出现滑动与打滑现象等。本文针对轮式移动机器人轨迹跟踪器设计中存在上述的关键问题分别展开深入研究
地层压力的特征及演化过程与油气成藏具有重要的联系。本文搜集整理了天环北段的钻井和地层测试等相关资料,通过实测压力的垂向分布,明确了现今天环北段上古生界为负压,并分
能源匮乏和环境污染是当今世界两大主要问题,传统能源石油的加剧使用和污染性气体的超标排放引起地球温室效应的加剧,为了世界的持续发展,人类和环境能够和谐共处,绿色环保的
我国政府长期以来非常重视中医药的发展,大型中医院遍布各省市及地区。随着公立医院绩效改革的深入,中医院绩效考核问题有必要深入探讨。本文基于S市某中医院的实证调查,监测该中医院的RBRVS实施成效。本文从医务人员及患者两方面视角,同时选取具有中医特色的科室进行深入分析。研究结果发现,RBRVS系统实施后该中医院的医务性收入增加,收入结构也趋于良性循环,临床一线医务人员人均绩效增加,且他们对RBRVS有
乌骨鸡是我国特有的药食两用鸡种,药用历史悠久,在补气血方面效果显著。作为补益鸡种的乌骨鸡所产蛋具有的特殊性值得研究。蛋源性活性组分被证实具有抗炎、抗菌以及抗氧化等
化学镀镍工艺适合塑料等非导电材料的表面施镀,且生产工艺简单,因此被广泛应用。然而,其在镀件生产过程中采用含镍、铜络合物,它们的化学性质稳定,形成的废水难以被常规化学
财政作为政府履行职能的主要经济手段,是国家实现治理目标的重要保障。我国正处于经济体制改革的关键时期,财政安全问题受到了国家的高度重视。政府审计作为党和国家监督体系中的重要组成部分,对地方财政安全的维护具有重大意义。梳理已有文献发现,关于政府审计与财政安全二者关系的研究的理论依据滞后于现实进展,交叉性和跨学科研究上有待加强,实证研究方法也值得改进。在已有文献的前提下,本文打算进一步探讨政府审计功能对
半导体光催化技术的飞速发展有望解决能源问题和环境问题。传统的TiO2材料因其带隙较宽,在光催化领域受到了很大的限制。BiVO4因其适宜的带隙、易制备、成本低廉以及无污染等
轧机振动问题是企业生产中的普遍问题,不仅影响轧机的寿命,还会降低产品质量并造成巨大的经济损失。对轧机振动进行测试分析和理论分析,揭示轧机的动态运行特性,提出有效的抑
选区激光熔化(SLM)作为目前主要的金属增材制造技术,其根据CAD数据进行金属粉末逐层堆积烧结成形,将三维模型直接制造成实体零件。基于这种逐层扫描的方式,SLM成形件存在不同