【摘 要】
:
网络中的社区是指具有相似连接模式的结点组成的集合,好的社区发现算法需要考虑以下几点:一是算法划分社区的准确度要高,评价指标通常是算法划分结果与标准划分之间的相似度;
论文部分内容阅读
网络中的社区是指具有相似连接模式的结点组成的集合,好的社区发现算法需要考虑以下几点:一是算法划分社区的准确度要高,评价指标通常是算法划分结果与标准划分之间的相似度;二是算法的适用性要广,比如既可以发现传统的基于密度的社区,又可以发现基于连接模式的广义社区;三是算法的时间效率要尽可能高。由于大规模的网络往往较为稀疏,算法的时间复杂度要尽可能正比于网络中结点数或是边数。本文的研究方向是基于概率图模型的社区发现算法研究,用图模型解决社区发现问题首先是要对网络建模,即通过图模型解释网络的生成过程。传统的用于对网络建模的图模型大多存在局限,比如有些只能够发现基于密度定义的社区,有些算法的时间效率比较低等等。本文在模型的创新,算法的提出和改进上主要做了如下工作:1.创新地提出了一种基于泊松分布和伽马分布的图模型,模型假设网络中结点间的连接数服从泊松分布,结点在每个社区内的隶属度服从伽马分布。和传统的对网络建模的图模型相比,本文的模型可以更合理地解释网络中边的形成原因,并可以应用在广义的社区发现中。2.用吉布斯采样算法对模型中的变量进行推断,本文详细地推导了吉布斯采样的公式,并且从理论上证明了算法的时间复杂度随网络中的边数目正比增长,从而模型可以更好地适用于大规模稀疏网络。3.对算法从时间和空间的角度做了进一步优化,并将算法同时应用在了有向网络和无向网络中,同时创新地提出了一种处理网络中缺失数据的方法。本文通过实验验证了模型的准确性,并且在数据集中与一些传统图模型进行了对比,进一步验证了模型的优势。
其他文献
文章以晚明思想家管志道、刘宗周的家礼实践为例,在以礼化俗的历史视野中勾画理学家在回应时代难题时所涉及的多层面内涵:礼与俗、三代之治、性命之学建构、封建与郡县、宗法与
针对天水地区分布有较为广泛的湿陷性黄土及其特征,通过对天水周边部分地区的实际工程数据进行研究分析、实地考查和有关实验后得出其湿陷等级并进行区域划分.根据当地湿陷性
跨文化交际中,交际双方需要了解彼此的交际文化规则,以避免产生文化误解甚至文化冲突。为表示友好和尊重对方的文化,交际者有时会尽量使用对方的交际文化规则,尽可能在言行中融人
<正>案例教学是思品教学的一种常用方法,主题式案例是案例教学的一种升级版。主题式案例以其情景性、连贯性和新颖性吸引着学生和思品教师,使得其在思品教学中得以广泛运用。
《老乞大》是旧时高丽人为学习汉语而编写的非常重要的教科书。韩国于1998年发现了之前从未见过的古代本《老乞大》,这个本子较为忠实地反映了元代口语的面貌,成为研究元代汉
作为计算机平面设计专业基础课程之一,Photoshop在专业课程教学实践中,占有非常重要的地位。本文从九个方面讨论了Photoshop课程的教学方法。这些教学方法能够充分调动学生学
广义虚拟经济的视角有助于我们在宏观经济的背景下,重新审视清西陵的价值,并在其开发利用中提供新的思路。以广义虚拟经济理论为指导,针对清西陵开发利用中存在的问题,重点提
利用2018年东乡县气象资料,分析2018年气候特征,并对气候影响进行评价。结果表明,2018年东乡县气温正常、降水偏多、光照略显不足,大雨以上降水过程多,春秋气温变幅较大,异常
小城镇作为民族地区旅游业发展的重要载体,发展旅游业是很多民族地区小城镇实现跨越发展的必然选择。以东乡族自治县河滩镇为例,探讨了民族地区旅游型小城镇规划的编制理念和策
对从牛粪中分离出来的高温单孢茵(Thermomonospora sp.)SQ3菌株的生物学特征进行了研究,包括菌种生化鉴定培养和产纤维素酶及其培养条件等的研究。降解纤维素结果显示SQ3在纤维素