异构社会网络挖掘方法研究

被引量 : 0次 | 上传用户:djldh138
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会网络分析作为数据挖掘研究领域的一个热点,近几年发展迅速,研究内容主要集中在通过对网络中存在的关系进行分析,得到我们需要的重要的信息。随着计算机技术和互联网的普及和发展,单一的网络关系结构已经不足以应对解决现实中的问题,所以人们进一步提出了异构社会网络(Heterogeneous Social Networks)的概念。这是一个复杂的网络抽象结构,在网络的描述中通常包含多种关系和多种实体,这些不同的关系和实体组合形成了网络的不同结构。如何来处理这些复杂的结构,获取有用的网络信息,是对传统的社会网络分析方法的一个新的挑战。目前对于异构社会网络的研究主要集中在两个方面,一个是通过对多关系的处理,结合传统的社区挖掘算法发现符合条件的社区结构。另一个方面是通过对网络中复杂的关系链进行分析,得到网络中隐藏的重要信息。本文主要在原有的异构社会网络分析算法思想基础上提出了两个新的算法:1.基于关系链的信息发现算法。该算法主要通过对网络中关系链的分析,实现重要信息的非监督挖掘,算法引入了稀有路径的思想,为重要信息的发现提供基础;同时,为了提高算法的质量和效率,利用相关性规则对数据集进行预处理,缩减分析子集的规模。2.异构社会网络中结合关系抽取与聚类融合思想的社区挖掘算法。该算法首先通过给定的标记信息对网络中的关系进行抽取,利用多种关系的相关系数向量,通过协同矩阵建立共识函数,进而对多种关系组成的聚类成员进行融合,获取相应的社区划分结构。文中通过与传统的算法在模拟数据集和典型的真实数据集上的比较实验,证明了本文所提出算法的有效性和优越性。随着信息化的不断加强,各个领域的数据量和数据之间的关系量大大增多。这给异构社会网络分析带来了广泛的应用前景和技术上的新挑战。本文提出的两个算法对解决实际的问题起到了一定的作用,如利用对关系链的分析,可以在学术网络中依据指定研究主题寻找权威作者、在商务网络中针对特定产品查找营销群体等;利用异构网络的社区挖掘算法,可以在复杂的学术网络中划分出关系紧密的作者群体,在多种人际关系中分析出志同道合的朋友圈等。比较之前的一些算法,这两个算法在效率和质量上有了一定的提高,但是并没有完全成熟,还需要进一步的优化和改进。目前存在的异构网络方面的算法并不能完全满足各种情况下的网络分析,总体来说,这个领域的理论和算法仍有较大的发展空间,需要更多的关注和研究。
其他文献
本文针对煤厚变化大、煤体松软,透气性差且无保护层开采的煤层条件,以新安煤田义安煤矿为试验矿井,采用理论分析、现场试验考察和数值模拟等方法,开展水力冲孔卸压区域防突关
随着经济全球化和航运业的迅猛发展,国际间的船舶运输日益频繁,沉船沉物造成的碍航和环境污染问题成为世界性的话题,各国都在着手解决打捞难题。我国沿海及内河存在着一定数
近年来,尽管食品安全问题集中在诸如农兽药残留超标、非法添加化学原料、添加剂的滥用以及随着生活水平提高带来的营养过剩等方面,但食源性疾病仍然是全球食品安全的主要问题
卷烟从生产到投放市场需要经过工业仓储、工商物流、商业仓储、出库、订单分拣、零售户配送等7个重要环节,本课题主要研究订单分拣这一环节,商业订单分拣这一环节是烟草行业
<正>所谓信息化生态课堂,是指充分利用现代教育理念与多媒体网络技术,遵循课堂的本质和规律,以重建现代课堂生态为旨归,从而焕发师生生命活力,提高课堂效率。"信息化",其内涵
本文以茶几配套软装饰设计为例,来阐述质朴自然、返璞归真的家居软装饰设计风格的表现。毕业设计作品从使用者的视觉感受、触觉感受以及心理感受出发,以传统文化元素中的汉代
随着人们饮食质量的提高,生活习惯和起居方式的改变,高血脂已成为威胁人们健康的重要疾病。在调节血脂方面,人们多依赖于西药,但由于长期服用出现的毒副作用,使得人们更加关
随着网络和科技的发展,侵犯公民个人信息的犯罪行为日益猖獗,而我国并没有专门的《个人信息保护法》进行规制与约束。《刑法修正案(七)》的出台,为我国的个人信息保护拉开帷
<正>去过美国的人都会有一个疑问,就是美国的衣食住行都比中国便宜,而美国的收入又比中国高很多,到底是什么原因造成的?衣——控制定价以耐克为例,一件衣服的出厂价92元,在美
期刊
<正> 作为联系农产品生产和消费的中介,批发市场将各地的农产品吸引和汇集到一起,在较短的时间内完成交易,然后再把农产品发散到各地。这一作用主要是有形批发市场减少交易成