多关系社会网络分析和可视化系统的研究

来源 :北京邮电大学 | 被引量 : 6次 | 上传用户:lhawk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的数据挖掘技术(包括分类,聚类,关联分析等)专注分析维表的属性,却忽略了记录之间所存在的关系。另一方面,现在主要的网络分析方法主要关注网络的拓扑结构分析而没有注意到网络中节点本身所具有的属性。本文提出的多关系社会网络旨在通过构建异构的网络模型来最大限度的保留原始数据的各种信息,并对多关系网络进行进一步的研究。本文主要对多关系社会网络做以下几方面的探讨:(1)多关系网络建模和网络提取。在对现实数据进行多关系网络建模之后,定义单一网络的抽取操作,从多关系网络中抽取特定意义的单一关系网络。(2)多关系社会网络的实体解析。从多个数据源中收集到的数据,只有经过集成和预处理才能被精确的知识发现模型所使用。而在多个数据源的数据进行集成合并到同一个数据集合当中时,会产生很多的重复记录。而这些数据并不是语义上唯一的,通常表示的是同一个实体。正确的合并这些重复的数据是制造高质量数据的至为重要的一部。这个过程被称之为实体解析(entity resolution),本文尝试在使用属性匹配的基础上,通过使用多关系社会网络多关系的特点,提升实体解析的准确率。(3)社团划分一直是研究复杂网络的一个重要手段,而目前的社团划分算法主要是使用网络拓扑的信息进行划分。本文的另一个研究点是研究在网络节点有属性的情况下,对网络进行社团划分。在使用网络拓扑的基础上,通过使用节点属性,进一步提高社团划分的准确率。(4)可视化,即通过提供统计或交互式视觉表现的软件系统来帮助人们探索和解释数据,是数据挖掘过程中极为重要的一个环节。本文也对多关系社会网络的可视化进行了研究,针对不同的网络类型设计不同的网络视图方案,并提出“网络浏览”的概念,将“网络浏览”应用到一个大规模网络浏览的框架下。(5)本文将上述的研究应用于国家科技支撑计划项目《科技文献信息服务系统关键技术研究及应用示范》,开发了一个科技信息可视分析系统(LiterMiner),通过工具证明了上述研究的可行性。
其他文献
<正> 法国科学家正在研究对几种玻璃化技术进行试验,想办法去除焚烧废料时产生的有毒灰烬。 在大多数工业化国家中,焚烧被认为是消除人类消费时产生的大量废料的最有解决办法
钛白粉被认为是目前世界上性能最好的一种白色颜料,氯化法是目前生产高档钛白粉的先进技术,氯化法制钛白分为氯化阶段和氧化阶段,而氧化阶段是其中的关键阶段。在氧化阶段中
在大学教育中,学生需要进行的多是动脑思考,很少会进行体力活动,如果只是进行脑力劳动,没有适当的体育锻炼,不利于学生的健康成长.经过调查研究后发现,人们在学生时代养成良
强制采样具有强制性,与公民个人的隐私权、人身自由权及身体权有冲突关系。我国实施强制采样时,要适当借鉴其他国家的立法经验,对强制采样的程序、对象及被采样人的权利保障
光刻设备的分辨率越来越高,以满足集成电路特征尺寸不断缩小的要求。根据瑞利判据,可以通过缩小曝光波长和工艺因子、增大数值孔径来提升光学投影光刻的分辨率。随着数值孔径
随着我国保险业发展速度的日益加快,保险法也在随之日臻完善,同时与其他法律也发生更多交汇与结合,形成更加紧密而复杂的关系。本文从死亡保险金出发,探究其与继承发生的交错
<正>随着我国电子商务市场的蓬勃发展,日趋繁荣的第三方支付业务为商业银行带来了新的发展机遇,也让商业银行面临诸多新的风险问题。本文拟在厘清第三方支付业务相关法律关系
笔者利用联合国粮食与农业组织(FAO)与国家水禽产业技术体系统计的肉鸭生产数据,运用ARIMA模型对我国肉鸭的出栏量和鸭肉价格进行了预测。结果表明:2017—2020年我国肉鸭的价
本文以莆田市荔城区九华农场片区经济适用房及配套工程为例对人防工程机电设备安装质量控制策略进行研究,首先在介绍人防工程机电设备安装过程的基础上,结合了机电设备安装过
在中国的互联网公司中,阿里与政府有着最多的故事,面对公开的批评和指责,它总是以一种看似激烈的方式来回击,但是结果往往并不坏。马云曾说:“要和政府谈恋爱,但永远不要结婚