【摘 要】
:
微博数据中含有大量的人物关系(例如,朋友关系,夫妻关系),然而微博数据量大、冗余数据多的特点使得人们难以了解这些复杂的人物关系。为了解决这个问题,本文提出了一种微博话题人物关系知识图谱的构建方法,帮助人们了解微博环境下的人物关系。首先从微博话题提取相关的人名,然后利用微博平台中关于这些人名的冗余信息,抽取人物关系三元组,最后构建该微博话题下的人物关系知识图谱。本文的主要研究内容如以下几个方面:(1
论文部分内容阅读
微博数据中含有大量的人物关系(例如,朋友关系,夫妻关系),然而微博数据量大、冗余数据多的特点使得人们难以了解这些复杂的人物关系。为了解决这个问题,本文提出了一种微博话题人物关系知识图谱的构建方法,帮助人们了解微博环境下的人物关系。首先从微博话题提取相关的人名,然后利用微博平台中关于这些人名的冗余信息,抽取人物关系三元组,最后构建该微博话题下的人物关系知识图谱。本文的主要研究内容如以下几个方面:(1)关系特征词的提取。为了尽可能全面的提取关系特征词,本文从三个方面对关系特征词进行提取:基于依存句法的关系特征词提取,基于相对位置信息的关系特征词提取,以及基于主题的关系特征词提取,最后对这些关系特征词整合去重,构建关系特征词组。(2)关系特征词组的优化和知识图谱的构建。为了提高人物关系抽取的效果,本文对关系特征词组进行了优化,首先建立滑动窗口,通过频繁项集挖掘算法对关系特征词组进行扩展,然后不断移动滑动窗口,比较前后两个滑动窗口下关系特征词组的总特征权重,完成关系特征词组的优化。本文研究了微博话题人物关系知识图谱的构建方法,先从微博话题中获取待抽取人物关系的人名对,再通过微博平台获取该人名对的相关信息,利用改进KNN方法提取人物关系三元组,最后用Neo4j图数据库构建人物关系知识图谱。实验结果表明,本文提出的微博话题人物关系知识图谱构建方法能够有效的表示微博话题中的人物关系。本文创新地采用滑动窗口的方法对关系特征词组进行扩展和优化,提高了人物关系抽取的效果。通过获取微博话题中的人名,利用这些人名在微博平台中的冗余信息,构建该话题的人物关系知识图谱。本文的研究不仅能帮助用户快速地了解微博话题中的人物关系,同时,本文提出的方法也可以给微博平台下的商业营销和大规模知识库的构建提供一定的理论基础。图[16]表[8]参[59]。
其他文献
通过野外调查采样、室内化学分析及仪器分析等方法,在对土壤基本性质分析测定的基础上,重点研究了吉林中部不同亚类黑土(3个亚类,5个剖面)2种微量元素的含量及垂直分布规律,
<正> 自德宗贞元中至文宗大和年间,诗坛风光旖旎,佳作荟萃,七律蔚为大国。短短四十年,染指七律的诗人近七十,七律达一千六百首之多,超过了前两百年七律创作之总和。白居易、
唐钢高速线材厂二车间投产后,随着轧制速度的提高,集卷区电气事故频发,因此,探索对生产线部分电气控制设备进行改造,并取得成功。介绍了技术改造的具体方案、改造后的效果和
目的:肿瘤细胞遗传学研究是基因研究的细胞学基础,为肿瘤相关基因和遗传易感性的研究提供信息。许多肿瘤中存在染色体非随机性断裂,根据染色体畸变提供的信息,寻找侯选肿瘤相关基
健身气功作为我国传统的体育项目的代表之一,是我国传统文化的重要组成部分。各高校是传播传统文化的重要阵地,应肩负起健身气功发展的责任。本文选取湖南省普通高校的学生、教师以及健身气功教学相关专家,运用文献资料法、专家访谈法、逻辑分析法、问卷调查法、以及数理统计法等研究方法,通过对湖南省高校健身气功课程开展情况进行调查,分析湖南省高校健身气功课程开展中存在的问题,并且针对具体问题制定有效地解决办法,为其
天津国际邮轮母港位于天津港东疆半岛最南端。总规划面积120万平方米,规划岸线1600米。2010年6月26日首期工程整体建成并投入使用,拥有两个大型邮轮泊位.可停泊目前世界上最大的
为提高PSO算法解的精度和收敛速度,结合原始PSO算法,引入增长因子,提出一种基于增长因子的PSO算法.通过多个多峰函数的验证,新算法提高了收敛进度和寻优成功率,全局优化性能
<正> 磨口玻璃仪器不能长时间存放碱液,否则会使磨口活塞粘结而无法打开。当活塞打不开时,用强力拧会拧碎仪器,此时可将仪器在水中加热煮沸,再用木棒轻敲塞子后试着用力拧开
传统的生物显微镜图像只能给出生物组织的二维结构或形态分布,而生物组织的真实形态是立体的三维结构,这对准确地判断组织结构与功能的关系带来困难。光切片技术及相关设备的
学生体质的评价历来是学校体育的重要组成部分。我国于2014年颁布了新版《国家学生体质健康标准(修订)》,该标准是对学生身体健康状况的测评,通过规定项目的测试,得以客观了