基于中文微博文本的人物关系提取与分析

来源 :西华大学 | 被引量 : 0次 | 上传用户:zhgrmlshr
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,出现了许多方便快捷的网络社交平台,例如国外的Twitter、Face Book和国内的新浪微博,腾讯微博等,使得微博这样的社交网络服务(SNS)的网络行为变得越来越频繁,微博文本信息呈现出一种爆炸式增长的趋势,发现人物之间的社会关系、社会行为等有着重要的意义。由于微博的短文本特点,许多关系提取方法无法正常的在微博语料库中使用。基于这样的缺陷,本文的研究内容包括以下几点:(1)首先针对微博特点改进了基于依赖三元核的人物关系提取方法,改进内容主要涉及词项的语义相似度和句法相似度。本文利用词项相似度工具HowNet来对词项语义特征进行了分析,然后提出了词项的词性标注(POS)和语义角色(GR)二元组(POS,GR)进行词项句法特征分析,并且计算了词项信息熵以及(POS,GR)二元组的互信息熵的值来分别作为词项语义特征和句法特征的权重。本文将改进后的依赖三元核用于提取人物之间的互动关系集合(IR),并且作为元学习层的输入进行关系分析。(2)在获得互动关系后,经过分析发现关系种类复杂,运用在图谱上会产生很多重复、冗余节点,因此本文的元学习层运用互动关系作为输入,提出7种关系描述词提取规则和关系描述词分类算法(RKWCA),将人物社会关系大致分为了朋友,工作,家庭,敌意这四种关系,最后将人物实体作为节点,关系描述词作为属性,关系类型作为边生成可视化图谱。(3)本文对提出的方法进行了实验,从微博中提取出了人物的互动关系和社会关系,并且将关系描述词作为边的属性构建出了微博人物知识图谱。本文利用句法依赖树解决了短文本处理的问题,并且利用依赖三元核找到人物关系之间的特征,将特征通过元学习的策略学习出人物的社会关系,构建出了可视化人物知识图谱,实验证明了本文研究具有一定的实践和理论意义,提出的基于微博的关系挖掘方法是可行的。
其他文献
<正>"巨刺法"是《内经》记载的"九刺"中的一种刺法。"九刺"即针刺有9方式,可用以适应9种变化不同的病情。其中的"巨刺法"就是根据患者病情需要而采取左病右取,右病左取,左右
刘光珍致力于中西医结合肾脏病临床、科研、教学工作近30年,提出用益气养阴、清热祛湿、活血化瘀法治疗糖尿病肾病,开创了糖尿病肾病治疗的新思路、新方法,使糖尿病肾病的治
目的探究恩替卡韦联合中药柔肝散结汤治疗慢性乙型病毒性肝炎肝硬化的效果。方法在我院收治的慢性乙型病毒性肝炎肝硬化患者中选出86例随机分成对照组(恩替卡韦治疗)和观察组
随着校园欺负现象进入公众视野,有关同学欺负的学术研究也日益深入,被欺负学生的个性心理特点、欺负成因、被欺负学生的心理发展后效的研究都说明了欺负事件的发生总是发生在
随着农村产业结构的调整,近几年来中央对"三农"问题尤其重视.调整农村产业结构,从本质上说是农村由传统农业向现代化农业转变的一个过程.
目的:分析将血脂、血糖与维生素A、E应用于子痫前期孕妇诊断中的价值。方法:2017年9月—2019年9月,在该时段内对我院录入1500例产妇进行资料分析,根据产妇是否出现子痫前期将
课堂是培养学生创新精神的主渠道,因此教师要以课堂教学为主渠道,充分挖掘教材潜在的创新价值和学生潜在的创新因素,唤起学生的创新意识,这都是培养学生创新精神的策略。一、设计
自我伤害行为在现实中发生率相对较高,而在研究领域对自伤的应对办法研究却相对较少,本研究主要探讨自伤行为的箱庭疗法干预。目的:研究自伤行为学生的箱庭作品特征及箱庭疗
曾经,全国上下的电视荧屏上火热上映着韩国的励志电视连续剧《大长今》。我也是个韩剧迷,因此大有感触。无论是长今对待烹饪、行医,还是我对待教学、学生,这其中的道理都是相
研究基于2015年PISA对中国286所学校9841名学生的测试结果,对校园欺凌的现状及其对生活满意度和考试焦虑的影响进行了分析。结果表明,中学生中被欺凌学生的比例高达22.5%,男