基于社交媒体的个人事件抽取与预测方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:laobi87
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今的服务互联网环境中,用户往往使用提供服务的平台获取服务内容,而平台则根据用户自身使用过的服务内容获取用户的服务需求,并据此对用户进行服务推荐。但是仅仅通过平台获取的用户服务需求类型较为单一,用户自身更多的潜在服务需求无法获取,而且仅仅通过这些服务需求无法对用户进行更有效、更准确的服务推荐。因此,如何从更多的渠道中获取用户更丰富、更详细的服务需求成为一个十分重要的问题,而社交媒体中恰恰蕴含着用户生活中分享的各式各样的生活事件,本文将其称为个人事件,通过研究个人事件可以获取用户的服务需求,从而对用户的服务推荐起到帮助。本文围绕该问题,从社交媒体的用户数据出发进行个人事件抽取和个人事件预测,并从预测事件结果中获取服务需求,将从以下三个方面进行阐述:(1)针对从社交媒体文本中抽取出个人事件的问题,本文提出了一个基于BERT预训练模型的事件抽取方法。使用包含三个阶段的Pipeline流程进行个人事件抽取,分别在三个阶段使用了BERT-Bi LSTM-Attention、BERT-Full Connect和BERTBi LSTM-CRF方法进行个人事件抽取,最终从社交文本中抽取出事件类型、事件主语、事件宾语、事件发生时间、事件发生的地点和事件发生的时态等信息形成结构化的个人事件数据。(2)针对基于用户历史事件预测未来事件从而获取服务需求的问题,本文提出了一个基于频繁子序列挖掘的个人事件预测方法。首先对个人事件进行对齐,然后将对齐后的事件按照时间顺序构建事件输入序列挖掘频繁模式事件链条,随后将新发生的事件作为输入和挖掘出的事件链条进行匹配,根据事件链条中事件之间的转移关系得到预测事件结果,最终通过预测事件结果中的事件类型、实体内容等信息获取服务需求。(3)为了整合个人事件抽取和个人事件预测的结果,本文设计并实现了个人事件管理和可视化工具,通过该工具可以对用户的个人事件进行增删改查、导入导出等操作,还可以用事件时间轴的方式可视化的展示个人事件和预测事件的结果。
其他文献
膝关节炎这类病症严重影响到患者的生活,为患者家庭带来沉重的经济负担。这类疾病存在以下特性:中老年群体发病率高,影响人群广,属于慢性可致残性疾病。由于该类疾病临床表现相似,医生单靠临床表现难以鉴别诊断,一定程度上依赖影像学检查,超声检测就是用于诊断膝关节炎病症种类的主要影像方法,其依据是膝关节超声医学图像。本文基于炎性关节病超声图像的人工智能分析,实现炎性膝关节病的超声图像分类,为临床诊疗提供一定依
学位
随着信息时代经济的快速发展,企业的经营活动、金融交易等数据规模呈几何倍增长,在数据高效存储以及安全防护等方面的需求激增。区块链技术由于其去中心化、防篡改等特征,能够很好的解决数据在存储和安全等方面存在的问题,因此,被广泛应用于企业交易活动、产品溯源等领域。如何使区块链技术能够满足不同类型企业的个性化需求,对促进信息产业数字化、推动企业安全技术应用高速发展等方面具有重要的意义。由于区块链技术在企业个
学位
情绪是人类生活中不可分割的一部分。因为微表情是不受人类自主控制的,其对人类情感分析具有重大的意义,十分具有研究价值。微表情识别的含义为根据给定的微表情样本判断其情绪类别。目前微表情识别领域的现有方法仍存在一些问题:(1)现有方法对微表情帧的面部图像直接进行研究,对人脸的各部分没有区分度,而微表情只出现在面部的局部位置,对整个面部运动进行分析会与此特性冲突。(2)微表情数据集制作难度大,现有数据集体
学位
在信息技术快速发展的背景下,文本信息呈现出“爆炸”的状态,军事领域也不例外,面对“爆炸式”的军事文本,情报分析人员需要一种高效的技术手段辅助其分析情报。利用自然语言处理技术处理文本信息,辅助相关人员分析情报,是解决上述问题的先进技术之一。作为自然语言处理领域热点方向之一的事件抽取,在军事情报分析领域中的作用非同小可。本文立足于军事领域,对事件的抽取及应用等问题进行研究。由于军事领域的特殊性,目前公
学位
数据到文本生成,即将结构化的数据进行概括抽象,生成能够满足人类阅读需求的文本,生成的文本应当符合基本的语法结构,流畅通顺,语义表达清晰准确。传统的模块化的生成框架将数据到文本生成任务显式的划分为内容规划、句子规划、文本实现三个模块,串联的模块之间存在着误差累积的现象,并且模块中针对特定领域的任务设计了大量的人工设计的规则,导致文本生成框架受限于特定领域,不具有泛用性。基于深度学习的数据到文本生成模
学位
药物开发是生物医学领域的重要课题,面对一种新型疾病时,合成新的药物分子往往过程复杂、漫长,成功率低,且耗费大量人力、资金。通过已知的药物-靶蛋白相互作用信息,从已有的药物中预测并筛选出可能对该疾病有作用的药物,将会大大减少药物开发的时间与成本。研究人员已经开发出了多种针对药物-靶蛋白相互作用(Drug-Target Interaction,DTI)的计算机预测方法,但是它们在预测精度上仍然存在不足
学位
冲击地压是当前世界范围内煤矿开采中最严重的灾害之一,在其发生时,煤矿井下的几米甚到几百米的巷道都可以被瞬间摧毁,严重影响了煤矿开采安全环境。本文针对当前我国千米深井煤矿开采现状,结合国家在“十四五”期间关于煤矿安全开采的战略规划,采用理论分析与现场工程实践等方法,以辽宁某千米深井冲击地压矿井为主要研究对象,按照煤矿实际情况开展地面微震监测研究,根据监测结果分析矿井开采期间地面微震事件的演化规律,并
学位
随着人口的快速增长和现代工业的发展,一系列的环境污染已经成为整个社会发展的关键问题。大量的工业、生活废水及医用抗生素废水被释放到环境中去,对人类及动物的健康和环境的可持续发展产生了重大影响。传统的废水处理方法如物理处理法、生物处理法和化学处理法等往往具有处理成本高,操作复杂以及处理后会对环境造成二次污染等问题。近年来,光催化氧化技术因其具有极高的反应活性、高的处理效率、低成本以及对目标污染物的完全
学位
尾矿库是冶金、有色、建材等多个行业用于贮存尾矿和澄清水的重要设施,同时也是重要的安全环保设施。尾矿库重金属污染防治是矿山环境治理的重点工作之一,铜、铅、锌等重金属是尾矿库的常见污染物。因此,尾矿库的一系列污染问题愈加引起重视,开展降雨和植被条件下尾矿库重金属迁移规律的研究,具有重要现实意义。本文将室内土柱降雨淋滤试验与Geostudio数值模拟相结合,以实际尾矿库为工程背景,开展降雨和植被条件下尾
学位
近年来,环境污染和能源短缺已经成为影响人类生存和社会发展的两大难题。大力开发高效的环境治理技术和清洁的可再生能源已成为当务之急。而光催化技术利用太阳能可以产生强氧化性的光生空穴和强还原性的光生电子,从而能够实现降解有机污染物同时制氢。因此,光催化技术是一种有望同时解决上述两个难题的方法。将两种或多种带隙匹配的半导体复合所构建的Z型光催化体系具有太阳光利用率高、氧化还原能力强以及化学稳定性高等特点,
学位