基于社交媒体文本挖掘的个人事件检测方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户:a471839794
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户的社交媒体中蕴含着他们过去的个人经历和潜在的生活规律,研究其规律对预测用户未来的行为以及对用户进行个性化推荐有很大的价值。通过收集微博数据,定义了11种类型的事件,并提出了一个三阶段的Pipeline的系统,利用BERT预训练模型,分别在三个阶段使用BERT+BiLSTM+Attention、BERT+FullConnect、BERT+BiLSTM+CRF方法进行个人事件检测。从微博文本中抽取出该文本是否包含定义的事件、包含的事件类型、每种事件包含的元素等信息,具体元素为Subject(事件主语)、Object(事件元素)、Time(事件发生时间)、Place(事件发生的地点)和Tense(事件发生的时态),从而探究用户个人时间轴上的事件变化规律来预测个人事件。在收集的真实用户微博数据集上进行实验,并与逻辑回归、朴素贝叶斯、随机森林、决策树等分类算法进行对比分析。实验结果表明,三个阶段中的BERT+BiLSTM+Attention、BERT+FullConnect和BERT+BiLSTM+CRF方法均取得了最高的F1值,验证了所提方法的有效性。最后根据所提方法抽取出的事件和其中的时间信息可视化地构建了用户的个人事件时间轴。
其他文献
小学科学实验在小学科学教学中具有重要意义。教师应注重对学生的实验操作进行引导,通过生动的情境教学激发学生对科学实验的兴趣,用恰当的指导来规范学生的科学实验操作,使学生充分发挥自己的积极性,掌握科学的原理,从而促进教学效率的提高。
[目的/意义]从不同来源的文本中识别和提取学术论文寻找合适的方法,为后续开展国内替代计量研究提供参考。[方法/过程]基于广泛的数据收集,总结归纳中国替代数据来源类别,提出从中国替代计量数据来源中识别学术论文的思路,探究将命名实体识别的方法引入识别和提取学术论文上的可能性,并利用基于正则表达式的识别方法进行实证分析。[结果/结论]中国替代计量数据源种类繁多,包括知识共享平台、学术社交平台、大众社交平
目的:观察参芪抑糖通络丸治疗气阴两虚兼血瘀型糖尿病周围神经病变的临床疗效及安全性。方法:按照随机数字表法把符合标准的60例DPN患者分为2组,每组30例,在常规治疗之上,对照组施以甲钴胺片,治疗组施以甲钴胺片+参芪抑糖通络丸,连续治疗3个月后,观察、对比受试两组于治疗前后的血糖水平(空腹血糖(FBG)、餐后2小时血糖(2h PBG)、糖化血红蛋白(Hb A1c)),血脂水平(总胆固醇(TC)、甘油
[目的/意义]知识单元作为人类控制和管理知识的基本单元,是科学文献内容的基本组成成分。通过对知识单元抽取技术和应用研究进行梳理与总结,探索知识单元相关研究未来发展方向,以便更好地实现对科学知识的发掘和利用。[方法/过程]采用文献调研法,通过人工对相关文献进行阅读和分析,从知识单元抽取和应用两个视角对科学文献中知识单元相关研究进行梳理和总结。[结果/结论]目前,知识单元抽取的准确性和智能性还有待于进
新冠肺炎疫情传播速度快、感染范围广,对人们的生命财产和身心健康造成极大的威胁。疫情期间频繁出现的床位紧张、院内感染等现象说明我国应对突发性公共卫生事件的能力还有待提高,对我国未来传染病医院的建设提出了更高的标准和要求。传染病医院作为应对突发性公共卫生事件的主力军,责任重大。为此,国家卫健委提出了建设“平战结合”传染病医院的思路,以加强传染病医院在应对类似疫情的抗风险能力。本文针对传染病医院的总平面
为缓解成本逐年增加、收费难度逐年增大的经营压力,本文研究对象W企业想尽办法多渠道降低成本,通过实施全面预算管理、智能化成本管理、特色班组核算管理,有效缓解这种经营压力,使企业的经营管理水平更上一个新台阶。
<正>将生物基全降解材料产业加速培育为浙江未来产业,对于响应联合国环境大会《终止塑料污染决议》顺应全球限塑禁塑趋势、充分彰显“两山”理念实践伟力,为我国实现双碳作出“窗口”贡献、支撑浙江打造全球有重要影响力的新材料产业高地和国际一流的新材料科创高地具有重要战略意义
期刊
随着上海烟草集团产销规模的扩大,客户对卷烟的需求朝着多样化、小批量、多频次和个性化方向发展,烟草物流业务的运营体量和复杂程度与日俱增,如何依据全国各地客户点订单情况,并结合物流线路、运输工具、货物(烟件)规格等若干因素,进行快速、有效的车辆配载及货物装车成了上烟物流业务中一个迫切需要解决的问题。为了解决上烟多尺寸烟草的装箱问题,文中充分考虑烟草配载装车场景,建立符合实际业务需求的配载运输模型;确定
目的 采用网络药理学方法预测黄瑞香发挥抗胃癌作用的潜在机制,并通过体外细胞实验进行初步验证。方法 利用中药系统药理学数据库和分析平台(TCMSP)筛选黄瑞香的有效成分,通过Swiss Target Prediction数据库和PharmMapper数据库筛选获得黄瑞香活性成分的相关靶点。通过GeneCards及DisGeNET数据库检索获得胃癌疾病相关靶点。利用Cytoscape软件构建黄瑞香活性