面向社交媒体文本的少样本立场检测方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:liongliong565
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体在人们的生活中扮演着不可或缺的角色,大量的用户在社交媒体中对各种话题发表自己的观点,表达自己的立场。社交媒体文本中蕴含的立场态度信息能够辅助政策制订,帮助了解用户偏好,具有重要的科学研究价值和应用前景。现有方法在具备充足标注数据的立场检测任务上已经取得较好的性能。但在实际场景中,社交媒体上不断涌现出海量新话题,对所有新话题进行立场标签标注用于训练是不切实际的。针对这一问题,本文研究少样本场景下社交媒体文本的立场检测方法。主要研究内容包括:本文首先研究将源目标立场检测模型向无标注相似目标进行迁移的跨目标立场检测方法。现有的跨目标立场检测方法往往直接将源目标和目的目标之间共享的特征进行迁移,但缺乏对目的目标立场表达上下文的识别和利用。为此,本文提出了一种目标自适应立场检测方法,使用目标自适应图表示捕捉目的目标立场表达的关键信息。该方法从词的目标相关和目标无关的语用依存关系出发,针对目标构建自适应依存图,进而使用交互图卷积神经网络模块对目标自适应依存图进行卷积获得目标自适应图表示。最后利用目标自适应图表示和交互注意力机制从句子中识别关键的立场表达。和基线方法相比,该方法在SEM16数据集的多个跨目标立场检测任务上,Macro-F1和F1(62)指标平均提升分别为6.4%和8.1%。在数据量较大的WT-WT数据集上,Macro-F1和精确率的提升分别为8.4%和5.9%。本文进一步研究了利用多个源目标数据预测无标注目标的少样本立场检测方法。与跨目标立场检测方法仅使用单一相似目标数据相比,少样本立场检测方法对源目标的相似程度和数量不进行限制,是一种更通用、更具应用潜力的方法。为了从多个源目标数据中学习通用的立场特征,本文提出了目标关注的元学习方法。该方法引入外部知识产生目标对比句,并采用目标关注编码器获得目标对比句中目标特有的立场表示。最后利用目标关注的归纳网络,依据立场表示进行立场分类。在SEM16数据集和WT-WT数据集上,该方法的分类准确率比对比模型分别提升了1.12%和0.64%。
其他文献
研究一lncRNA GAS5、NEAT1、H19和MALAT1与系统性硬化症的相关性研究目的:探讨系统性硬化症(Systemic Sclerosis,SSc)患者外周血单个核细胞中GAS5、H19、NEAT1和MALAT1的相对表达水平与其临床症状之间的相关性。材料与方法:采用病例对照的研究方法,纳入的61例SSc患者和122例健康对照(Healthy controls,HC)。问卷调查收集SSc
学位
近年来,舆情事件预警已成为金融风险管控的核心任务之一。为了更加精准地分析事件的影响,需要将事件的类别进行详细地划分,这就导致金融领域的舆情事件类别繁多。一方面,由于事件本身的长尾特性,某些事件发生的频度很低,样本稀少,但这些低频事件带来的损失更加难以预测。因此,及时准确地发现这些少样本事件、尽可能减少“黑天鹅”事件带来的损失,对管控金融风险至关重要。另一方面,金融事件主体关联等特征的普遍性使得高频
学位
水凝胶是一种亲水性网状高分子聚合物,具有生物相容性、柔性、离子导电性等优良特性。通过将水凝胶作为设备和机器的关键部位所制备的水凝胶器件(如水凝胶传感器、水凝胶驱动器等)被广泛应用在药物运输、组织工程、生物研究等领域。目前以水凝胶为关键部位的所制备的器件有柔性机器人、可穿戴诊疗设备、组织胶水等,为生物医学领域开辟了一个全新的重要的技术研究领域。基于此,本文围绕水凝胶驱动和传感机理及实现对所制备的微型
学位
红细胞储存在液体悬浮介质中用于输血已有九十余年历史。在临床手术中,输注悬浮红细胞对于各种症状严重或大出血的患者是一种有效的治疗手段。然而,红细胞在低温冷藏数周后会发生储存损伤,它们的生化特性和物理结构都会发生变化,其形态从具有双凹结构的盘状逐渐转化为球形。若给患者输注这种血液,会引发大量疾病,如内脏的局部缺血等。因此,了解红细胞在储存过程中的形态变化是非常重要的。本文的研究工作从人体活体血红细胞形
学位
目的探究合肥市气象因素及臭氧(O3)与过敏性皮肤病的关联以及在疾病分型、不同人群和季节的差异,从而为降低过敏性皮肤病的患病风险以及患者的自我管理提供科学的参考依据。方法从安徽医科大学第一附属医院和中国科学技术大学第一附属医院收集在2015年1月1日到2019年12月31日期间就诊的过敏性皮肤病患者数据,并收集同期气象因素和大气污染物数据。首先,使用Spearman秩相关分析初步探索气象因素与过敏性
学位
研究背景及目的系统性红斑狼疮(systemic lupus erythematosus,SLE)是一种以自身抗原免疫耐受性丧失为特征的慢性炎症性疾病,多见于育龄期女性。前期研究表明长链非编码RNA(long non-coding RNA,lnc RNA)参与SLE的发病,而lnc RNA肺腺癌转移相关转录子1(metastasis-associated lung adenocarcinoma tr
学位
台风、暴雨等气象灾害给民众的生产生活带来了诸多不良影响,然而现有气象灾情收集工作存在人工成本高且覆盖度不足的问题。如果能从微博及新闻数据中挖掘灾情相关信息并结构化其事件表述,则可以提供实时、广覆盖的灾情监控,对灾情分析提供数据支持。为此本文基于微博短文本构建气象灾害领域事件抽取数据集,在此基础上分两步完成事件抽取。首先基于微博短文本完成事件检测确定事件触发词及事件句类型,然后基于事件触发词进行事件
学位
目标检测是近年来计算机视觉领域中发展最迅速、应用最广泛的技术之一,其任务是在一幅图像或一段视频序列中检测目标并分类。当前,基于可见光图像的目标检测方法已经在MS COCO、PASCAL VOC等数据集上取得了很好的检测效果。然而,可见光图像在微光甚至无光条件下十分容易导致目标丢失,这在行人检测、安防等场景下会造成严重的后果。红外图像的成像只与目标的热辐射高低有关,因此可以较好的解决这一问题。然而,
学位
区块链作为新一代信息技术的重要组成部分,是由共识算法、密码学算法和智能合约等多种技术集合而成的分布式账本。其去中心化、可追溯、不可篡改等特点推动其作为数字社会的底层技术,滲透到经济社会包括产品溯源、数据流通和供应链管理等多个领域。目前,为了保证区块链网络中所有节点对交易信息的正确性能够达成共识,交易信息都是以明文传输的。同时区块链系统使用的账户地址是一种低匿名性的假名系统,通过多种分析手段能够有效
学位
目的作为老龄人口最多的国家,我国老年人的认知功能下降已成为一个日益严重的公共卫生问题。认知功能下降尚无有效的治疗措施。因此,识别认知功能下降的危险因素以阻止或延缓认知功能下降的发生显得尤为重要。之前研究表明单一必需微量元素与老年人认知功能存在关联。然而必需微量元素联合暴露对老年人认知功能影响的证据有限。本研究以中国社区老年人为样本,旨在评估必需微量元素单独及联合暴露与老年人认知功能的关联。方法20
学位