【摘 要】
:
面对生活中来自各行各业的海量数据,如何从中有效地获取关键性的精简信息成为了人们的迫切需求,计算机进行信息处理研究的目标正是将获取到的这类非结构化数据进一步处理,转换成计算机可存储应用的结构化数据。关系分类作为自然语言处理中的一项重要问题,用来对句子中实体对之间的语义关系进行分类,通过对标记数据的训练学习,将非结构化数据中抽取的信息进行结构化处理。传统的分类方法以特征向量和核函数作为基础,随着深度学
论文部分内容阅读
面对生活中来自各行各业的海量数据,如何从中有效地获取关键性的精简信息成为了人们的迫切需求,计算机进行信息处理研究的目标正是将获取到的这类非结构化数据进一步处理,转换成计算机可存储应用的结构化数据。关系分类作为自然语言处理中的一项重要问题,用来对句子中实体对之间的语义关系进行分类,通过对标记数据的训练学习,将非结构化数据中抽取的信息进行结构化处理。传统的分类方法以特征向量和核函数作为基础,随着深度学习的不断发展,基于深度学习的方法逐渐成为了关系分类任务中的主流方式。为减轻有监督学习中人工标记数据的负担,衍生了远程监督的学习方式。但真实场景中的关系呈长尾分布,因此需要大规模数据支撑的分类方式难以解决长尾问题。针对这样的问题在本文中进行了小样本学习的关系分类方法研究,通过对已知关系中少量样本的学习,实现对未知关系类别的分类。基于度量的方法以其简单高效的方式在小样本学习中获得了优异的效果,因此在本文中对基于度量学习的小样本关系分类任务进行了进一步的研究。本文以度量学习中的原型网络为基础解决样本匮乏的问题,以词嵌入和位置嵌入组合的方式构建词向量,结合卷积神经网络结构提取实例特征,在支持集的各类别中计算原型中心作为类别代表,通过度量查询实例和各类别原型中心的距离实现分类。为了降低支持集中特殊数据对原型中心计算造成的偏差,同时考虑不同查询实例在进行分类时对支持集训练的影响,在本文提出的模型中加入了关系孪生网络结构,计算支持实例和查询实例的相似性分数,通过二者的相似度分配支持实例权重,并将原型中心的计算方式由传统的均值计算调整为各类别中支持实例的加权和。在模型中还加入了交叉融合层,对查询实例和原型中心的语义信息进行结合,得到在彼此影响下更具有针对性的特征向量,提高各类别对于查询实例的区分性。在训练的优化部分,以原型网络中对查询实例到各类别原型中心距离的优化为基础,加入了针对支持实例之间距离的优化,以缩小同类别中支持实例之间的距离、扩大不同类别间支持实例之间的距离为目标,提高了类别中实例聚合度的同时,也提高了类别间的分散度。实验结果表明,在几种小样本学习设置下与基线模型进行对比,本文提出的模型都提高了关系分类的准确率,说明了本文提出模型在关系分类任务上能取得更好的效果。
其他文献
<正>赢得青年,就是赢得未来和希望。引导青年干部积极参与到党的群众路线教育实践活动中来,在青年干部中树立群众意识,对推动教育实践活动取得实效,建立一支信仰坚定、敢于担当、忠诚可靠的青年干部队伍,不断巩固党的政治优势有事半功倍的作用。一、卓有成效地全面调研,把握群众思想在青年干部中的动态。一是调研内容要全面。既要深刻把握青年干部的思想动态,摸清青年干部如何看待党的群众路线?对教育实践活动有什么好的建
通过网络药理学的方法,从炎症角度探讨连花清瘟胶囊干预新型冠状病毒肺炎可能的作用机制。借助TCMSP数据库和GeneCards数据库分别检索化学活性成分和相关靶点,运用Cytoscape软件和STRING数据库构建活性成分和靶点的网络,通过富集分析筛选连花清瘟胶囊中的药物针对新冠肺炎病毒的通路,采用分子对接技术将活性化合物和核心靶点进行对接打分。结果表明,通过数据库从连花清瘟胶囊含有的中药里获得活性
目的 探讨中医综合治疗输卵管通而不畅导致不孕症的临床效果。方法 150例输卵管通而不畅导致不孕症患者,经子宫输卵管四维超声造影(4D-HyCoSy)联合压力监测将通而不畅输卵管分3级:Ⅰ级48例,Ⅱ级52例,Ⅲ级50例;各分级患者按随机数字表法分为中医治疗组和西医治疗组:Ⅰ级患者每组24例,Ⅱ级患者每组26例,Ⅲ级患者每组25例。中医治疗组患者采用中医综合治疗,西医治疗组患者采用西医常规治疗。比较
深度学习算法的成功通常依赖于大量带标注的数据集合,但当缺乏训练数据时,容易出现过拟合的情况,导致深度模型的性能下降。人类能够结合已有经验从少量样本中快速学习新概念,这种将经验泛化的能力对于计算机而言仍是一个挑战。因此,机器从少量样本中学习即小样本学习,成为目前机器视觉的研究热点之一。为解决现有研究中存在的一些问题,本文提出了新的小样本学习方法,并将小样本学习算法应用到高光谱影像分类中。本文的主要研
郴州地区红色文化乡村承载着深厚的红色文化历史,具有丰富的红色文化资源。随着时代更迭和城镇化建设的迅速推进,郴州地区深处偏远乡村的红色文化被掩埋、红色文化资源得不到有效保护和挖掘。近年,在中国发展红色游、乡村游的大浪潮下,部分乡村红色文化得到了合理保护和发展,但在建设过程中出现了一系列问题,如红色文化挖掘欠缺,旅游景观项目雷同;规划不重视基础设施建设,旅游开发不完善;建设者只重视开发而忽视了对生态环
<正>一年之计在于春。眼下正是春耕时节,各地抢农时、抓春耕、促春管,田间地头一片繁忙景象,人们播种希望的种子,也为发展粮食生产、确保粮食安全付出新的努力。丰衣足食,是千百年来中国人民的生活梦想。如何解决吃饭问题,一直是观察中国发展的重要维度。这个历史之问,在新中国得到了令人信服的回答。在中国共产党的坚强领导下,中国人民经过艰苦努力,
我国建筑空调系统在运行阶段的年碳排放量约为9.9亿t二氧化碳,降低其碳排放是实现碳达峰碳中和目标的重要挑战之一。本文对我国当前空调系统碳排放量进行了拆解,分析了影响空调系统碳排放的主要技术因素和非技术因素,讨论了降低空调运行碳排放的主要原则,展望了碳中和背景下空调领域重点技术与规范机制的未来发展方向。结果表明,我国空调领域未来应重点关注降低空调系统负荷、提高设备和系统能效的技术,以及制订与完善空调