【摘 要】
:
[目的]为进一步提高政策文本语义关联挖掘的深度,探索政策文本关联挖掘方法。[方法]融合依存句法分析和词嵌入模型分别从句子信息和词义信息角度挖掘政策文本内容深层次语义关联,且在设置依存句法抽取规则时充分考虑政策文本的用语特征。[结果]在算法效果上,在政策文本关联程度区分相对较低的测试数据集中,算法F1值达到0.857,相较于传统常规算法,提升了22.78%;在算法功能上,可从文本用词的细微差异刻画政
【基金项目】
:
中国科学院文献情报能力建设专项“科技知识服务大数据基础”(项目编号:Y9290002)的研究成果之一;
论文部分内容阅读
[目的]为进一步提高政策文本语义关联挖掘的深度,探索政策文本关联挖掘方法。[方法]融合依存句法分析和词嵌入模型分别从句子信息和词义信息角度挖掘政策文本内容深层次语义关联,且在设置依存句法抽取规则时充分考虑政策文本的用语特征。[结果]在算法效果上,在政策文本关联程度区分相对较低的测试数据集中,算法F1值达到0.857,相较于传统常规算法,提升了22.78%;在算法功能上,可从文本用词的细微差异刻画政策文本关联。[局限]在语义信息挖掘上,算法目前采用开源模型,可后续自主训练特定政策领域词向量模型以进一步提高准确度;在句子信息挖掘上,算法依赖于现有依存句法分析工具的准确性。[结论]本文提出的算法效果较好,功能较强,能有效揭示政策文本内容关联程度,可为政策文本量化研究带来新的研究视角和工具方法。
其他文献
Field case of staggered jointed lining of metro shield tunnel with an unexpected unsymmetrical surface surcharge is introduced in details at first. The finite element model of beam-spring is used to r
中西方领导权威理念的差异主要体现在概念界定、内容组成、来源基础和影响效力四个方面。现代领导者应融合中西方领导权威实践中的合理之处,以中西方领导权威的共同理论来源为基础,通过以德树威和以法护威相结合、以能促威和以情固威相结合、以勤增威和以专显威相结合、以绩立威和以新强威相结合、以廉助威和以信扬威相结合,维护和巩固领导权威。
随着新高考政策的不断完善,高考改革已悄然来临,在新高考的教育背景下,高中历史已成为教学的关键,受到学校、教师、学生、家长的广泛重视。基于此,本文首先阐述了高中历史教学中图像史料的重要性,继而从图片史料、影视史料两个角度提出高中历史教学中不同图像史料的运用策略,旨在结合直观性图像史料提高历史教学质量,推动高中历史教学稳定发展。
由于互联网以及移动手机的不断普及,人们逐渐进入到了一个参与式的网络时代,越来越多的人们喜欢在网络上通过文本和图像的方式发布自己的观点、评论以及情感。对于这些文本和图像信息进行有效分析,不仅可以帮助企业更好地提高产品的质量,而且有利于为政府决策和社会生产生活提供指导。本文对基于多模态图文融合的网络舆情情感分析进行了综述:首先对舆情分析的基本概念进行了概括;其次对社交媒体上单模态的文本和视觉舆情情感分
数字化时代背景下,“场景金融”已被普遍接受。商业银行若要打破传统金融模式困局,关键路径之一是要聚焦“场景生态”建设,即以用户需求为中心,将金融服务融入用户生活各个场景中,让金融服务触手可及,实现场景建设与商业银行服务的有效对接,更好地赋能零售业务发展。商业银行零售业务场景化建设存在的问题(一)系统、渠道还不够完善。数字化转型下,客户服务将会更多地通过线上渠道,网银、手机银行、微信公众号、小程
全面预算管理是当下企事业单位中流行的管理办法,在财务管理环节受到了广泛的青睐。当下,行政事业单位改革工作进行的如火如荼,市场经济中体现的企业管理概念在事业单位中的表现愈发明显。全面预算管理也逐渐被深入应用到了行政事业单位的财务工作中,但是在实际的操作过程中,依旧存在诸多问题。本文从全面预算管理概念出发,着重分析其在行政事业单位财务工作应用环节存在的共性问题,并提出针对性的解决策略,以此不断优化行政
数据标注最重要的考虑因素是标注数据质量和标注成本.该文调研发现自然语言处理领域的数据标注工作通常采用机标人校的标注方法以降低成本,但很少有工作严格对比不同标注方法,以探讨标注方法对标注质量和成本的影响.该文依托一个成熟的标注团队,以依存句法树标注为案例,实验对比了机标人校、双人独立标注及该文通过融合前两种方法所提出的人机独立标注方法,结果发现:人机独立标注能有效结合机标人校和双人独立标注的优点,在
【目的】利用命名实体识别与事件检测任务之间的相关性,同时提升命名实体识别和事件检测模型的性能。【方法】提出基于多任务学习的实体和事件联合抽取模型MDL-J3E,该模型分为共享层、私有层和解码层。其中,共享层生成通用特征;私有层由命名实体识别部分和事件检测部分组成,在通用特征的基础上分别提取两个子任务的私有特征;解码层将子任务的特征解码输出为符合约束规则的标签序列。【结果】在ACE2005数据集上开
经过长时间使用后,先进的"富镍"电池无法满充电。电极材料老化的原因已被剑桥、利物浦大学以及钻石光源公司的研究人员所确认。他们的研究结果发表在《Nature Materials》杂志上,这一结果为长寿命电池开发策略指出了方向。在可预见的未来,锂离子电池很可能成为电动车市场的主流,而富镍的锂、过渡金属氧化物则是这些电池正极材料的最好选择。但富镍材料的老化速率比目前的材料快得多,对于电动车商业化应
我院自1986年成立省性病防治中心以来,陆续见到9例早期梅毒的典型皮损,均作了活体组织病理检查。现报告如下: 9例病人全部是男性,年龄24~51岁,平均36.2岁。其中6例有同性恋史(3例有同性恋团伙),最长5年,最短2年的接触史;2例有宿娼史2年;1例否认性乱史。