四险一金领域术语语义漂移研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:qq414363439
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济社会的不断发展,为了与全国和各个行政区的经济情况相适应,社会保险(医疗/生育保险,养老保险,失业保险,工伤保险)和公积金领域的法律、法规和政策也在不断地调整。这种调整的必然结果就是:各个时间片段和行政区域上会产生大量的领域法律、法规、政策和司法解释等文本。可以发现,这些文本中对某一相同的领域术语的定义、解释和内涵不尽相同。这就产生了领域术语语义漂移现象。研究如何自动化获取这种漂移是有意义的,理由在于:首先这种漂移现象与国民生活息息相关,如果可以自动化获取这些领域术语的语义漂移,则可以极大方便人们生活;其次,如上所述,四险一金领域已存在海量法律、法规等文本,并且可以预料的是,随着时间的推移必然会不断增多。所以,诉诸计算机自动化获取是很自然的需求。本文的目标在于,从无结构的法律法规和政策文本中自动抽取领域术语和其时间地区相关的语义并组织成(领域术语,时间,地区,语义,选自)五元组形式,这些五元组来描述领域术语语义漂移,这种描述方式可以清晰地表示领域术语随时间和地区的语义漂移情况。首先从法律法规和政策文本中抽取领域术语,之后依据这些领域术语,在文本中抽取它们的时间和地区相关语义,并连同对应的选自(哪篇法律法规和政策)共同组成五元组。本文提出使用基于规则匹配(词性和词性组合规则)、基于统计筛选(多维的逐点互信息)和基于改版的原型网络(词级别嵌入)过滤的混合方法来抽取领域术语,之后再根据这些领域术语,在四险一金法律法规和政策文本中基于规则(排除规则和匹配规则)和改版的原型网络(句级别嵌入)的混合方法抽取它们时间地区相关的语义。最终将结果组织成五元组的形式,并且,提供了一种利用五元组和其中的知识描述领域术语语义漂移的方法,这种方法可以清晰表示领域术语随时间和地区的语义漂移情况。最后,本文还给出了一个领域术语语义漂移的初步应用场景——利用五元组和其中蕴含的知识来选择欲修改的审计方法,即利用五元组中的知识来帮助审计人员选择哪些审计方法需要被修改。
其他文献
为解决芦岭矿Ⅱ104东翼采区原设计布置的3个工作面造成的回采巷道布置困难,搬家频繁,综采面连续推进长度短的问题,利用理论分析、数值模拟、相似模拟和现场观测等多种方式,并基于Ⅱ104东翼采区煤层赋存条件及原巷道布置特点,将原设计的3个工作面合成一个Ⅱ1041工作面,对综采大角度旋转开采方案、工艺参数和旋转技术要求、矿压显现规律等方面关键技术进行了系统研究。根据Ⅱ1041综采工作面地质条件,探讨了旋转
相较于普通居民,高净值人群对服务要求更高。对于高净值人群而言,如何多样化资产配置以分散风险,在人民币贬值的大形势下显得尤为重要。对于将高净值人群作为重点服务对象的保险公司而言,亟需创新服务来更好的满足这些高净值客户。ZH保险公司目前服务了较多数量的高净值客户,高净值客户对于服务有更高的需求。保险行业本身就是非常重视服务,对其中的高净值客户而言,保险公司的服务质量直接决定了客户是否会选择保险是的产品
随着汽车保有量的增加,汽车被盗窃事件也多有发生,并且数量也有增长趋势。目前,应用于部分汽车的防盗装置,存在防盗效果不好、报警距离有限、误报率高等一些问题。为了解决现有汽车防盗系统存在的问题,利用无线传感网络、生物识别等技术开发一种基于北斗导航和图像技术的汽车防盗系统,提高防盗系统的准确性和高效性。本文分析了现有汽车防盗系统的主要类型及特点,研究了基于北斗导航技术的汽车姿态解算方法和车辆位置解算方法
纯电动汽车虽然在环保方面优势突出且电机技术已趋于完善,但纯电动汽车的竞争劣势仍在于其续航能力不足和相对价格偏高。制动能量回收技术作为电动汽车重要节能途径,利用电机回收部分制动能量,能有效提高能量利用率,增加汽车续驶里程。本文为了对飞轮储能装置的实际效果进行验证,进行了一种带有储能飞轮的纯电动汽车模型设计,并进行了仿真实验,与整车设计相比减少了开发成本和时间,为以后飞轮储能装置在纯电动汽车上的应用提
随着计算机技术和医学成像技术的进步,医生能够获取到的医学影像数据日益丰富,现代医学诊断对医疗影像的依赖性也随之增高,医学图像后处理在现代医学临床应用和研究中发挥着越来越重要的作用。医学图像分割和可视化是医学影像后处理的重要内容,是医学影像领域的研究热点。医学图像分割和可视化也是医学图像应用软件的核心功能,是现代医学诊断、手术指导等应用的基础。医学图像数据量大,人工分割耗时大且主观性强,准确、快速的
动态人群模拟是计算机图形学的重要研究领域之一,在公共安全、疏散模拟、影视制作、游戏动画等领域都有非常广泛的应用。但是现有的群体算法大多不能适用于多种情境下的人群模拟,而且大多算法没有考虑到行人的心理因素,模拟仿真出来的效果不佳。目前人群模拟技术的热点和难点是快速构建合适的模型用来满足多种情境下的仿真需求,而且能够达到良好的计算效率,甚至可以满足实时性的要求。针对这些问题,本文提出了适用于多情境下的
煤炭、石油和天然气等化石燃料的开采和燃烧产生了大量的温室气体和有害物质,不仅引发了能源危机,也带来了诸多环境问题。通过电解水将间歇性的风能和太阳能存储为氢能是解决能源和环境问题的重要途径。以铁、钴、镍为代表的电解水氧析出反应(OER)催化剂成为近来研究的重点。开发高效稳定的镍铁基(Ni-Fe基)OER电催化剂,是高电流密度电解水工业应用的重要前提。本文研究了三种新型的三维(3D)Ni-Fe基电催化
电流分流监测器芯片在当今复杂的集成电路系统中起着重要的作用,通过监测电子设备中的电流大小可以判断电路是否正常工作,从而能实时监测电路的工作状态,以避免出现瞬间电流过大而烧毁电子设备的情况。因此,设计一款具有高性能的电流分流监测器来精确地检测流向负载端的电流是十分必要的。本论文设计的是一款结构新颖的双向电流分流监测器,该电路能在输入共模电压-4~4V的范围内实现精确的双向电流检测,且在保证精度的前提
结肠癌是一种常见的消化道恶性肿瘤,大多数结肠癌由腺瘤性息肉演变而来,因此早期筛查结肠息肉具有重要的临床意义,通过结肠镜检测息肉是最有效的方法,在检测过程中可能会漏检某些息肉,利用计算机辅助诊断技术,对结肠息肉图像分割就显得很重要。近几年,随着医疗辅助诊断技术的逐步发展,产生了多种结肠镜下息肉图像分割方法,其中包括传统的结肠息肉图像分割方法和基于深度学习的结肠息肉图像分割方法,传统的结肠息肉图像分割
天波超视距通信是工作在短波频段内一种重要的通信方式,在军事和民生用途中都发挥着不可替代的作用。通信系统中收发天线质量影响着整个系统的工作质量,因此收发天线的设计至关重要。短波通信系统要求天线不仅在工作频段上实现宽频带特性,而且需在满足俯仰面和方位面波束指向的情况下,实现全频段高增益。短波天线物理尺寸大,占地规模巨大,需配套相应支撑结构和地网建设,建造成本十分昂贵。如何合理设计短波天线,使其在保证电