基于状态空间约简的政策基因组挖掘与确认方法研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:gipy2a1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国法治社会的逐步发展,各个领域政策制定进一步完善,不断有新颁发的政策,与此同时旧的政策仍在沿用。因此,政策文本分析在政策研究领域受到越来越多的关注,成为我国法治社会发展需要迫切解决的重要问题。本文在分析和总结国内外政策研究和文本相似度计算现状及成果的基础上,提出了一种基于状态空间约简的政策基因组挖掘与确认方法。针对传统向量空间模型中的“高维稀疏”问题,该方法首先利用自然语言处理技术对政策文本进行预处理,采用基于自动摘要的状态空间约简方法,建立了合理的政策文本表征维度。在该过程中,解决了因领域专家评估而造成的特征词权重不稳定及效率低下的问题,同时为了解决政策文本中特征词之间的同义关系,提出了一种基于影响度的词汇替换算法。然后在政策文本状态空间约简的基础上,引入了政策血缘这一概念,并结合遗传学中生物基因的性质,对政策基因进行了相关的定义和获取。最后利用政策显性基因进行文本相似度计算,当基于显性基因的政策文本相似度数据和传统的政策文本相似度数据的差值超过一定的阈值,则挖掘政策隐性基因,并将政策显性基因和隐性基因共同作为政策基因组的一部分,从而达到了利用政策基因组替代政策文本进行相似度计算的目的。本研究解决了大规模海量政策文本分析中因相似度计算复杂度过高而导致效率低下的问题,为高效和准确地进行政策文本分析提供了必要的基础。最后,本文在实验数据集上进行了反复实验验证,并通过对比本文所提方法和传统的方法,验证了本文所提出方法的有效性。
其他文献
构式语法是认知语言学研究中一种新的理论模型,自上世纪八十年代兴起,至今已取得了很大的发展。其创始人Goldberg认为,构式作为语言的基本单位,是形式与意义的配对。Goldberg
研究目的:广东省U-16女足这支队伍主要任务是参加第十四届全运会,本文通过对广东省U-16女子足球运动员备战期两个训练阶段身体机能指标变化进行监测分析,通过运动员机能指标变化情况来判断训练负荷量和强度安排是否合理以及这一阶段训练负荷安排是否达到了教练员的要求,了解备战期运动员身体机能状态,从而为教练员调整训练负荷制定训练计划提供参考依据。研究方法:本文以广东省备战第十四届全运会女子U-16年龄段1
轮对和钢轨之间的相互作用是轨道车辆运动的显著特点之一,尤其是在车辆经过曲线的过程中,轮轨之间的作用力和磨损也相应的增加,因此有必要研究轮轨相互作用的的磨损关系,为进
随着信息化的深入,中医作具有悠久历史的中华民族传统医学,在其几千年的临床实践和理论研究中积累了大量的方剂。中医方剂相关信息越来越多,如何从这些宝贵的数据库资源中找
研究背景及目的原发性肝癌是最常见的恶性肿瘤之一,是癌症相关死亡的第二大病因[1]。据报道肝细胞癌的全球发病率正在上升,预计到2025年每年新发患者将超过100万人次[1]。手
近年来,由于中红外(25μm)光纤激光器在大气通信、医疗诊断、环境监测和国防安全等方面具有广阔的应用前景,所以其受到众多研究者的关注。Er3+:4I11/2→4I13/2的能级跃迁可以实
微生物燃料电池(Microbial fuel cell,MFC)是一种新型燃料电池技术,它可以利用有机物作为碳源,将有机物中的化学能转化为电能。本研究中微生物燃料电池以受污染河涌底泥作为
虚拟手术是一种利用计算机、触觉反馈设备、视觉跟踪装置等实现外科手术模拟的技术,通过逼真的人体器官组织三维重建和力学模拟、精确的视觉定位和真实的触觉反馈,虚拟手术系
研究目的肝内胆管癌(ICC)是发病率仅次于肝细胞癌的原发性肝脏恶性肿瘤,手术是目前唯一可能达到根治的治疗方式,但是预后仍然较差。因此,有必要对ICC做进一步的研究和分析,尤
参薯(Didorca altoa L.)是地下块茎作物,因其易栽培、易管理的特点,种植面积不断扩大,但其生物量较大的茎叶资源却未得到利用。为了将参薯茎叶资源变废为宝,促进资源良性循环,提高参薯产业综合效益,本研究选取21个参薯品系,进行茎叶营养物质测定和饲用价值评定,筛选出饲用价值最高的品系进行青贮发酵品质的评价和青贮条件的优化;采用培养与未培养的方法对青贮发酵中的功能微生物种类进行分析,主要研究