政务数据质量评估与提升的研究与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:sweetorange888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
政务数据开放共享已经成为时代发展的必然趋势,在政务数据开放共享的过程中,数据的质量问题是影响数据价值的关键因素之一。如何对政务数据进行客观准确的质量评估与提升已经成为当前的研究热点。目前为止,众多学者已经在数据质量评估和提升两个方面取得了累累硕果,然而,已有的模型和算法仍然存在一些问题,例如:利用层次分析法计算权重太过于依赖人为的主观判定、而熵值系数法却完全基于客观数据确定权重、传统的向量空间模型需要大量的特征项才能够完全匹配整个文本、k-近邻算法将每个指标都做相同处理而忽略了各指标之间的相互关系等。基于对这些问题的思考,本文主要围绕政务数据质量评估和提升两大主题进行研究,并在研究过程中对这些模型或算法的不足进行改进。本文的主要贡献如下:(1)在政务数据质量评估方面,本文首先利用加速遗传算法改进了层次分析法,在对判别矩阵进行一次性检验时确保其为最优解,同时这一方法也可以针对所有元素进行修正;其次利用指标间的冲突系数对熵值系数法计算出的权重进行了修正;再次将二者结合,形成兼顾主观因素和客观因素的组合权重;最后,基于该组合权重,利用多级模糊综合评判法对政务数据进行质量评估。实验结果表明,利用该组合法计算出的权重准确地修正了各指标的权重比例,最终的质量评估结果也更加客观真实。(2)在政务数据质量提升方面,本文主要针对三种存在质量问题的政务数据:重复数据、缺失数据以及异常数据进行数据质量的提升。在解决政务数据质量中的重复数据问题时,本文采用文本段概念对向量空间模型的改进,体现出了特征项处于不同位置的意义,接着计算出各文本段向量的相似度进而识别出近似或者重复数据,进而解决重复数据的质量问题;对于缺失数据,本文在使用k-近邻算法时使用马氏距离代替传统的欧氏距离进行近邻的计算,这一方法不仅考虑到了各记录项取值时的差异,而且也考虑了各个记录项之间的相互关系,更加精确地对缺失值进行了预估;处理异常数据时遵循经典的拉依达准则,并将其中使用到的贝塞尔公式进行了优化,从而提升了循环处理多个异常值的效率。最后经过实验对比分析,证明了以上三种方式相较于传统方式的优越性。
其他文献
学位
学位
随着城市轨道交通的迅猛发展,人工冻结法已成为隧道联络通道中一种最为可靠安全的地层加固方法,而在冻结过程中土体产生的冻胀现象会对地下管线、地表建筑产生不利的影响,轻则增加工程成本,重则危及工程安全,造成无法挽回的损失。有鉴于此,有必要对在冻结过程中地层产生的冻胀现象进行更近一步的研究,本文以杭州地铁某联络通道冻结工程为背景,采用数值模拟与模型试验相结合的手段,深入研究联络通道冻结施工过程中地层内部的
随着民族共同体思潮的发展,越来越多的学者开始关注少数民族审美范畴,藏族作为我国极具民族特色的少数民族,其艺术类型多样,审美特征显著。研究其审美范畴对扩充我国审美范畴有着重要意义,一方面可以帮助我们对藏文化的内容有更深理解,更为重要的是还可以丰富我国民族审美范畴的种类,使中国审美内涵更加细腻、丰富的呈现。唐卡是藏族艺术中一种独具魅力的艺术形式,它具有鲜明的民族特色和审美风格,是藏文化重要的组成部分。
第五代移动通信系统(5th Generation Mobile Communication System,5G)的时代正在到来。依照国际电信组织(The 3rd Generation Partnership Project,3GPP)的工作进程规划,5G的第一研究阶段的第一版Rel-15标准已于2018年8月冻结。5G非独立组网的增强以及5G独立组网技术,也正在继续研究与推进中,以完全实现5G的技
随着互联网与移动互联网的高速发展,网络中的数据呈爆发式增长,如何在缩小数据规模的情况下保留数据中的信息量变得尤为重要。为了更好地提取大量文本中的信息,自然语言处理领域提出了自动文本摘要生成任务。自动文本摘要通过计算机自动化地提取文本主要内容并进行压缩,从而帮助人们快速获取知识。的方法主要分为抽取式方法和生成式方法两种。抽取式摘要可以较为准确地提取原文中的要点,但是摘要句子的排序以及连贯性差是其存在
证券市场禁入是以限制相对人营业权为内容的行政处罚措施。2020年正式施行的《证券法》再次强化了市场禁入的法律效果,与之不相称的是市场禁入的适用条件仍然保持了原来概括式的规定。在适用条件的现状上,市场禁入制度包含三种禁入后果,证监会不加区分地并用违反了过罚相当的原则,单一的严重性标准一方面不合理地提高了市场禁入的门槛,另一方面使采取市场禁入丧失正当性基础。因此,为了保护相对人的经营权、约束证监会裁量
目的探索专业化心理护理培训在新入职护士规范化培训中的应用效果,为新入职护士规范化培训中薄弱环节提供新思路、新途径,为护理管理者如何实施高效的护士规范化培训提供实证参考。方法采取非随机整群抽样的方法,选取2017年和2018年辽宁省锦州市某综合性三甲医院的新入职护士作为研究对象,对照组为2017年新入职护士80人,采用常规的新入职护士规范化培训,试验组为2018年新入职护士80人,采用在常规的新入职
随着信息时代的发展,使得传统行业面临了前所未有的挑战和冲击。作为我国国民经济的支柱产业,建筑业近年来的发展规模依然不断扩大,随着国家不断推进城镇化建设和“一带一路”政策等的深化,其在未来很长一段时间内依然会是我国经济的支柱产业。但在近年以来建筑业增速放缓,亟需通过建筑信息化来注入活力。广联达作为国内领先的建筑软件信息服务商,在2015年面对外部经济下行的压力下,开始由销售软件向提供服务的SaaS商
经济转型升级过程中,出现一批低收入乃至贫困群体。为保障群众的基本生活需求,国务院发布了《城市居民最低生活保障条例》(简称低保制度)。低保制度的推进,在一定程度上解决了贫困群体的基本生存问题。该群体在享受低保政策的同时,也受到来自方方面面的诸多排斥。排斥具体体现在哪些方面,低保群体又是如何应对这些排斥,是本文要研究的问题。基于社会排斥理论和社会认同理论,本研究利用观察法和访谈法,以H市D社区的九名低