大数据处理流程中影响数据质量的因素及改进措施探讨

来源 :科学与财富 | 被引量 : 0次 | 上传用户:qqboygogogogo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:在信息技术高速发展的时代背景下,大数据发挥了重要的作用,通过对总体数据的处理与分析,能够对事物的发展趋势进行分析预测,有助于决策制定的科学性和合理性。由于大数据具有数据量大、数据类型繁多的特点,所以在处理的过程中任何一个环节出现失误,都会对最终的数据质量产生影响,降低大数据的应用价值。文章主要对大数据处理流程中影响数据质量的因素进行分析,然后有针对性的提出改进措施,为提升大数据应用价值创造良好的基礎。
  关键词:大数据;处理流程;数据质量;改进措施
  大数据技术是指通过对海量的数据信息进行处理,然后获取事物之间的关联程度以及未来的发展预测,通过大数据分析,能够为各项决策的制定提供更加科学合理的依据,这就要求大数据在整个处理流程中能够保证较高的质量。大数据质量主要指适合于进行数据分析、处理、预测等使用过程并满足用户需求的特征,所以大数据质量贯穿于整个大数据流程中。为了更加有效的控制大数据质量,从大数据处理流程的层面出发,本文主要对数据收集、数据预处理与存储、数据处理与分析、数据应用等各个环节影响大数据质量的因素进行分析,然后提出改进措施,提高数据质量的可控性和精准性,提高数据结果的应用价值,促进大数据技术在我国经济发展中发挥更大的作用。
  1.数据收集环节影响数据质量的因素及改进措施
  数据收集是获取原始大数据集合的过程,从不同的数据源实时或及时的收集各种类型的数据。在数据收集过程中,不同的数据源、收集方式和收集技术都会对大数据质量的真实性、完整性、一致性、精确性、时效性和安全性产生影响。如果网站、系统和传感器设备在运行过程中出现安全威胁,就会导致数据信息被恶意攻击与篡改。在采用网络爬虫进行数据收集时,如果在设定的时间内没有完成规定数据的收集,就会影响到数据收集的时效性。为了保证数据收集环节的数据质量,企业应该对数据来源进行甄别和验证,保证数据的真实性和有效性,对关系到用户隐私的敏感信息采取不收集处理,合理选择数据收集技术,做好各项网络安全防护措施,确保数据收集质量。
  2.数据预处理与存储环节影响数据质量的因素及改进措施
  大数据预处理和存储是进行数据处理与分析的重要基础,因为大数据来源广,为了保证大数据分析与预测结果的准确性和价值性,需要对收集到的大数据进行预处理,包括数据清理、数据集成、数据归约、数据转换等环节。在预处理过程中,任何一个环节的操作失误,都会影响到数据质量。数据存储是通过不同的存储介质和组织管理形式对大数据进行存储和管理,不同的数据存储技术都有自身的优点和缺陷,对大数据的时效性、安全性等质量会产生影响。为了提高数据预处理和存储质量,应该完善预处理的管理,不断提升各项处理技术水平。根据数据形式和数据储存技术特点,选择适宜的存储技术,保证数据的安全性和可用性。
  3.数据处理与分析环节影响数据质量的因素及改进措施
  大数据处理是对海量的数据进行分析与处理,大数据的存储形式和业务数据类型不同,处理效率和方式也不相同,为了保证大数据的价值性、可用性、时效性和准确性,应该根据大数据类型选择适宜的存储形式和数据处理系统,确保大数据质量的最优化。数据分析直接关系到大数据集合的价值性和可用性,在数据处理环节即可完成对已有数据的分布式统计分析,对于未知数据进行的聚类和分类、关联分析和深度学习等,需要通过数据分析技术完成。应该根据大数据的应用情境和决策需求来选择适宜的数据分析技术,从而提升数据分析环节的数据质量。
  4.大数据应用环节影响数据质量的因素及改进措施
  在大数据经过分析处理等一系列过程中,会将所得到的结果提供给用户进行应用,这是对大数据分析的结果进行检验和验证的重要环节,可直接反应出大数据处理结果的可用性和价值性。为提高大数据应用质量,在数据收集和处理之前,应该对数据的用途和用户的需求进行深入的调查分析,然后为大数据的收集、存储、处理、分析等环节提供有力的保障,确保目标的明确性,最终保证大数据处理结果具有较高的应用价值。
  5.结语
  在竞争激烈的时代背景下,数据信息成为企业制定各项决策和方案的重要依据,为了保证决策和方案的科学性、合理性,就需要有高质量的数据信息的支持。大数据技术是对海量数据信息进行综合处理后得到的结果,可为企业制定决策和方案提供重要的数据支持。大数据具有规模性、高速性和数据来源多样性的特点,所以导致数据处理流程中可能产生不一致和冲突,进而影响到数据质量,降低数据结果的应用价值。通过对大数据处理流程中数据的质量控制,可切实提升大数据的应用价值。
  参考文献:
  [1]孙敏,王琳.大数据时代下的数据可视化方法分析[J].软件,2019-09-15.
  [2]刘梅招,罗慧,付彬宏,周钰山,张宸.基于大数据分析的动态传输数据质量自适应监测[J].自动化与仪器仪表,2019-08-25.
  [3]裴文华.对大数据审计中数据质量控制的几点探讨[J].中国审计报,2019-08-21.
其他文献
摘 要:幕墙属于现代建筑的重要设计元素,能够凸显出建筑形式与风格。此次研究基于几何学角度,分析建筑幕墙几何控制方法,涉及到幕墙设计思维理念以及工程技术,希望能够对相关人员起到参考性价值。  关键词:建筑幕墙;设计方法;几何控制  外墙是建筑的外界面,最初无饰面与结构之分,砖石作为建筑结构主体,被当作饰面所表现。随着建筑学的快速发展,幕墙设计开始被作为建筑外立面设计的主要内容。幕墙设计能够在形式与技
期刊
摘 要:品牌形象设计是品牌的形象与其识别度的一次提升升华,加入品牌的定义及品牌符号的导入及管理,使其拥有完整的一套形象体系建立;后街店铺的整体改造是本次毕业设计的课题,其街道是一条老旧且具有年代感的“商圈”,最终选定改造的项目是一家卖包子的早餐铺,我们根据其品牌定位与消费人群,融入节日习俗,结合人物形象的表现形式,使其具有新生命力与活力,符合当代人的视觉审美与设计趋势,从而最终在市场中快速落地并达
期刊
摘 要:毫无疑问电力企业与电力市场的关系是非常紧密的,它们之间相互促进,电力企业是电力市场当中非常重要的一个组成部分之一。本文对电力市场与电力营销的基本情况进行了详细的描述,并且就改变电力企业营销质量的主要方法进行了全面的探讨,对于改变电力企业服务质量的主要方法进行了全面的讨论。  关键词:电力市营销;电力优质服务;营销;作用;  引言:  电力市场的发展过程会受到诸多方面的影响。在这些影响因素当
期刊
摘 要:随着教育改革的深化进行,高等职业师范院校在教学方法、加学体系等多方面也进行着不断的探索和实践。师范专业是一门注重理论性和实践性都较强的专业,实践教学是师范专业每个细分专业都必须要进行的重点教学环节,如今的教学理念认为实践教学的目的是培养学生应用理论知识并与实践相结合的能力,以提高学生的专业综合能力和综合素质。但就目前高职师范院校的实践教学而言,仍存在实践教学体系不完善等问题,本文首先对高职
期刊
摘 要:课堂教学是师生进行相互交流的过程。大学的课堂往往是教师的单向交流,学生也常常是沉默的。提高师生交流的积极性,教师要采取措施引导学生乐于交流,学生要积极主动与学生交流。  关键词:课堂交流;大学生;教师  课堂教学是师生进行相互交流的过程,积极有效的师生交流可增进师生间的了解、配合,提高教学质量。课堂教学要注重师生之间的交流。大学课堂上,师生交流的情形怎样呢?如何才能提高师生交流的积极性呢?
期刊
摘 要:本文阐述了验收工作的重要性,分析了验收异常线损减少的原因及其对异常线损减少的影响检查并接受工作方式。在此过程中,电力生产和应用在工作模式逐步达到了智能化、自动化的水平。其中一个最突出的变化是复制、线损和功率因数损耗的原因,提出了采用收、验管理减少异常线损的措施同行提供了一些参考。降低线损是供电企业最基本的任务之一。  关键词:抄核收工作;线损异常;措施分析  引言:线损,也称为有功损耗。电
期刊
摘 要:患者心力衰竭时同时一般还会有代谢异常的问题,这种情况可能会促进心衰的发展。学者们近几年的研究结果表明,通过对心脏能量代谢进行调节,可以有效改善衰竭心脏的功能,一定程度上控制心衰问题,改善患者的生活质量。本文便针对心力衰竭的情况下的薪级能量代谢改变以及代谢治疗展开基本阐述。  关键词:心力衰竭;能量代谢;代谢治疗;  引言:  心力衰竭又叫心衰,它是多数心脏病的终末事件,它属于一种涉及功能异
期刊
摘 要:水电站中,水轮机发挥着重要的作用。水轮机持续运转,在运行中存在故障是在所难免的,这就需要针对故障采取有效的措施解决。本论文着重于研究水轮机运行中的故障分析及处理措施。  关键词:水轮机;运行;故障分析;处理措施  引言:  水电站要保持良好的运行状态,水轮机发挥着重要的作用。水轮机的运行要稳定,这是确保水电站安全可靠运行的基础。在水轮机运行的过程中发生故障问题是很正常的,需要具有针对性地采
期刊
摘 要:随着科学技术的飞速发展,电器技术自动化技术被普遍的应用到了煤矿的行业中。电气自动化技术的广泛应用不但有效的提升煤矿生产技术的水平,对推动煤矿行业的发展有着十分重要的意义。这是因为电气自动化技术不但能科学合理的对煤矿中的生产设备进行合理的操作,而且能有效的提升煤矿生产的效率为相关的工作人员提供更安全的保障。基于电气自动化技术对煤矿生产的重意义,本文将对电气自动化技术在煤矿生产中的应用进行深入
期刊
摘 要:大學生心理健康问题频发,造成诸多不良后果,为能让学生更准确,更及时的发现自己的里健康问题,本文设计一套基于深度学习的大学生心理测量系统。该系统根据SCL90,UPI等量表,利用深度学习技术进行情感分析和作假判断,以提高心理测试的准确性。用户可通过网页或客户端,进行语音、文字、视频多维度心理测量。系统综合得出准确的心理测量结果并根据分析结果给出相应的治疗方案。同时,本系统拥有持续性心理监测模
期刊