【摘 要】
:
大数据具有体量大、来源和格式多样、增长速度快、价值密度低和处理难度大的特点,即使通过合理设计参数对某段数据进行点估计的结果可能相当令人满意,但通过应用标准统计程序
【基金项目】
:
河南省科技攻关项目(No.182102210486);河南省高等学校重点科研项目(No.18A520008)
论文部分内容阅读
大数据具有体量大、来源和格式多样、增长速度快、价值密度低和处理难度大的特点,即使通过合理设计参数对某段数据进行点估计的结果可能相当令人满意,但通过应用标准统计程序对整个数据体进行精度估计得到的结果,却是差强人意,从而误导人们。目的旨在分析影响大数据清洗的主要因素有哪些,首先回顾了数据获取对时间序列的依赖性并构造了一个大数据模型,然后在列出数据估计时所用的一些属性后,给出了数据清洗时的回归分析,同时探讨回归系数估计的可能影响。最后给出了大数据处理中误差累积的通用表示方法,提出了与时间序列理论中短程和长程依赖之间的区别大致相同的问题。
其他文献
<正> 肾气丸,又名金匮肾气丸、八味肾气丸、八味丸、崔氏八味丸、桂附八味丸、八味地黄丸、桂附地黄丸。本方首见于东汉.张仲景的《金匮要略》,于第五、六、十二、十三及二十
广域网环境下产品信息集成是目前研究的热点和前沿,XML以其灵活的数据结构、开放式的数据访问以及与网络的密切结合为产品信息集成提供了强有力的支持.本文提出了基于XML的冲
目前,能源危机、环境污染等问题不断涌现,如何降低能源消耗和保护环境已成为经济社会实现可持续发展的迫切问题。在这种情况下,绿色节能技术的出现对解决能源消耗过大和生态
随着时代的发展,我国城市化进程不断加深,城市的建设逐渐趋于完善,使得我国的城市居民的生活在很大程度上有所提高。本文分析了基于园林美学的公园景观形态设计,以期对我国的
与狼共舞第三步:整合行销烟草业的营销主要需要从几个方面进行改变:从零散的战术创意正向系统战略营销转变;以产品为中心的营销向以品牌建设为中心的营销转变;以价格为竞争导
《中药单用/联合抗生素治疗社区获得性肺炎临床实践指南》于2017年6月7日在中华中医药学会发布。本文从指南的编制原则、组织管理、检索策略、证据筛选及评价、指南技术内容
山东百部为山东省特有植物。本研究选取4个山东百部种群,对其种群分布格局、年龄结构、静态生命表、表型分化和遗传多样性进行了研究:采用扩散系数的t检验、Poisson分布的x2
这个结果已发表在近期的临床心理学杂志上。为期3年的一项临床观察研究显示从开始治疗就用Zyprexa的患者在6个月观察期内的暴力行为显著低于开始时就服用Risperdal的患者;继续
[目的]研究萆薢渗湿汤对慢性前列腺炎患者疗效及慢性前列腺炎症状评分(NIH-CPSI)、干扰素γ(IFN-γ)、肿瘤坏死因子-α(TNF-α)、白细胞介素-4(IL-4)水平的影响。[方法]选取