论文部分内容阅读
在流数据到来的个数为一般概率分布的条件下,以不放回随机抽样方式计算了流数据样本均值的期望和抽样误差,给出了流数据按分段进行随机抽样的动态样本均值存储方法,证明了动态存储数据具有优良的统计性质。最后用双气体传感器阵列数据集中乙醇(Ea)变量为实例数据,以流数据抽样方法进行了相关计算并与蓄水池抽样方法进行了比较,结果表明流数据抽样方法以较小的存储空间存储的样本可以得到较高的抽样精度。