搜索筛选:
搜索耗时4.3560秒,为你在为你在102,285,761篇论文里面共找到 4 篇相符的论文内容
类      型:
[学位论文] 作者:郭开彦, 来源:东华大学 年份:2019
在当今大数据时代背景下,数据质量直接影响相关任务的有效性。数据质量专家估计,错误的数据可能会使企业损失其系统执行预算总额的10%到20%,并且一个项目的执行可能需要花费40%到50%的项目预算在数据清洗中。数据清洗是一个耗时,耗力和繁琐的过程。数据质量的好坏直......
[期刊论文] 作者:郭开彦, 王洪亚, 程炜东,, 来源:软件工程 年份:2018
ADC(Active learning based data cleaning system)运用主动学习的方法,在高效的清洗过程中,部分利用用户交互,提升模型清洗能力,提高数据质量。ADC包含学习模块和选择模块。...
[期刊论文] 作者:程炜东,王洪亚,郭开彦, 来源:智能计算机与应用 年份:2019
为了处理贝叶斯建模中的脏数据,通常会有2种解决方法。一种是对整个数据集进行清洗,但这种方法的代价很高,且对中型或大型的数据集可行性较低。另一种是使用点估计,这种点估...
[期刊论文] 作者:孙辞海, 王洪亚, 郭开彦, 程炜东, 来源:智能计算机与应用 年份:2023
自动化的数据清洗技术可以极大地提升数据清洗的效率,但会导致一定的错误率和不可靠的结果,通过引入人的参与,对建议修改值进行检查可避免错误的修改,同时对最终结果的可靠性有直观的评估。基于上述考虑,本文提出了一种基于确定度的交互式迭代清洗方法,该方法利用主动......
相关搜索: