一种有效的密度有偏采样算法

来源 :计算机应用与软件 | 被引量 : 2次 | 上传用户:sonim0
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
密度有偏采样技术是针对不一致数据集提出的一种采样技术,现有密度有偏采样方法在寻找聚类时容易受异常点的影响而产生错误的聚类。基于这一缺陷,提出了一种新的密度有偏采样——DOSP,在寻找聚类时,该算法可以利用密度有偏采样存在的空间划分,在计算子空间密度的同时搜寻异常子空间,并屏蔽对异常子空间的采样,从而有效地消除异常点的影响。实验证明该算法不仅有效地消除了异常点的干扰,而且在高噪声情况下,算法的计算代价明显降低。
其他文献
考虑了具偏差变元的一阶中立型微分方程的非振动解的渐近性,解决了Gram Matikopoulos等提出的1个猜想.
基于英文字母的文字特征,提出一种用希腊字母替换以嵌入水印的新方法,并将水印编码与差错控制码绑定,实现了对英文文本水印的盲提取、检测和恢复操作,突破了现有水印方法中水
对3种常用的测量配电网电容电流的方法进行了探讨,着重从实用性、安全性,对电网的影响和测量的精确度进行了研究分析.找出了3种方法的优缺点,适用范围和实际操作中的注意事项
英国一项新发布的研究指出,母乳喂养有助降低母亲的肥胖症及相关疾病风险。英国牛津大学研究人员发表报告说,他们的研究基于此前一项大规模调查所收集的健康数据,
研究了层次式多数据库中事务执行的正确性问题.给出了层次式多数据库的定义和结构以及建立在其上的事务结构,根据多数据的特点提出了一种层次式多数据库中事务执行正确性准则
模型检验是一种重要的形式化自动验证技术.检验一个模型是否满足LTL公式,可以把LTL公式转换为一个表示相同无穷状态序列的ω自动机,通过转换后的ω自动机与系统自动机的乘积
太阳黑子数是描述太阳活动水平的主要指标,太阳活动直接影响日地环境。依据前人对太阳黑子数的观测资料,采用小波分析和自相关相结合的方法,分析了1770—1869年的太阳黑子数年均值,得出了太阳黑子存在11—12年周期的结论;用该算法对噪声的鲁棒性进行了验证;结果表明该方法对研究太阳活动规律乃至天体规律是有效的。
国务院副总理邹家华近日强调,区域经济将是中国经济发展的一种新格局。 他说,应该在全国的总体规划下,充分发挥不同省市的区位优势、资源优势、市场优势、产业优势、发挥区域
选择了北京奥运主场馆及其周围的地区作为实验区,购置陆地卫星ETM+6个波段数据,从学习机制和技术流程上对贝叶斯网络分类和最大似然分类进行了对比,实验结果表明:贝叶斯网络分类方法在提高遥感数据的分类精度方面具有较大的研发潜力,贝叶斯网络为遥感数据分类处理提供了一种可选择途径。
日本名古屋大学研究生院一研究小组报告说,如果凝血酶原出现异常,血液凝固就无法“刹车”,可能导致血栓症。