【摘 要】
:
传统分类系统往往选择朴素贝叶斯算法作为分类算法,在研究过程中,发现朴素贝叶斯模型(NBC)具有以下前提条件:所有特征互不影响,并且特征属性的权重为1.研究后发现并非如此,在对
论文部分内容阅读
传统分类系统往往选择朴素贝叶斯算法作为分类算法,在研究过程中,发现朴素贝叶斯模型(NBC)具有以下前提条件:所有特征互不影响,并且特征属性的权重为1.研究后发现并非如此,在对数据进行分类时,有的特征可能对分类结果的影响较大,有的可能对结果影响较小.为了对算法进行优化,需要给不同的特征附上不同的权重值,才能更加客观的获得分类结果.本文研究了两种传统的基于属性权重的计算方法,同时考虑到手机取证数据的特点,提出两种适应于手机取证数据的改进权重计算方法,并对其改进原理进行研究,比较改进后的权重计算方法与传统的权重
其他文献
针对Hadoop Database(Hbase)仅支持主索引结构,即通过主键和主键的range来检索数据的问题,提出利用Counting Bloom Filter的新变体建立二级索引来支持非主键数据的检索.分析了
学习的目的是调查 ATP 的临床的价值和申请的目的为非小的房间肺癌症(NSCLC ) 引起的 hydrothorax 在化疗基于生物体之发光肿瘤 chemosensitivity 试金(ATP-TCA ) 。从 120
为了解决传统Canny边缘检测算法对噪声敏感的问题,针对噪声边缘弯曲度大且弯曲空间范围小的二维空间特性,构造了基于曲线曲率估计的边缘曲度算子,并利用大尺度Canny算法边缘检测结果对边缘曲度算子进行修正,使该算子能够准确地表征噪声强度在二维空间中的分布情况,在此基础上,提出了一种在边缘检测过程中加入边缘曲度算子进行噪声衰减的边缘检测算法.实验结果表明,算法在有效抑制噪声的同时,保留了变化丰富的细节
现存极化码译码算法仍然遭受非常高的复杂度.针对此问题,提出一种基于BP神经网络的SCL译码算法,该算法通过离线收集数据来搭建并训练一个合适的BP神经网络;借助已完成训练的B
研究了通过数据处理算法以提高Wi-Fi指纹库室内定位性能的问题.首先采集Wi-Fi指纹样本,将其放入MySQL数据库中和R工程;其次将Wi-Fi指纹库分成若干个簇,使用K-均值聚类(K-Means
发现移动用户在特定时间段的轨迹特征是实现用户个性化推荐服务的关键之一.采用过滤--精炼策略,研究了如何从单用户的大量轨迹数据中发现其在较长时间内的特定时间段的兴趣点.在过滤阶段,将用户连续若干天中同一特定时间段内的轨迹数据进行基于密度的聚类,从而得到用户在这些天中每天的该特定时间段的停留点.在精炼阶段,对所有的停留点再一次聚类,进而得到用户在这些天中该特定时间段的兴趣点.最后,通过实验验证了该方法