不平衡样本集分类算法研究

来源 :计算机应用研究 | 被引量 : 16次 | 上传用户:smarten
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机在处理不平衡数据集时,对少类样本的分类效果很不理想。传统的处理方法尽管能够提高少类样本的分类准确率,但多类样本的分类准确率却大幅度下降。综合考虑样本间的相对距离和密集程度,提出了一种欠采样方法。基于UCI标准数据集的仿真实验结果表明,提出的算法不仅可以提高少类样本的分类准确率,而且将多类样本的分类准确率的损失降到最低。
其他文献
单一评分相似性度量及数据稀疏导致了传统推荐算法计算出的用户或项目近邻不准确、推荐质量不高,为此,提出了一种多因素复合度量的协同过滤推荐算法。该算法基于用户访问次数、停留时间及评分定义了一个多因素约束的相似性计算函数,避免了单一评分相似性度量问题,提高了相似性计算的准确度;同时,基于项目类别、目标用户已访问的项目、已访问过待预测评分项目的用户、访问时序建立了项目及用户信任模型,在数据稀疏及冷启动时用
在节点采用RWP移动模型的移动无线传感器网络中,为了提高网络的综合性能,提出了一种新的路由算法LDM。LDM运用节点在RWP模型的运动特点及节点的运动方向与当前位置,推导出节点的传输概率,并使用传输概率来指导路由选择,同时对节点的消息队列进行了有效的管理,提高了网络的综合性能。通过在ONE仿真器上与Epidemic、DT、FAD算法进行比较,结果表明LDM在综合性能上得到了提升。
半自动2D转3D是解决当前3D影视内容匮乏的重要途径。现有方法大多借助局部邻域进行深度插值,忽略了图像的全局约束关系,因而难以准确恢复深度图的对象边界。针对该问题,提出邻域扩展的最优化深度插值方法。首先引入邻域的邻域,建立邻域扩展的最优化深度插值能量模型;其次在相似的像素点与其邻域加权深度平均值的差异近似相等的假设条件下,将深度插值能量模型的最优化问题转换成一个稀疏线性方程组的求解问题。实验结果表
考虑实际生活中商品供应商具有严格的营业时间限制、客户的个性化送货时间预设以及道路路况影响运输成本等因素,建立带多种约束的关联运输调度问题模型。通过聚类算法和节约算法构造初始解,提高求解速度;自适应地改变启发式因子和期望启发式因子,提高算法收敛速度;引入遗传操作算子,自适应改变交叉概率和变异概率,提高算法的全局搜索能力;提取核心路径便于进行后期优化;通过3-opt与车场交换,提高算法的局部搜索能力。
针对水污染运移仿真表现力不强的问题,采用复杂性理论思想,在干流河道多尺度分解的基础上形成水质体积微元,建立具有吸附行为、自净行为、沉降行为、挥发行为、平推行为、扩散行为和演化行为的复杂agent模型,开展基于高性能计算技术的agent计算力优化,实现以多agent涌现为特征的污染物运移仿真模拟,并在数字地球上进行可视化表现。实验表明,该方法能够有效反映污染物的演化状况,并可以汇集3S所提供的地形地
对软件演化信息的度量能发现软件演化过程中的问题,预测其变化趋势。传统的软件演化信息度量技术主要是以文件、目录或者项目作为度量的基本单位,缺乏在较高抽象层次对软件系统进行度量的能力。在基于构件的软件配置管理模型的基础上,以构件作为软件演化度量的基本单位,提出了一组基于属性变化、适用于构件以及软件系统演化度量的公式(包括较近、较早演化度量,演化相似性度量等),并开发了原型支撑系统。
以新浪微博为研究对象,基于PageRank算法思想,参考网络群体结构平衡理论并且结合微博用户固有属性等因素,提出一种评估微博用户可信度的模型UC及相应的算法,以解决微博用户可信度比较问题。UC模型由用户自评估和用户互评估两个子模型构成,首先根据每个微博用户的固有属性使用自评估模型计算出每个用户的初始可信度值,然后将用户的初始可信度值作为用户互评估模型的输入计算出每个用户互评估可信度得分,从而对用户
随着本体数量的不断增加和语义Web的发展,多用户本体协同操作成为发展的必然趋势,但是在共同协作的本体环境中总是充斥着各种冲突,所以协同演化冲突检测和消解是亟需解决的一个问题。提出了一个分类检测并消解演化冲突的结构化方法,根据演化冲突的复杂程度分为直接冲突、衍生冲突和不一致冲突,针对不同类型冲突的特点构建相应的协同演化冲突检测算法,最后通过判断演化冲突对中是否存在可删操作和寻求最大一致子序列进行冲突
针对传统的语义网本体和上下文感知系统不适合处理现实世界中动态知识这一问题,借鉴了语用网在表达动态知识方面的优势,提出了语用网驱动的上下文感知系统,设计了语用网驱动的上下文感知系统框架。该系统采用了一种高效、新颖的上下文获取技术,可以更加准确地捕获用户的真实意图,并在此基础上通过推理得到具有决策能力的高层上下文。最后通过基于智能体的上下文感知服务发现方法,实现"以用户为中心"的个性化推荐服务。