【摘 要】
:
特征选择是文本分类技术的一项关键技术,特征选择的质量决定了分类的性能。在分析现有特征选择方法的基础上,引入类词频概念,建立"文档—类—词"立方体。实验表明,这样的立方体模型能更全面、更客观刻画特征的本质,兼顾了特征的类内分散度更平均、类间集中度更集中。结合类词频选择的特征提高了文本分类能力。
【基金项目】
:
贵州省教育厅自然科学研究青年项目(黔教科20100095)
论文部分内容阅读
特征选择是文本分类技术的一项关键技术,特征选择的质量决定了分类的性能。在分析现有特征选择方法的基础上,引入类词频概念,建立"文档—类—词"立方体。实验表明,这样的立方体模型能更全面、更客观刻画特征的本质,兼顾了特征的类内分散度更平均、类间集中度更集中。结合类词频选择的特征提高了文本分类能力。
其他文献
为了能正确检测显著性图中的多个显著性目标,提出了一种基于全局颜色对比的显著性目标检测算法。该算法首先提取图像的全局颜色对比度特征,然后把显著性图和全局颜色对比度作为特征输入条件随机场框架中,得到二值显著性掩模,最后经区域描绘子计算得到包含显著性目标的最小外接矩形。在两种公开的数据集上的实验结果表明,该算法在精度、召回率以及F-测度方面的表现优于现有其他几种算法,在计算效率上也具有一定的优势。因此,
为解决先验概率作为重要性密度函数因未融入最新的观测信息而造成测量精度低的问题,提出了迭代容积粒子滤波。此算法采用Gauss-Newton迭代和容积卡尔曼滤波设计重要性密度函数,在迭代过程中不断修改新息的方差和协方差,使重要性密度函数更接近后验概率密度。此外,为确保状态协方差矩阵的正定性,采用了平方根滤波的思想,通过正交三角分解来代替每次迭代的矩阵开方操作。仿真实验证明,此算法可以提高滤波精度,适用
随着网络中部分路由器使用了负载均衡策略,发往同一目的端的数据包不再沿着单一路由转发,传统的拓扑测量工具Traceroute将难以发现网络中的负载均衡链路及节点,测量精度受到影响。多路径路由探测算法(MDA)在端到端网络拓扑测量中能够有效地发现负载均衡节点产生的多条路径,但探测量却是Traceroute的近10倍。提出一种改进的多路径路由探测算法,通过设置全局查找表,源主机能够自适应地选择探测策略以
与传统三维激光扫描仪相比,Kinect作为一种新型深度相机,具有价格低廉、深度数据获取能力强、RGB影像与深度影像同步获取等优势,然而面对较大室内场景精细建模却存在数据量大、建模范围有限、对硬件环境依赖性强等问题。因此,在现有单一模型建模基础上,提出了基于Kinect深度影像的多模型数据融合方法,实现模型间的自动拼接。最后通过两组实验对提出的数据融合方法进行了验证,并取得了较好的模型拼接效果。
由于追求收敛速度与防止陷入局部最优,标准的改进强度Pareto算法(SPEA2)过于注重全局搜索能力,从而导致局部搜索能力不足。为了增强SPEA2算法的局部搜索性能,进而提高算法收敛速度,提出了一种基于局部搜索的改进SPEA2算法。该算法单独设置一个新外部存档集以保存局部搜索后的非支配集,并且改进了交叉算子,加入了部分个体更新策略。将该改进算法与SPEA2算法进行了收敛性能比较实验。仿真实验结果表
针对硬件面积、价格成本、功耗、实时性和可靠性多目标优化的一类嵌入式系统软硬件划分问题,提出了一种采用多属性决策技术的求解方法。首先对可靠性指标进行了转换,通过改进的最短路径算法获得满足约束的Pareto方案集合;然后,采用基于组合权重的TOPSIS算法对多个划分方案进行评价排序,得到最优的多目标划分解;最后,通过一个实例验证了本方法的有效性和可行性。
提出了一种基于平均相关技术的快速精密的GPS信号C/A码捕获方案,该方案将接收到的中频信号和本地复制C/A码以高采样频率进行采样,然后通过对它们进行平均处理后以1 024点的FFT处理器计算相关能量值。与不经过平均处理的基于FFT的码捕获方案相比,该方案的运算复杂度约为1/22,可实现快速捕获的目的;与捕获精度为半个码片的常用码捕获方案相比,该方案的捕获灵敏度理论上提高约2.2 dB。最后通过仿真
为解决P2P网络中Chord算法众多节点性能不一、节点频繁离开和加入制约系统性能的问题,提出了基于信息相关度的分组改进算法。该算法通过引入节点信息相关度的概念,对原Chord进行信息相关度的一个分组调整。从每个组选出两个超级节点组成超级组,同时为每个节点增加了逆时针路由,在两个超级节点顺逆两个方向上选择出最短路径进行查找。实验表明,改进后的算法使得系统的性能和适应性都得到了加强,提高了Chord在
针对现有多目标元胞遗传算法存在邻居单一固定、不能适时变化的缺点,提出一种基于邻居自适应的多目标元胞遗传算法。该算法在经典多目标元胞遗传算法的基础上引入邻居自适应机制,动态调节邻居结构,使算法不断寻找全局搜索与局部寻优之间的平衡点。最后,与现有流行的其他多目标进化算法作比较,通过对不同类型的20种基准测试函数问题进行测试,证明该算法具有良好的收敛性和扩展性。
为了减小所生成的组合测试用例集规模,提出了一种基于one-test-at-a-time策略的差分进化算法来求解该问题的方案。通过实验,比较了不同变异方式的优化性能,考察了各个算法参数对优化性能的影响,并与其他常用方法进行了对比。实验结果表明,与其他常用的组合测试用例生成方法相比,基于差分进化算法的生成方法能够生成规模更小的组合测试用例集。并且组合数越多,该算法的优势就越明显。