【摘 要】
:
针对训练集对分类性能的影响,从训练集的文本数、类别数以及特征项数这三项数量指标出发进行研究。使用多因素方差分析方法及多种语料库定量探讨该三项数量指标对分类性能的影响规律。结果发现特征项数对分类性能的影响在不同的文本数和类别数时是不同的,分类性能受训练集的这三项指标的交互影响,通过对训练集的这三项指标进行优化,提出了从分类算法、特征项选择法以外提高分类性能的途径。在真实数据上的实验结果表明,该方法可
【机 构】
:
武汉大学信息管理学院,武汉大学信息资源研究中心,武汉大学图书馆
论文部分内容阅读
针对训练集对分类性能的影响,从训练集的文本数、类别数以及特征项数这三项数量指标出发进行研究。使用多因素方差分析方法及多种语料库定量探讨该三项数量指标对分类性能的影响规律。结果发现特征项数对分类性能的影响在不同的文本数和类别数时是不同的,分类性能受训练集的这三项指标的交互影响,通过对训练集的这三项指标进行优化,提出了从分类算法、特征项选择法以外提高分类性能的途径。在真实数据上的实验结果表明,该方法可有效提高分类性能。
其他文献
针对传统人脸特征点定位方法中存在的算法复杂、鲁棒性差以及精确度低等不足,提出一种基于局部特征区域快速高效的人脸特征点自动定位方法。首先对经过预处理后的人脸图像利用改进的积分投影算法结合肤色特性实现人脸区域的精确定位;然后在人脸区域内根据各特征部位的特性标定其特征区域;最后在特征区域内完成人脸特征点的自动定位。实验结果表明,该算法简单、具有较高的鲁棒性,且能够快速高效地实现人脸特征点定位。
国际教育局是联合国教科文组织框架下教育内容、方法和结构以及课程发展过程方面的专业研究机构。国际教育局(International Bureau of Education,简称IBE)于1925年在瑞士日内瓦
美国高等教育的十个时代是指从哈佛学院建立至今这段历史,其时代特征体现在三方面:大学课程、学生生活、大学结构。本文分析了美国高等教育每个时代或者说每三十年的变化特征,探
异构网络融合是下一代网络发展的必然趋势,网络技术接入形式的多样化使得含有多网络接入端口的用户终端可以自主地选择最合适的接入网络获取服务。给出了一种异构网络中的接入网络选择的策略,首先说明了用户对服务质量需求的非单调性,同时根据博弈论的方法建立用户和网络之间的非合作博弈模型,通过模型求解,确定了均衡网络和用户双方利益的优化策略。该接入网络选择策略可以帮助用户选择最合适的接入网络,为异构网络融合系统的
在CoMP技术中,当协作用户处于协作区域的边缘时,协作集中的基站受到辐射范围的限制无法为这些用户进行协作,导致这些用户的容量仍无法提高。提出一种联合Decode-and-Forward(DF)中继的解决方案,该方案通过测量用户的性能指标,将处于协作区域边缘的协作用户划分为中继用户,并通过中继为其转发数据。此外还就CoMP-Relay系统中协作用户的资源分配冲突问题,提出了一种基于比例公平的联合资源
针对电阻层析成像系统中图像重建不适定问题,与现有ERT图像代数重建算法不同,提出一种基于贝叶斯理论快速一步动态图像重建算法。在阐述电阻层析成像的理论基础上,利用有限元方法建立敏感场数学模型,得到灵敏度矩阵和投影数据。在分析贝叶斯理论基础上,推导出快速一步动态图像重建模型,并将介质分布的先验信息和噪声随机信息等统计信息引入到图像重建中,实现对电导率的重建。分析了不同分布先验概率参数和不同噪声信噪比等
提出了一种特征保持的三维点云迭代简化算法。首先对点云模型构造KD树结构,计算采样点的k邻域,然后利用点云模型的局部几何信息作为参数,包括局部采样密度、采样点的精度和曲率,计算评估函数值,迭代删除评估函数值最小的点。实验结果表明,算法在简化点云数据的同时,能有效去除噪声数据,而且很好地保留了原始模型的特征信息。
为了研究变异行为对病毒传播的影响,提出了一个病毒发生变异的疾病传播模型,在模型中考虑了两种病毒相互转换的过程,计算机模拟结果表明,两种病毒的稳态感染比例与它们之间的相互转换概率γ1和γ2有关,当γ1>0且γ2=0时,I1型感染者将消失,当γ1与γ2都大于0时,I1I2与γ1γ2成反比,且与α1β1和α2β2的取值无关。研究还发现病毒变异时由于缺乏对应的治疗药物和措施而出现一段真空期,这导致变异病毒
为了弥补保序加密算法的隐私泄漏问题,结合对称可搜索加密技术基本思想,提出一种新型的具有隐私保护功能的范围数据加密查询算法。在该算法中,将数字范围转换为特殊关键字并放入布隆过滤器进行存储与命中判定,其中密文信息仅与值域相关,与具体数据无关,从而保证了语义安全性。实验结果表明,该算法计算负载仅为线性增长。综合而言,该算法具有更高的安全性与良好的运行效率。
提出了基于曲面约束的地质层面重构方法,其基本思路是先构建断面形成约束曲面,在地质层面和断层拓扑关系约束条件下,形成基于断层曲面的空间约束的层面插值问题,并在层面穿越约束断面的部分进行矢量裁剪。通过仿真,该方法有效解决了复杂地质构造的层面的矢量重构问题;并通过实际的工区数据测试,有效支撑了复杂地质构造下的构造成图和构造建模应用。由此,该方法回避了现有方法存在的层面区域分割所需边界信息难以获取的问题,