基于散度差准则的文本特征降维研究

来源 :计算机应用研究 | 被引量 : 12次 | 上传用户:g123s123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究了一种基于散度差准则的文本特征抽取方法。首先讨论了文本分类中特征降维的主要方法及其特点,然后分析了一种基于散度差的准则用于特征降维的原理和方法,从理论上对该方法的相关步骤进行了数学论证。在中文文本分类实验中,对KNN分类器进行了基于密度的改进,消除了由于文本分布倾斜对分类器产生的影响。实验结果表明,这种方法在文本分类的准确性方面效果较为理想。
其他文献
以TiOSO_4为初始原料、H_2O_2为络合剂制备过氧化钛酸(peroxo-titanic acid,PTA)溶胶;再以PTA溶胶为前驱体、以P123为软模板剂组成水基自组装体系,可以制备一系列具有较高比表
采用煤基直接还原熔分技术研究了高铁铝土矿含碳球团的还原熔分工艺,考察了直接还原熔分工艺对粒铁尺寸和粒铁收得率以及熔分渣中Al2O3品位的影响.结果表明:当球团碱度为1.0,
针对环形薄壁类粉末冶金零件压坏的残余应力进行分析,采用修正的Dracker- PragerCap弹塑性本 构模型对金属粉末压坯压制、卸载和脱模过程进行数值模拟,同时考虑不同零件压坯
提出一种基于改进的肤色分割和距离变换的快速人脸检测算法。该算法对传统肤色分割进行了改进,使得肤色分割更加可靠,而且能够对图像中的多个人脸进行快速定位。实验证明该方法是有效的。
采用热分析以及合金平衡组织结构分析,对Mg-Zn-Y系Mg_(91.4)Zn_(7.2)Y_(1.4)合金中的相变及其相关相平衡进行了研究.结果表明,Mg_(91.4)Zn_(7.2)Y_(1.4)合金在440℃时处于α-Mg固溶体和准
在结合多尺度图像分析和水平集图像分割模型的基础上提出了一种新的多尺度图像分割方法。首先使用引入梯度向量流的全变差方法对图像进行多尺度空间分析,然后使用一种改进的CV模型进行分割。采用变分水平集方法作数值计算,因此该方法能够处理曲线的拓扑变化。实验结果表明该方法是有效的。
通过分析三种常见文法的利弊,采用了扩展的BNF文法进行文本语法规则的描述,并通过准引用(qua-si-quote)和语法糖方法对该文法进行了改进和扩充,增强了文本语法的描述能力和易用性。通过准引用方法,已经被建立好的文本语法元素的抽象语法能够被重用来构造新的语法元素。通过使用语法糖,新的语法构件能被转换到存在的语法构件上。当元模型在实例上执行计算或编译时,可以通过脱糖(desugar)转换操作,建
提出了一种新型的基于OLSR的层次化改进算法HOLSR,旨在提高OLSR的整体效率。该算法通过分层设置洪泛范围和灵活调整各层拓扑控制分组的更新周期,降低路由执行开销;同时采用差值路由补偿技术提高数据分组的传输效率。仿真实验结果表明:HOLSR与OLSR路由算法相比,数据分组成功传输率高,端到端延迟小,路由协议开销少;与DSR、AODV、DSDV等典型路由算法相比,在不同节点移动速度和不同通信负载下
以国内某钢厂电工硅钢为研究对象,通过工业试验及取样分析,系统研究了铝脱氧工艺条件下电工硅钢连铸中间包钢液和铸坯中夹杂物数量和面积分率的变化规律.在本实验条件下,得到
比较选择了Internet环境下群决策的研讨方式,设计了合理的、动态的研讨流程;提出了一种基于向量相似度的衡量专家间一致性的方法,并在此基础上研究选取了合适的专家群体一致性判断算法;最后通过实例对该平台的实用性加以验证。