多角度的特征提取方法

来源 :郑州轻工业学院学报:自然科学版 | 被引量 : 0次 | 上传用户:wenlai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以单个词语作为文本分类特征的传统方法会丢失词语的语义信息和必要的词语关系信息.在充分考虑词语的词频、语义信息和主要词语间依赖关系的基础上,提出了融合的多角度的特征提取方法.该方法利用词频和停用词表进行特征词的静态选择,基于知网利用语义信息进一步精简特征词,融入共现词组体现词语搭配关系并提高重要词语的分类作用.基于VSM的文本分类实验证明,该特征提取方法全面可行且能有效提升分类效果.
其他文献
以Fusion FPGA为核心器件,选用步进电机为电动车的主驱动,舵机控制转向,用倾角传感器来进行角度检测,用无线的GSM模块TC35来传输远程控制数据,设计一种基于FPGA的无线智能车.
针对常用算法在求解完全NP问题中最大团问题时,存在实验操作步骤过多、活体内不易操作以及环化效率不高等问题,设计了一种用二维DNA(k-臂DNA分子)结构来解决最大团问题的方法.
分析了多效冷凝制冷机组的传热和传质过程及风量、水量对机组冷凝效果的影响:空气与喷淋水交叉流动的结构可使多效冷凝制机组水泵的功耗更低;合理的风量及喷淋水量可强化水膜
从保证弹簧的频率与被夯实对象的固有频率相同或相近以及考虑冲击夯的起跳高度等方面,对工作弹簧刚度及相关参数进行设计,结合稳定性和强度计算,提出了大质量振动冲击夯工作弹簧
将神经网络与遗传算法相结合.提出了G-BP混合算法.该算法在BP神经网络训练过程中,利用遗传算法善于发现最优解区域的特点来优化网络权重值和阂值.在新建项目投资估算的具体应用中
针对常规的数据挖掘预测模型只进行单一预测且未对预测的准确度进行分析等问题,提出了一种将关联模型和基于最小二乘法的回归分析模型相结合的反馈预测模型,并使用最小均方算
采用ANSYS软件的参数化设计,在对螺旋槽干气密封端面流场进行数值计算的基础上,研究了螺旋槽结构参数对开启力和气膜刚度的影响.综合考虑较大的开启力和气膜刚度,计算结果表
针对路由器输入队列最大匹配调度算法中存在每个时隙内输入端口和输出端口匹配率低的问题,提出:在算法设计中,可通过改变更新轮询指针的方法提高端口匹配数目,解决输出端口同
对沿海地区轻型门式刚架在大气腐蚀情况下的力学性能和抗剪性能进行了研究,得出如下结论:随腐蚀时间的增加,门式刚架钢材的屈服强度、抗拉强度、伸长率明显下降;材料的初始强度越
针对手写体数字提取的特征维数过高且有冗余从而影响识别速度的问题,提出了基于遗传算法的高维特征选择方法.遗传算法采用类内类间比作为适应度函数,识别率高但速度较慢;而对手写体数字识别的仿真实验表明,特征选择方法虽然识别率在一定程度上有所下降,但提高了识别速度.