基于频繁项特征扩展的短文本分类方法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:bccom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
短文本具有特征维度高且稀疏等特点,导致将传统的分类方法应用于短文本分类时效果较差。针对此问题,提出基于频繁项特征扩展的短文本分类方法(Short Text Classification Based on Frequent Item Feature Extension,STCFIFE)。首先通过FP-growth算法挖掘背景语料库的频繁项集,结合上下文的关联特征,计算出扩展特征权重;然后将新特征加入到原短文本的特征空间中,在此基础上训练SVM(Support Vector Machine,SVM)分类器,并
其他文献
中浆(CSC)病变区域的大小对于病变的诊断及研究有着关键的作用,而视网膜神经上皮层脱离(NRD)形态在中浆病变中最为普遍且病变程度最为严重,因此快速准确地分割出NRD病变区域十分重要。给出一种全自动的频域光学相干断层(SD-OCT)中浆NRD病变分割方法。首次在三维空间进行NRD病变分割,将二维图像上的病变区域分割问题转化为三维空间的体分割问题,充分利用了数据的三维结构信息,提高了分割精度。18组
为了改善传统分水岭算法中的过分割现象,考虑到反射亮光对图像的干扰,提出了一种相对颜色空间下的梯度分层重构的分水岭分割算法。首先将彩色图像由RGB空间转换到与反射亮光无关的相对颜色空间;其次结合图像信息熵获得彩色图像的梯度图像;然后根据梯度直方图的分布信息,对梯度图像进行分层重构;随后采用形态学极小值标定技术对合并后的梯度图像进行强制标定;最后对修正后的图像进行分水岭分割。对不同类型的图像进行分割实
分块压缩感知的提出很好地弥补了大尺寸图像占用资源多、重构耗时长等不足,但重构后的图像存在明显的块效应。针对现有图像纹理复杂度分析不够准确,导致自适应采样率分配后块效应降低不理想的问题,提出了一种基于灰度共生矩阵的图像自适应分块压缩感知方法。该方法通过共生矩阵分析图像的纹理特性,自适应分配采样率,在总采样率不变的前提下使纹理复杂度高的子块获得较高的采样率,纹理复杂度低的子块获得较低的采样率,并用SA
文中提出了一种新的在线形式的非负矩阵分解,即在线学习非负矩阵分解(OLNMF)。OLNMF算法采用了增量形式的非光滑模型,并采用“选择遗忘法”控制新样品和旧样品的权重,提高了
针对大部分现有的人群计数方法被应用到新的场景时性能下降的问题,在多层BP神经网络框架下,提出一种具有无参数微调的人群计数方法。首先,从训练图像中裁切图像块,将获得的相似尺度的行人作为人群BP神经网络模型的输入;然后,BP神经网络模型通过学习预测密度图,得到了一个具有代表性的人群块;最后,为了处理新场景,对训练好的BP神经网络模型进行目标场景微调,可追求有相同属性的样本,包括候选块检索和局部块检索。
为了快速验证虚拟装配仿真过程中零部件的可装配性,改进了一种基于图像空间的快速碰撞检测算法。该算法首先通过半透明颜色叠加实现对无碰撞装配体的快速滤除,并确定出潜在的碰撞区域;然后利用像素深度值求出遮挡对象与待装配物体在其运动方向的最小分离距离,弥补了基于图像空间的碰撞检测算法只能判断物体间是否发生碰撞而不能求距的缺点;最后针对求距环节提出了一种像素区域划分策略,以提高算法的检测精度。测试结果表明,所
研究了辐射式雷达多目标模拟测试系统中,数字射频存储(DRFM)单元的设计问题,首先根据辐射式雷达多目标模拟测试系统的设计要求,提出一种基于高性能FPGA和软件无线电(SDR)技术
由于大多装备的原始测量数据采集信息量大、密度高,现有的时间序列滑动窗口的降维方法采用经验值确定窗口大小,无法最大限度地保留数据的重要信息点,并且计算复杂度高。为此,
分析现有的基于TDOA的无线传感器网络定位系统与算法,使用基于超声波传感器和无线射频模块的到达时间差(TDOA)测距技术,完成了该定位系统、机制和算法的设计和实现;针对传感器网络在实际应用中的不均匀性布撒和不良节点定位等问题,在TDOA测距技术和多边测量定位算法的基础上,提出一种改进的定位算法,以提高网络定位性能;实验表明,改进后的定位系统有效的减小了网络的定位误差,解决了不良定位问题,可应用到无
针对传统数字滤波在红外光谱细胞水分检测中采样点平均后各峰值削减的严重问题,提出了一种基于LabVIEW的滤波方案,设计了相应的相关算法,并对滤波信号进行时域和频域分析;在此基础上,构建并开发了基于LabVIEW的数据分析处理系统;实验结果表明,该数据分析处理系统测量精度高,数据实时处理能力强,具有良好的推广和应用前景。