基于TNG特征扩展的MLFM-MN短文本分类算法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:nqqlove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在海量短文本中由于特征稀疏、数据维度高这一问题,传统的文本分类方法在分类速度和准确率上达不到理想的效果。针对这一问题提出了一种基于Topic N-Gram(TNG)特征扩展的多级模糊最小-最大神经网络(MLFM-MN)短文本分类算法。首先通过使用改进的TNG模型构建一个特征扩展库并对特征进行扩展,该扩展库不仅可以推断单词分布,还可以推断每个主题文本的短语分布;然后根据短文本中的原始特征,计算这些文本的主题倾向,根据主题倾向,从特征扩展库中选择适当的候选词和短语,并将这些候选词和短语放入原始文本中;最后运用
其他文献
随着经济的迅速发展,我国的城镇化现象较为明显,很多家长为了给学生更好的物质生活,都选择了出门务工,长年都见不到孩子,导致出现了较多的留守儿童,这些留守儿童由于从小缺乏来自于
针对单搜索引擎,研究了广告主竞投多个关键词时的广告时序预算分配策略,在总预算限制下建立了以最大化广告收益、最小化无效点击为双目标的单引擎多关键词广告时序预算分配模
由中国计算机学会主办、中国计算机学会高性能计算专业委员会、内蒙古和林格尔新区管理委员会、清华大学、内蒙古大学共同承办、北京并行科技股份有限公司协办的“2019CCF全
图像显著性特征已被广泛地应用于图像分割、图像检索和图像压缩等领域,针对传统算法耗时较长,易受噪声影响等问题,提出了一种基于HSV色彩空间改进的多尺度显著性检测方法。该方法选择HSV色彩空间的色调、饱和度和亮度作为视觉特征,先通过高斯金字塔分解获得三种尺度的图像序列,然后使用改进的SR算法从三种尺度的图像序列中提出每个特征图,最后将这些特征图进行点对点的平方融合和线性融合。与其它算法的对比实验表明,
拓展创新思维。古诗词语言精炼但意蕴深长,能给读者留下广阔的想象与品味空间。小学生要真正理解诗词内涵,就必须发挥想象力,进行画面补充,体会诗中情感。学生在诵读诗词时,
幼儿园是实施幼儿教育的主阵地,幼儿科学素养的形成要依靠幼儿科学教育,幼儿教师科学素养直接关系到幼儿科学教育的质量。大学学前教育专业,特别是以培养应用型人才为主的教
【正】注意!!!近来我们已经收到很多球迷的报名信件,感到欣慰的同时,也有很多遗憾,好多信封中除了报名表之外,只有一张不很清晰的小照片,甚至连照片都没有!有些选手在报名表
基追踪问题具有广泛的应用背景,近年来得到了大量的关注和研究。近点算法是解决该问题的一种有效算法,其关键是子问题的求解,利用线性Bregman迭代的求解思想进行Lagrange对偶分
研究了一种新的协同过滤推荐方法。针对推荐算法中相似度存在的不足,提出了兼顾"形状-距离"的云模型综合相似度测算方法;考虑用户之间的兴趣匹配,提出了云模型熟悉相似度的概念
传统忌一means算法由于初始聚类中心的选择是随机的,因此会使聚类结果不稳定。针对这个问题,提出一种基于离散量改进kmeans初始聚类中心选择的算法。算法首先将所有对象作为一