【摘 要】
:
短文本建模的稀疏问题是短文本主题建模的主要问题,文章提出基于词向量的短文本主题建模模型—语义词向量模型(Semantics Word Embedding Modeling,SWEM)。采用半自动的方法
【基金项目】
:
江西省教育厅科学技术研究项目(GJJ151362)
论文部分内容阅读
短文本建模的稀疏问题是短文本主题建模的主要问题,文章提出基于词向量的短文本主题建模模型—语义词向量模型(Semantics Word Embedding Modeling,SWEM)。采用半自动的方法对短文本信息进行扩充,对短文本相应词语进行同义词林处理,增加短文本集合中词共现信息,丰富文档内容,推理出较高质量的文本主题结构,解决短文本的词共现信息不足的问题。实验表明,SWEM模型优于LDA、BTM等传统模型。
其他文献
本文根据近期国内外有关高导电石墨层间化合物的研究,讨论了影响石墨层间化合物导电性与稳定性的结构因素
据悉,在郑州长途汽车站附近,有一小杂货摊,门前放着一个硬纸板,上书"问路付钱"四个大字。南方某报一位记者路经此地,因出于好奇,于是便上前询问:"请问,火车站附近的一马路怎
本文概述了国内外粉体材料电阻率的测试方法,设计出一种新型的粉体电阻率的自动测量仪器。它根据欧姆定律原理。其特征在于测量装置的机械部分使用了压力传感器,测量装置的电
武汉钢电股份有限公司是按照国家有关法律组建的股份公司,其中武钢占总股本金8.89亿的44%,是控股公司,法人股东单位122家,内部职工股民18万人。我公司现有职工487人,其中党员
把用各种骨料焦制得的市售炭电极在其焙烧温度与2500℃之间进行热处理。通过对φ60×40mm圆柱体试样作径向压缩试验,测定了它们的抗拉强度。又通过对低倍放大的入射光显
本文通过实验研究提出了制备含不同石墨质冷捣糊的配料比和工艺条件,对制品主要技术指标的分析表明:含30~40%人造石墨的冷捣糊优于传统底糊,糊料中配入适量天然石墨可改善制品
本文在PAN基炭纤维连续炭化过程中,探讨了纤维在高,低温炭化炉内的长度变化以及牵伸对最终炭纤维抗张强度的影响。结果表明,当高,低温炭化炉连在一起时,随着低温炭化炉温度的
本文评论焦炭热膨胀测定的工艺状态、各种因素对测定值的影响和焦炭热膨胀系数对石墨电极工业的重要意义。
一炼钢厂党委按照"平改转"工程的要求,坚持做到"三抓三到位"。即:抓观念转变,促思想到位;抓作风转变,促职责到位;抓制度落实,促管理到位,为全面承接新工艺提供了强有力的思想
下岗分流、减员增效是搞活国有企业的重要举措。江泽民同志在党的十五大报告中指出,要"实行鼓励兼并、规范破产、下岗分流、减员增效和再就业工程,形成企业优胜劣汰的竞争机