基于LDA特征扩展的短文本分类方法研究

来源 :软件导刊 | 被引量 : 0次 | 上传用户:sophie8112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对短文本信息篇幅短、信息量少、特征稀疏的特点,提出一种基于LDA(Laten Dirichlet Allocation)主题模型特征扩展的短文本分类方法。该方法利用LDA模型得到文档的主题分布,然后将对应主题下的词扩充到原来短文本的特征中,作为新的部分特征词,最后利用SVM分类方法进行分类。实验结果表明,相比于传统的基于VSM模型的分类方法,基于LDA特征扩展的短文本分类方法克服了特征稀疏的问题,在各个类别上的查准率、查全率和F1值都有所提高,充分验证了该方法对短文本分类的可行性。
其他文献
乡村变迁内在的逻辑是,工业化和城市化不断地改变着乡村的经济结构和社会结构。当前,我国农村发展面临城乡二元结构、依托城市体系开展区际竞争发展模式、传统村落组织重构梗
批判性思维包括具有情感特质的批判性思维倾向及具有认知能力的批判性思维技能。80年代相关研究传入我国,首先在护理学、教育学和心理学等领域引起了热烈讨论和广泛关注。而在
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
基于湖北汉江生态经济带10市(林区)2010—2015年的面板数据,根据PSR模型框架和改进的熵值法,构建评价指标体系,从压力、状态、响应、综合指数4个角度,按空间和时间两个维度对
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
会议
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在近20年来,物联网技术正在逐步全球化,受物联网时代的影响,智能家居行业搭上了这班顺风车,借此飞速发展。通过几年的技术研究与实践,物联网家庭网络基本覆盖了我们大部分家
目的:观察放射治疗(以下简称放疗)联合热疗治疗锁骨上淋巴结转移癌的临床疗效。方法将76例锁骨上淋巴结转移癌患者随机分为2组,治疗组38例应用放疗联合热疗,对照组38例应用单纯放
本届中国政府致力于将中国打造成为活跃于全球贸易的综合体,并制定了“一带一路”构想作为其战略路线,试图打造与“一带一路”沿线国(以下简称“沿线国”)人民相知相交、互信
目的 分析农村健康体检人员脂肪肝的检测情况.方法 采用多级整群抽样的方法,于2010年1月~2012年12月对绍兴市马山镇农村社区进行健康体检的3000人进行问卷调查、体检、实验室