一种基于神经网络与LDA的文本分类算法

来源 :计算机工程 | 被引量 : 0次 | 上传用户:SYNJONES123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统隐含狄利克雷分配(LDA)主题模型在文本分类计算时利用Gibbs Sampling拟合已知条件分布下的未知参数,较难权衡分类准确率与计算复杂度间的关系。为此,在LDA主题模型的基础上,利用神经网络拟合单词-主题概率分布,提出一种文本分类算法NLDA。在THUCNews语料库和复旦大学语料库上进行实验,结果表明,与传统LDA模型相比,该算法的平均分类准确率分别提升5.53%和4.67%,平均训练时间分别减少8%和10%。
其他文献
基于"花旗-北大2009年农村金融调查"数据,本文定量考察了农户受正规信贷约束的影响因素,并研究了信贷约束对农户消费结构的影响。通过引入"广义信贷约束"概念,我们分别考察了
D2D(Device-to-Device)通信是一种用户间不需要经过基站中继转发数据的通信技术。当D2D通信引入传统的蜂窝网络时,不仅可以提升系统的频谱利用率,还可以降低基站的负荷。在D2D通信中引入中继技术,可以避免用户间距离过大导致的通信中断,同时增大网络的覆盖面积。但是D2D用户复用蜂窝用户资源时会与蜂窝用户产生同频干扰问题。如何设计有效的中继选择和功率分配算法显得十分重要。本文重点研究单小
阐述了熔融固体润滑剂熔渗微孔预制体的熔渗原理,通过对微孔预制体孔隙特征的统计学分析和熔渗过程的动力学分析,建立了熔渗饱和度和熔渗压力的表达式,分析了影响熔渗质量及
刑侦情报信息是公安机关同刑事犯罪作斗争的重要基础业务和有效侦查手段,随着刑侦信息化的建设和发展,情报信息服务侦查破案的方式呈多样化和现代化,警力随着警情走,措施跟着警情
数字图像处理是指利用计算机对图像进行处理的方法。图像是人类视觉的基础,而视觉是人类感知世界的重要手段之一。图像分割是图像处理中的基本问题之一,它是将一幅图像中感兴趣的对象分离出来,即将图像分为若干个有意义的子区域或对象。图像分割是图像识别至关重要的预处理,正确的分割才会带来正确的识别结果,因此图像分割是图像处理中比较重要的研究技术。研究者提出了很多种图像分割算法,基于统计学的图像分割方法对图像处理
<正>语文课程作为一门实践性课程,强调课程的目标和内容聚焦于语言文字运用,突出实践性和综合性特点,要求学生在阅读和表达的实践上下功夫。一、"以写促读"策略在阅读教学中
目前,低碳已经成了全球的热点问题,而低碳旅游作为低碳经济的重头戏更是被各界关注。我国的旅游业现在也正向着低碳方向发展,虽然低碳旅游的发展还有很长一段路要走,不过,在
在畜牧业飞速发展的今天,畜禽生产力已能保持稳定,但随着社会不断发展,生活品质的不断提升,人们对畜禽产品的需求也逐渐增加,因此如何在保证生产的基础上提高畜禽繁殖力成为
随着我国国民经济的持续发展,居民生活水平、消费水平逐步提高,我国与国际社会间的开放、交流与合作程度也进一步加强。出境旅游作为我国旅游行业一个重要的细分市场迎来了快速发展的机遇期,呈现迅猛发展的趋势。同时,在“她经济”时代背景下,女性消费市场势不可挡地崛起。近几年女性不论是从出游频次还是出游花费都有显著提高。女性旅游者已成为中国出境旅游市场中不可忽视的主力军,而女性旅游者主体构成更加扩大化、层次化,