基于半监督LDA的文本分类应用研究

来源 :软件 | 被引量 : 0次 | 上传用户:ly518888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在如今信息数据大爆炸的时代,数据的增长呈现指数级增长,而且其中大部分数据是非结构化数据,这些数据中蕴藏着大量且重要的知识等待着我们用合理的办法将其挖掘出来,如何方便合理快速的进行文本分类也是一个非常重要的课题。LDA模型是一种无监督的模型,它可以发现隐性的主题,为了更有效的发现隐性主题,本文提出一种基于半监督的LDA主题模型,找到一个主题集作为隐性层的知识集,通过这种方法找到的主题与文本更相关,另外,将LDA模型与基于半监督LDA模型应用于文本的特征提取,并与其它特征提取方法比对,实验表明,半监督LDA模
其他文献
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
BACKGROUND: Functional MRI (fMRI) demonstrates the localization of hand representation in the motor cortex,thereby providing feasible noninvasive mapping of fun
金融危机促使城投公司在短时间内数量激增,得到了迅猛发展,但是随着供给侧结构性改革的深入,国家开始加强对地方政府的债务管理,限制了城投公司的融资能力,而城投公司在迅速
由于5G接入平面中多种接入技术并存,以及用户不规则的、趋向按需的主动式移动性特点,接入网络之间的负载不均衡问题更加突出,并导致了接入网络的资源浪费以及较低的用户体验
以北京市延庆县为研究对象,以1999年和2004年森林资源调查数据为基础,以地理信息系统为技术支持,分析和评价了5年间该场森林资源的数量、种类及其结构在时间和空间上的动态变
目的 分析老年糖尿病患者在治疗过程中给予心理护理的效果.方法 选取老年糖尿病患者300例,随机分为试验组和对照组各150例,入组的所有患者均接受常规护理服务,而试验组患者对
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
目的 比较股骨内侧支撑钢板联合空心钉和3枚空心钉治疗青壮年股骨颈骨折的近期疗效。方法 回顾性分析我院2015年6月至2017年1月收治的21例青壮年股骨颈骨折患者临床资料,采用