基于LDA与距离度量学习的文本分类研究

来源 :湖南师范大学自然科学学报 | 被引量 : 0次 | 上传用户:wangchuabnao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于隐含狄利克雷分布(LDA)与距离度量学习(DML)的文本分类方法,该方法利用LDA为文本建立主题模型,借助Gibbs抽样算法计算模型参数,挖掘隐藏在文本内主题与词的关系,得到文本的主题概率分布.以此主题分布作为文本的特征,利用DML方法为不同类别的文本学习马氏距离矩阵,从而较好的表达了文本之间的相似性.最后在学习到的文本间距离上,利用常用的KNN及SVM分类器进行文本分类.在经典的3个数据集中的实验结果表明,该方法提高了文本分类的准确率,并且在不同的隐含主题数目参数下能体现较好的稳定性.
其他文献
目的探讨甲氨蝶呤联合秦息痛片(青风藤水提物片)对类风湿性关节炎(RA)患者外周血辅助性T细胞(Th)17/调节性T细胞(Treg)及白细胞介素-37(IL-37)表达的影响。方法选择2015年1月^2017年2月
目的 探讨重度子宫内膜异位症术后使用GnRHa与孕三酮的临床效果.方法 选取60例重度子宫内膜异位症术后患者随机分为两组,对照组患者在应用GnRHa治疗6个月; 观察组患者在应用G
上虞区2019年要根据建设“创新之区、品质之城”的总体定位,围绕国家创新型城市建设的总体目标,全面实施“创新发展三年行动计划”,激发科技创新引领发展的第一动力,集聚优质
为了解翘嘴鳜胚胎发育中miR-146a的表达规律以及温度对miR-146a表达的影响,将翘嘴鳜受精卵分别在22℃和25℃水温下孵化,并利用实时荧光定量方法检测miR-146a在各个发育阶段的
在调查数据的基础上,对中国37所研究型大学图书馆文献计量服务现状进行分析、比较和评价,总结中国研究型大学图书馆文献计量服务实践进展中取得的成绩和有待改进之处,并借鉴
分析了工程建设法规课程的特点,提出了该课程创新教学的思路,并利用层次分析法构建了该课程的教学质量评价的层次分析模型,该评价模型可操作性强,有较好的实际应用价值.
5月9日,以“机器智联赋能万物”为主题的第六届中国机器人峰会暨智能经济人才峰会在宁波举办。在开幕式上,举行了中国机器人峰会专家委员会成立仪式。该专家委员会共有成员26
在大学教学过程中,图书馆是校内重要的数字资源提供者,但是并不是唯一的提供机构。以上海海洋大学为例,研究分布于图书馆、教务处(教学平台)、网络中心的校内数字资源的特点,并结合读者的实际需求调研,提出了整合校内数字资源协同服务于教学的建议和措施。
20.1 引言 混合参数表面波浪预报模式(HYPA)可用于深水海浪预报。这个模式是早期NORSWAM模式(Gunther等,1979a,b及Ewing等,1979)的一个引伸。除了一维风浪谱的参数预报外,它还包
本文提出了双插值有限元法求解一类非线性抛物组,它对未知函数和系数都采用了插值,于是某些常数矩阵可一次性计算好,每时间层组装刚度矩阵很简单.它是一种经济格式.