稀疏自动编码器在文本分类中的应用研究

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:gb1107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的文本分类算法都是采用期望交叉熵、信息增益和互信息等统计方法,通过设置阈值获取特征集.如果训练集的数据量较大,则容易出现特征项不明确、特征信息丢失等缺陷.为解决上述问题,提出运用“深度学习”中的稀疏自动编码器算法自动提取文本特征,然后结合深度置信网络形成SD算法进行文本分类.实验表明,在训练集较少的情况下,SD算法的分类性能低于传统的支持向量机;但是在处理高维数据时,SD算法则比支持向量机具有较高的准确率和召回率.
其他文献
目的通过128层CT血管成像(CTA)对脑梗死与颈脑动脉狭窄之间的关系进行研究,并对危险因素进行相关分析。方法回顾性分析2011年9月至2012年10月收治的颈脑血管疾病患者606例的临床
农村公社作为不以血缘关系为主的自由人的村落共同体,自产生以来,均程度不同地存在于前资本主义的各种社会形态中。农村公社为平地村社与山地村社。通过对居住在中国西南山区的
目的:观察玫瑰花蜜膏联合多潘立酮治疗功能性消化不良的临床疗效。方法:选取我院2010年4月至2015年4月收治的50例功能性消化不良患者作为本次研究的观察组,采用玫瑰花蜜膏联合多
本文从调查内容与调查方法、水量水质监测等方面分析讨论了入河排污口调查与监测中涉及的有关规范及技术问题。入河排污口调查与监测工作的合理化规范化开展,可掌握本流域入河污染物排放规律和排放总量,为入河排污口治理、限制纳污统计、水资源保护和管理提供基础信息和数据支撑,对加强水功能区管理及河长制、湖长制的执行具有重要意义。
品牌文化是一个城市、一个企业持续发展的巨大且持久的推动力量。南阳“四圣”品牌文化是南阳独有的、特色最突出的龙头品牌文化,它对于城市的发展是一种积极的力量,这种力量主
本文简单介绍了智能阀门定位器的高级诊断功能、主流厂商的定位器结构、高级诊断功能及实现高级诊断功能的途径,并对主流厂商智能定位器结构及功能进行了简单对比。
目的评价甲胎蛋白(AFP)、α-L-岩藻糖苷酶(AFU)、磷脂酰肌醇蛋白聚糖3(GPC3)及高尔基体蛋白73(GP73)联合检测在原发性肝癌(PHC)中的诊断意义。方法分别检测65例PHC患者、61例肝硬化患者
从2009年到2015年,由淘宝"双十一"造节的独舞到全民网络购物狂欢现象的出现,为人们展示了目前国人强大的网络购买力。该文从经济学角度对"双十一"购物的狂欢现象原因进行了分
目的:观察导致孕产妇发生早产与胎膜早破的具体原因,并分析给妊娠结局带来的影响。方法:择取2013年8月到2015年9月这两年间在我院就诊的发生早产及胎膜早破的30例患者,命名为研究
目的观察耳郭巨大血管瘤手术治疗的疗效。方法回顾性观察2005年至2011年收治的18例耳郭巨大血管瘤患者手术治疗后的疗效。结果 18例患者均治愈,重建耳郭成活,13例患者耳后区