基于K-Means和Apriori算法的多层特征提取方法

来源 :华中师范大学学报(自然科学版) | 被引量 : 0次 | 上传用户:xxj8880430
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
根据科技文献的结构特点,论文提出了一种四层挖掘模式,并结合K-means算法和Apriori算法,构建一个新的特征词提取方法——MultiLM-FE方法.该方法首先依据科技文献的结构将其分为4个层次,然后通过K-means聚类对前3层逐层实现特征词提取,最后再使用Aprori算法找出第4层的最大频繁项集,并作为第4层的特征词集合.该方法能够解决K-means算法不能自动确定最佳聚类初始点的问题,减少了聚类过程中信息损耗,这使得该方法能够在文献语料库中更加准确地找到特征词,较之以前的方法有很大提升,尤其是在
其他文献
本文通过对高水平男子篮球比赛中最后两分钟进攻形式、得分形式、得分手段的研究分析,希望能从中探索出高水平比赛最后两分钟战术打法的规律,对推动我国篮球运动发展具有积极
案例2010年年底,深圳ABC物流公司将广州某贸易公司的一批参展货物从深圳运输到美国一个内陆城市。深圳ABC物流公司向该贸易公司签发了货代提单。货物到港后,美国代理在内陆中
目的总结睾丸扭转的诊治经验.方法回顾性分析13例睾丸扭转的临床诊治资料.结果8例行睾丸复位固定术,5例行坏死睾丸切除术.结论早期就诊、早期手术探查是提高睾丸存活率的关键
目的探讨2型糖尿病(T2DM)合并颈动脉硬化斑块形成的相关危险因素。方法选取2016年1月—2016年9月在我院内分泌科确诊的150例2型糖尿病病人作为研究对象,根据其是否合并颈动脉硬
目的观察在胫腓骨骨折患者中采取快速康复护理路径的应用效果。方法选取2017年1月—2018年12月收治的胫腓骨骨折患者82例,随机分为观察组41例(快速康复护理路径)和对照组41例
20世纪八九十年代见证了对《洛丽塔》评价的转变,评论家纷纷把评论的中心从小说的形式转移到亨伯特个人行为的探讨上。评论家开始对洛丽塔的缺席产生浓厚的兴趣,认为正是亨伯
本文论述了颈内静脉置管常用于血液透析、中心静脉压监测、快速扩容、肿瘤病人的大剂量化疗和肠外营养治疗等.2001年至今本科采用导丝引导颈内静脉置管运用于血液透析治疗10
目的通过对我国商品龙胆的本草学研究,考证其基源及品种,并对以往文献记载的错误和混乱进行澄清.方法资源调查及鉴定.结果其中最主要的有4种:条叶龙胆Gentiana manshurica Ki
通过添加不同比例蟹味菇菌糠及棉籽壳配制成5种不同的栽培配方,观察鸡腿菇在不同栽培配方中的出菇情况,并对比了不同栽培配方出菇前后栽培料中木质纤维素和木质纤维素降解酶
目的探究老年冠心病心绞痛患者62例临床护理方法及其效果。方法选取我院2014年1月至2016年2月收治的62例老年冠心病心绞痛患者为研究对象,将患者随机分为对照组和常规组,各31