用于文本分类和文本聚类的特征抽取方法的研究

来源 :微计算机信息 | 被引量 : 0次 | 上传用户:yinyueemo1122334
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本信息处理已成为一门日趋成熟、应用面日趋广泛的学科。文本分类和聚类技术是应信息检索和查询需要而出现的自然语言处理领域的重要研究课题。面对急速膨胀的各种文本信息,通过使用文本分类和聚类技术,人们能对这些信息进行高效地组织和整理,以便于实现信息的准确定位和分流,从而提高用户查询和检索的效率。本文针对文本信息处理中最重要的研究方向——文本分类和聚类技术展开了研究,分析了特征抽取法在文本分类和文本聚类中应用的重要性,以及论证了为何要对文本进行特征抽取,最后分别阐述了用于文本分类和文本聚类的特征抽取方法。
其他文献
清朝末年,外敌入侵导致了严重的民族危机,有识之士把地理学作为挽救民族危亡的武器,出现了史地研究热潮,屠寄就是其中的佼佼者,他在史地著述中发展出民族的、爱国的、经世致
本文通过介绍电力变电设备日常工作常见的问题,提出电力变电设备日常巡检关键点及其维护要点,以期为有关电力系统的巡检和维护人员提供参考。
目的观察重症监护室(ICU)分离出的多重耐药菌的耐药性。方法选取入住ICU的患者共360例,经临床分离出多重耐药菌231株,采用相应的药敏鉴定来进行耐药性分析。结果分离出231株
报道了广东省外来入侵植物:玄参科(Scrophulariaceae)新记录属——孪生花属(Stemodia L.)及新归化种——轮叶孪生花(Stemodia verticillt(Mill.)Hassl)。标本存放于华南植物
目的探讨心电导联PICC置管在直结肠癌患者化疗中的运用效果。方法选择2017年9月-2018年9月的老年结直肠癌化疗患者60例,并将患者随机分为对照组和观察组,对照组采用化疗药物
目的探讨塞来昔布联合氨基葡萄糖治疗膝骨性关节炎的疗效。方法选取门诊膝关节骨关节炎患者180例,随机分为塞来昔布组、氨基葡萄糖组以及塞来昔布与氨基葡萄糖联合组,各60例,
利用现场可编程门阵列FPGA实现单片机的外设接口电路可以简化单片机系统的硬件电路,提高系统的集成度、可靠性和系统设计的灵活性。本文介绍了基于FPGA的单片机外设接口电路
文章首先针对天然气关键特征进行分析,并在此基础上就油田天然气的收集方法和处理工艺进行逐一讲解,希望对从事油田天然气集气加工工作的相关技术人员具有一定价值的参考。
介绍了山西省医疗机构服务能力分析与评估系统开发的必要性,描述了系统设计方案、运行流程、分析方法及应用情况。通过该系统的应用,及时收集全省二级以上医疗机构病案首页数
在新医改形势下,针对医院临床科室管理中存在的普遍问题,河南省人民医院实施了临床科室经营助理制。临床经营助理主要通过对临床科室医疗资源配置效率分析、流程优化、绩效评