基于搜索的短文本分类算法研究

来源 :电子技术应用 | 被引量 : 0次 | 上传用户:michaelbing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统分类算法在处理短文本时的不足,提出了一种基于搜索的NaiveBayes文本分类方法。该分类方法对文本数据集规模、文档长度、类别数量、分布等情况综合考虑,对朴素贝叶斯算法进行改进,将搜索技术应用到了文本分类领域。该分类算法能够更好地适用于微博、微信、短信、短语评论等短文本分类领域。并且在分类算法、分类器构造和评估3方面进行了详细的介绍。实验证明,基于搜索的文本分类器对于短文本有更好的分类效果。
其他文献
随着物联网概念的提出和相关技术的发展成熟,物联网的应用领域日趋广泛,文章就物联网在职业学校智能教学、校园安全、后勤服务等方面的应用发展现状及需求进行了分析,结果认为,物联网的应用必将引起教学模式和管理模式的变革,并最终提升教育信息化水平,同时有利于教育质量的提高。
简要阐述了TPC的编码原理和基于Chase算法的迭代译码方法,并通过译码算法仿真得出TPC在AWGN信道下的性能以及TPC与MSK的级联码在AWGN信道下的性能。最后对得到的性能进行了分析,并对其在无线通信方面的应用进行了展望。
智慧旅游是利用云计算、物联网/泛在网等新技术,通过互联网/移动互联网,借助便携的终端上网设备,主动感知旅游资源、旅游经济、旅游活动、旅游者等方面的信息,及时发布,让人们能够及时了解这些信息,及时安排和调整工作与旅游计划,从而达到对各类旅游信息的智能感知、方便利用的效果,为人们提供更便捷、高效的旅游服务。
从NFC工作模式及应用出发,提出了将NFC技术应用到燃气表和手机终端,由用户使用NFC手机读取NFC燃气表数据并上传到燃气公司来实现远程抄表的实现过程。此设计中具体包含了NFC燃气表的功能设计、结构设计等内容,具有一定的实用价值。
针对大量小水电位于偏僻的山区,传统的电力通信手段难以覆盖而处于无监测状态运行,会对电网安全生产带来隐患的现状,研究设计了一种基于TWACS(电力线工频通信)技术的小水电远
为了提高定位系统在目标定位上的精度,减少过多的硬件设施投入和能量成本,提出分布式多跳误差估计的能量高效目标位置感知算法(NFDV-Hop)。在定位精度上,DV-Hop算法采用每跳的
为提高医生心音听诊的准确性,设计了一种可视化心音采集系统。PSoC4芯片采集心音信号,经片内放大、滤波,由音频功放模块实现实时听诊,采用软件数字滤波器算法滤除干扰信号,处
航天器用应变片是某系列卫星上用于星箭解锁装置的重要力学测量元件。依据星箭解锁分离包带应变片粘贴工艺规范,总装检验人员需要在粘贴前对应变片进行检查和筛选。鉴于原有
Buck型变换器中主要有近端和远端反馈两种侦测模式,随着补偿精度要求的提高,补偿点位置的选取对负载芯片工作稳定性的影响越来越大,依靠经验来选择补偿方式已不能满足设计要
介绍了Windows最复杂的内核对象IOCP(I/O Completion Port输入/输出完成端口)的基本原理。利用完成端口机制,应用程序能够为数百上千的用户服务。文章通过完成端口对象指定一定数量的线程,对重叠I/O请求进行管理,从而为已完成的重叠I/O请求提供服务。通过该模型编写的网络服务应用程序可以达到较好的性能。