中文短文本分类技术研究综述

来源 :信息工程大学学报 | 被引量 : 0次 | 上传用户:xinxinde1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅速发展,网络上产生了海量的中文短文本数据。利用中文短文本分类技术,在低信息量的数据中挖掘出有价值的信息是当前的一个研究热点。中文短文本相较于长文本,存在字数少、歧义多、特征稀疏和信息不规范等特点,导致使用传统文本分类技术效果不佳。首先介绍中文短文本分类技术的研究现状;其次围绕中文短文本分类的基本流程和关键技术进行阐述,并对文本预处理、文本表示、特征扩展和分类算法做出详细介绍;最后对中文短文本分类技术未来发展的趋势进行展望。
其他文献
轮胎企业对于车间的环境要求非常严格,一般到5月份就需要开启制冷机组用于控制车间温度,特别到了夏季,耗冷量非常大,传统的溴化锂制冷机采用蒸汽作为能源,耗能较大。随着科学技术的进步,这几年电制冷压缩机技术特别是离心压缩机技术取得飞速发展,目前能效比远大于蒸汽制冷,因此溴化锂制冷在电制冷面前已经没有任何优势。山东万达宝通轮胎有限公司通过对制冷机改造,实现节能降耗、降低成本的目的,通过将蒸汽制冷机改造为电制冷机,降低了运行成本,每年节约50万左右的能源费用。本文阐述了蒸汽制冷和电制冷机组的工作原理,同时对能效进行
目的:探讨2019年玉溪市妇幼保健机构的资源及运营状况.方法:于2019年登陆国家妇幼卫生综合信息平台,按照标准组织辖区10家妇幼保健机构调查其人力资源、设备、运营状况等,随
期刊
目的:探究急性心肌梗死急诊介入治疗术中的护理配合方法及效果分析.方法:选取2018年11月--2019年11月进行介入治疗的78急性心肌梗死患者,分为两组.结果:对照组患者心血管事件
目的:探讨分析1例高位截瘫合并4期压力性损伤伴多重耐药菌感染患者的护理.方法:选取我院2021年2月24日入院的1例高位截瘫合并4期压力性损伤伴多重耐药菌感染患者,对其护理予
研究半钢子午线轮胎中钢丝圈单根缠绕结构的应用,比较其相对于根排结构的优势。试验结果表明,以1.20 HT胎圈钢丝单根缠绕结构替代0.96 HT根排结构,可以在不损失轮胎性能的情况下,降低成本,降低轮胎胎圈断裂的风险,使轮胎的安全性显著提高。
针对桥式起重机在复杂环境下路径规划时存在无法快速得到合理路径的问题,提出一种结合粒子群算法的快速扩展随机树算法(Rapidly-exploring Random Tree,RRT)。根据桥式起重机运行的特点,对RRT算法进行改进,使用双向RRT算法,并使树按几率朝目标方向生长,在生成路径时结合粒子群算法对路径进行平滑处理,得到更适合桥式起重机运行的路径。仿真结果表明,在障碍物较多且形状各异的复杂环
在现代战争中雷达发展趋于多功能化,甚至多个雷达一起探测目标,使得雷达的抗干扰能力增强。而传统的干扰系统仍遵循着固定的干扰策略,面临需要干扰的雷达数目多时决策的实时性较差,故亟需对认知干扰进行研究。阐述了强化学习的概念并比较了Q学习算法和双Q学习算法的差异,利用强化学习算法在认知电子战的基础上建立模型来实现雷达干扰策略的分配。通过对决策方法进行仿真验证了两种强化学习算法都能完成干扰策略分配任务,并且
本文对当前轮胎行业设备管理现状进行了分析,阐述了轮胎行业建设智能化设备管理手机APP软件建设的必要性,同时介绍了APP软件的各个模块及作用,为行业设备管理树立行业规范,积累设备管理数据和规范。
混合系统仿真和不连续性处理一直是基于时间离散的积分方法所面临的难题,而量化状态系统(Quantized State System,QSS)方法是一种新的基于状态变量离散的数值积分方法。针对混合系统仿真问题,提出一种QSS+DEVS(Discrete Event System Specification)求解方法。混合系统的离散部分以DEVS模型来表示,采用QSS实现混合系统的连续部分离散化,同样用
针对中小企业融资难以及供应链金融现有的信用问题,将区块链技术运用进财政部提出的政府采购合同融资模式中。从供应链业务层面出发,构建政府采购部门、中小企业和银行的三方博弈模型,对各主体的决策进行分析;从区块链技术层面出发构建演化博弈模型,对链上各节点的选择进行分析。通过MATLAB软件进行仿真实验,验证了利用激励相容理论将区块链技术运用进政府采购合同融资模式中的可行性和准确性,为该模式中的各参与主体提