基于深度学习的文本分类综述

来源 :计算机与现代化 | 被引量 : 0次 | 上传用户:jkhy66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展,网络上的文本数据日益增多,如果能对这些数据进行有效分类,那么更有利于从中挖掘出有价值的信息,因此文本数据的管理和整合显得十分重要。文本分类是自然语言处理任务中的一项基础性工作,主要应用于舆情检测及新闻文本分类等领域,目的是对文本资源进行整理和归类。基于深度学习的文本分类,在对文本数据处理中,表现出较好的分类效果。本文对用于文本分类的深度学习算法进行详细阐述,按照深度学习的不同算法进行分类,并分析各种算法的特点,最后对深度学习算法在文本分类领域的未来研究方向进行总结。
其他文献
真值表的化简对于逻辑电路的分析与设计具有及其重要的意义。对真值表的化简问题进行研究,提出了一种利用分辨矩阵从真值表中获取最小布尔表达式的粒分辨矩阵方法,实现其在逻辑优化中的应用。首先,将真值表视为逻辑信息系统,将真值表的化简问题转化为逻辑信息系统的最简规则发现问题。然后,在传统分辨矩阵的基础上,利用等价关系模型构造粒分辨矩阵,找出可以组织成最小布尔表达式的信息粒,利用信息粒的析取合取运算获得逻辑信息系统的最小布尔表达式。为进一步加快算法的收敛速度,引入启发式信息的概念,给出了组织信息粒的判定法则,避免在最
随着复杂网络及大数据技术的发展,大规模全局优化方法已成为复杂工程系统的重要支撑技术.解决大规模全局优化问题的关键在于如何识别决策变量之间的相互依赖关系并根据这些依赖关系进行有效的变量分组.针对该问题,本文提出了一种基于形式概念分析的大规模全局协同进化优化算法,首次将数据分析领域的形式概念分析思想引入决策变量依赖关系分析和自适应分组过程中,进而处理大规模全局优化问题.该算法基于协同进化框架,利用形式概念分析的外延与内涵结构特征,将决策变量转换为形式概念文本,通过文本向量矩阵运算进行决策变量的自适应分组,使其
基于标准以太网的时间敏感网络通过增强时间同步、确定性流调度以及高可靠无缝冗余能力实现多业务流高质量共网传输.它能提供高可靠与确定有界低时延流传送服务,是未来工业自动化系统、车载通信、智能电网等垂直行业应用的核心网络技术之一.本文首先从时间同步、低时延流控、可靠性、网络管控以及应用场景五个方向对时间敏感网络相关标准及其最新进展进行了介绍和分析,重点阐述其解决的问题与关键技术.其次对时间敏感网络的研究现状进行了综述分析,重点分析比较现有方案的优缺点.最后讨论了时间敏感网络的发展趋势与研究挑战.
为了达到快速、精准的继电保护信息系统终端设备测试效果,设计一种继电保护信息系统终端设备智能测试系统。利用无线方式将数据采集模块所采集的终端设备数据传输至数据处理模块;利用信号处理算法除掉原始数据中的干扰数据,使其符合监测预警模块的要求;实现终端设备运行状态量变化实时监测,并发出预警等级信息;智能测试模块将高于监测预警指标的终端设备数据形成录波数据,利用保护装置结合录波数据获取保护运作行为结果,通过评价运作行为结果完成终端设备智能测试。实验结果表明,所研究的系统能够实现继电保护信息系统终端设备的智能化测试,
针对制造系统的标注Petri网模型,提出一种基于回溯法估计系统最小代价计划序列的算法.已知标注Petri网模型的网结构与初始标识,根据给定的标注序列划分搜索阶段,每个标注对应
城市道路拥堵严重及共享理念的盛行带来了拼车出行的兴起。出行线路相似的乘客共乘一辆车,可提高座位利用率、节省费用、缓解交通压力。以带时间窗约束的无换乘多车辆静态拼车问题为研究背景,从车辆使用费、途中走行成本及到达时间窗惩罚成本3个方面建立乘客车辆匹配及路径优化的目标函数,以车辆容量、乘客出发及到达时间窗、路径无迂回、乘客车辆匹配无重叠等限制构建模型约束条件,采用演化策略算法求解问题,根据模型特征设计编码解码规则,解码结果可同时获得车辆乘客匹配关系和走行路径,采用交叉变异操作更新迭代个体种群,进而求得最优解。
为解决传统相关滤波算法对无人机(UAV)拍摄视频中的车辆进行跟踪时,因目标车辆尺度变化而产生模型漂移的问题,提出了一种改进的尺度自适应的车辆跟踪算法。该算法基于核相关滤波,通过构建区分尺度的空间跟踪器,即利用两个滤波器分别对目标车辆的位置进行定位,对目标车辆的尺度进行估计,以此来快速确定目标相关信息,实现对目标车辆尺度的自适应。此外为解决目标车辆因快速形变而导致跟踪效果不佳的问题,还加入了对形变不
古诗伴随着中华文化的历史进程不断发展,有着数千年的灿烂历史,古诗将丰富的情感、有内涵的灵魂和生动的形式完美结合,表现出了中华民族语言的力量.“自然语言处理是人工智能皇冠上的明珠”,用机器生成语言是机器智慧的核心体现,对机器的语言进行测试是图灵测试的重要内容,用机器生成的中国古代诗词已经可以初步通过图灵测试,在普通人面前得以瞒天过海.本文提出了“镜像图灵测试”框架,其主要设计思想是将图灵测试中的测试者由人更换为计算机,要求测试者在图灵测试的同等条件下对被测试的人和计算机进行识别,若测试计算机不能完成对被测试
在多租户数据中心,来自不同租户的应用程序共享并竞争使用网络资源.网络共享策略会对应用程序端到端的性能(如作业完成时间、吞吐量等)产生直接的影响.为了衡量租户应用程序的整体数据传输速率,本文引入进度(Progress)的指标.该指标被定义为租户应用程序在所有链路上经需求标准化后的最小带宽分配量,反映的是租户能够完成其数据传输的最慢速率.通过最大程度地提高租户进度,可以优化上层应用程序的执行时间等性能.先前的大多数工作都集中在实现网络共享的公平性、可预测性和效率之间的权衡,却忽略了提高租户的长期进度.本文观察
软件定义网络(SDN)将传统网络的控制平面和数据平面解耦,通过控制平面的控制器灵活地对网络进行管理,目前应用最广泛的控制协议是OpenFlow.三态内容寻址存储器(TCAM)查找速度