【摘 要】
:
针对中文文本分类中依赖词嵌入和单一的神经网络,存在语义表达不充分、特征获取不全面且文本表达模糊比清晰更难以辨识类别的问题,提出补充语义信息的多特征融合(multi-feature fusion with supplementing semantic information,SSI-MFF)的模糊文本分类模型,使用BERT预训练模型对模糊文本进行向量表示,TextCNN、BiLSTM分别学习文本关键字符特征、句子语义特征并用原始向量补充语义信息。在模糊文本数据集上的分类实验结果表明,方法的准确率为79.22
【机 构】
:
河北工业大学人工智能与数据科学学院
【基金项目】
:
国家自然科学基金,名称:补充语义信息的多特征融合模糊文本分类,编号51605134。
论文部分内容阅读
针对中文文本分类中依赖词嵌入和单一的神经网络,存在语义表达不充分、特征获取不全面且文本表达模糊比清晰更难以辨识类别的问题,提出补充语义信息的多特征融合(multi-feature fusion with supplementing semantic information,SSI-MFF)的模糊文本分类模型,使用BERT预训练模型对模糊文本进行向量表示,TextCNN、BiLSTM分别学习文本关键字符特征、句子语义特征并用原始向量补充语义信息。在模糊文本数据集上的分类实验结果表明,方法的准确率为79.22
其他文献
针对当代大学生寻求合心仪的摄影师进行约拍服务的困难,提出了基于Android进行约拍App的移动开发,开发一套功能齐全、界面友善的约拍服务平台实现高校摄影共享化。系统由Android Studio进行开发,利用Android SDK设计客户端,其中用到类似商城的设计原理,实现用户浏览、搜索、购买、收藏商品等功能;利用Android Studio自带的数据库SQLite,实现用户、商品的增删改查的功能,对用户、商品进行管理。使用约拍App可以解决目前大学生约拍困难的问题,提高约拍服务,为以后扩展其他业务做好
上下文隐马尔可夫模型(contextual hidden markov model,CHMM)能够有效地利用多尺度系数间的相关性,得到图像系数的精确表示,但是传统的上下文计算方法仅针对邻域内的单个系数进行计算,没有考虑到局部甚至全局系数的影响。针对以上问题,提出了一种新的基于多输入细胞神经网络(multi-input cellular neural network,MCNN)的CHMM模型并用于图
声纹识别技术在生物特征识别领域区别于指纹、脸、虹膜等,其易获取、成本低等优势使其研究应用愈加广泛。研究了基于一种混合高斯模型的方法达到提高声纹识别率的效果。该方法充分利用非目标用户的混合高斯模型,其概率对数输出与BP神经网络结合,实现对混合高斯模型的补充作用,提高声纹识别率。该模型以多个预先训练的非目标用户的混合高斯为起点,接收来自目标用户的语音数据,产生的输出作用下一级神经网络的输入,进一步对数据进行训练。经实验结果表明,目标用户GMM模型的识别准确率为88.73%,而GMM-BP模型的识别准确率达到9
介绍了在高斯信道以及瑞利信道下极化码的构造方式,极化码的常见译码算法,以及系统极化码的编码算法。使用的仿真工具为Matlab,首先对极化码在瑞利信道下的高阶调制性能进行仿真;其次对系统极化码和非系统极化码在SC译码下进行仿真,分析得到系统极化码比非系统极化码在误码率上具有性能优势,但误块率两者大致相同。最后对极化码的CA-SCL译码算法进行定点化仿真实验。仿真结果表明,小数位宽为2 bit的定点算法性能与浮点性能的差异不大。
全球导航卫星系统反射信号(GNSS-R)进行海面风速反演时,传统方法主要有波形匹配法和经验函数方法。针对传统方法存在计算量大,反演过程繁琐等不足,引入人工神经网络,提出了一种多隐藏层的人工神经网络方法进行海面风速反演。首先分析不同输入特征参数与风速之间的关系,其次建立用于风速反演的ANN模型,最后进行模型训练,验证该模型的可行性。反演结果表明,风速小于15 m/s的低风速时,反演误差约为1.53
针对企业遇到软件需求难以找到开发方的问题,设计并实现了一套协同创新软件科技服务平台。平台基于B/S架构,遵循PHP规范。经过对平台架构、功能、业务流程和数据库的设计,实现了软件项目需求发布、科研团队推荐、成功案例成果展示、科技资讯展示和应用技术交流等功能。平台通过处理企业软件项目需求。为企业用户主动、精准的推荐出适合的科研团队,有效提高了协同创新科技服务能力。
路径规划一般包括环境建模、路径搜索、路径平滑三个步骤,但在路径搜索过程中规划结果往往受到障碍物大小、地理位置差异等不定因素的影响。针对避障小车在两个地点间寻找无碰撞路径的问题,提出了PSO-FSA,即粒子群-快速模拟退火算法。算法将传统粒子群算法中的惯性权重改变为正弦自适应的形式,同时采用快速退火的模式解决模拟退火过程中迭代速度过慢问题,从而得到避障小车的最优路径。结果表明:与传统粒子群算法相比,粒子群-快速模拟退火算法能够增强粒子群搜索过程中跳出局部最优解的能力,提高了算法的收敛精度,同时也能够保证粒子
针对十字路口场景下,部署的多个路侧单元能量消耗严重的问题,提出了一种路侧单元调度算法,称为最近最快算法(nearest and fastest,NFEST)。在NFEST算法中,路侧单元覆盖范围内的所有车辆,优先分配距离路侧单元最近的车辆进行数据传输,这样能保证路侧单元对车辆进行下行数据传输能耗最低;若两车与路侧单元的距离相同,则优先选速度最快的车辆进行服务分配,这样能保证相同的路侧单元能耗情况下,车辆的请求完成率最高。仿真结果表明,和一直处于开启状态下的路侧单元比较,该调度算法下的路侧单元可以有效降低路
针对传统的购物App设计各层次间耦合性大、层次间界限划分模糊等问题,设计了一款购物App。App采用MVP(model-view-presenter)软件设计模式,在系统结构框架上分为Model层、View层、Presenter层,分别实现数据修改与操作功能、用户交互功能、业务逻辑处理功能。以某高校学生入学采购物品的需求为基础,以拎包客App为例,将系统功能结构分为登录注册模块、个人中心模块、购物中心模块、服务中心模块、活动中心模块,使用MVP模式进行软件设计,实现了登录注册、选购商品、服务选择等功能,经
针对目前FP-Growth算法在高校成绩数据挖掘中效率偏低等问题,提出一种改进的FP-Growth算法,通过设定最小支持度的阈值删去非频繁项集,得以提高运行效率。实验选择上海某高校校内计算机基础课程考试成绩及全市统一计算机等级考试成绩为样本数据,使用改进FP-Growth算法建立关联规则,找出校内课程成绩与考证成绩之间的关联性,为提高考证通过率提供数据支撑,为教师和教学管理人员提供决策支持,并通过对比经典和改进FP-Growth算法证明改进算法在时间增长等方面的优势。