基于多模型融合的文本分类方法及其应用研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:qijich
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本自动分类作为人工智能中一项重要的技术,旨在通过智能化手段筛选出目标信息,在医疗、电商、体育等领域中有着广泛的应用。近年来,司法领域中面临“案多人少”问题的日趋加重,急需通过人工智能技术来辅助办案过程,提升司法工作质效。本文从文本分类方法研究和文本分类在司法领域中的应用研究两方面开展了如下工作:(1)提出了一种基于多模型融合的文本分类模型。基于深度学习的文本分类方法大多只针对单一的模型结构进行深入研究,这种单一的结构缺乏同时捕获并利用全局语义特征与局部语义特征的能力,且网络的加深会损失更多的语义信息。对此,提出了一种基于多模型融合的文本分类模型(FMNN),FMNN在最大限度减小网络深度的同时融合了BERT、RNN、CNN和Attention等神经网络模型特性。用BERT作为嵌入层获得文本的矩阵表示,用Bi LSTM和Attention联合提取文本的全局语义特征,用CNN提取文本多个粒度下的局部语义特征,将全局语义特征和局部语义特征分别作用于softmax分类器,最后采用算术平均的方式对结果进行融合。在SST-2、IMDB和AG_News三个公开数据集上的实验结果表明,FMNN模型实现了更高的文本分类准确率。(2)提出了一种篇章分析和语句分析相结合的争议焦点识别模型。案件的争议焦点识别是制约审判效率的关键问题,目前人工智能技术在争议焦点识别问题上还处于探索阶段。基于案件的诉辩文本进行研究,针对深度学习模型结构深层化后全文语义信息丢失以及局部文本环境下缺乏上下文语义信息的问题,提出了一种基于篇章分析和语句分析的争议焦点识别模型(DFRM)。DFRM模型将争议焦点识别转化为文本分类任务,使用改进后的FMNN进行全文预测,并用规则进行句子级别的预测,通过全文和句子两个级别去识别文本蕴含的信息,实现了全文和句子两个层面的信息互补,进而提升了争议焦点的识别精度。DFRM模型对争议焦点的识别准确率为93.67%,比FMNN模型提升了3.63%的精度,为司法领域中争议焦点的识别问题提供了有效的解决方法。此外,实验证明DFRM使用的方法在其它模型上同样适用,具有较好的通用性。
其他文献
人脸表示攻击(Presentation Attacks,PAs)日益成为实现可靠人脸识别的严峻挑战。为解决这一挑战,人脸反欺诈技术应运而生。本文首先从现有人脸反欺诈领域的研究成果展开分析,针对现有反欺诈方法在跨数据集训练和测试场景下平均错误率较高的问题,提出了基于可选择域不变特征对齐网络以改善模型的泛化性能,针对现有反欺诈方法未能充分利用不同模态之间的互补性,提出了基于多模态自适应特征优化网络以提
学位
对抗菌纤维和多种抑菌成分的复配样品进行抑菌性能测试,并对比了季铵盐壳聚糖抗菌纤维与植物精油、传统防腐剂和防腐替代剂对细菌、酵母菌和霉菌的抑制效果,尝试将抗菌纤维和抑菌成分形成复配防腐方案。防腐测试结果表明:抗菌纤维与对羟基苯乙酮(0.1%-质量分数,下同),或丁香油(0.05%),或柠檬茶树油,以及蓝桉叶油复配,均能满足面膜产品的防腐需求。但是,抗菌纤维与羟苯甲酯复配有拮抗作用。其中,抗菌纤维与丁
期刊
随着信息技术的发展,数字图像的使用越来越多。为了美化图片,很多图像编辑器也流行起来,比如:Adobe Photoshop、GIMP等。这些图像编辑器有着强大的图像修饰功能,并且操作简单对使用者友好,经过修饰的图像和原始图像以肉眼难以辨别,这为社会安全带来了很大麻烦。为了认证数字图像的真实性,近年来研究者们提出了很多图像取证方法。特别是在卷积神经网络被广泛运用到图像处理任务中后,基于卷积神经网络的图
学位
SDN的出现使得网络架构由数控耦合模式转变为数控解耦模式,已成为网络研究领域的一个热点分支。在这种架构下,处于数据层的网络设备不再具有决策功能,它需要根据控制层下发的命令来处理分组,这使得网络管理变得更灵活。SDN已在许多网络场景下得到了应用,如数据中心与云、企业网与校园网、广域网、无线网络。在SDN为网络管理带来了便利的同时,DDoS攻击已成为其面临的重大网络安全威胁。本文借鉴前人的研究成果,从
学位
海藻等海洋生物资源中含丰富蛋白质、矿物质、多糖等成分,具有良好的保湿、抗皱等护肤效果。目前,海藻等海洋生物资源在面膜制备方面具有良好的应用前景。本研究提供了一种海带面膜的制备方法和应用,经测试,本方法制得的海带面膜具有使用方便、不受海带叶状体面积大小的限制、有效成分更易被人体吸收、绿色安全,因此具有良好的实用价值。
期刊
金属钢结构凭借强度高、重量轻、刚性好等优点而被广泛应用于水工钢闸门、拦污栅、压力钢管等水利工程设备中,其表面受水流冲击、泥沙冲磨、水体浸泡以及水生物侵蚀等因素影响极易产生锈蚀。锈蚀作为水工钢结构失效的重要因素,如若不能及时进行检测、评估以及维护加固等措施,表面锈蚀可能会进一步深入至钢结构内部而影响设备设施运行稳定性和可靠性。其中锈蚀面积和锈蚀等级是锈蚀检测与评估中的两项必检项目,目前在工程上对于锈
学位
贝叶斯网络(Bayesian network,BN)是一种基于概率论与图论进行不确定知识表示和推理的机器学习理论模型,在故障诊断、遗传分析等领域中的应用越来越广泛。利用BN解决现实世界中的实际问题之前,需要根据具体应用场景从数据中构建具有变量之间定性关系的有向图模型。在实际应用中,对于变量数目过多的高维数据,现有的BN结构学习方法难以高效获取到准确的结构。此外,很多实际应用领域时刻都会产生大量的数
学位
期刊
目的:制备一种具有美白抗衰老作用的中药面膜。方法:采用溶剂提取法、大孔吸附树脂等方法提取纯化红景天、麦冬和红花中活性物质;以自由基清除率和酪氨酸酶生成活性的为指标,考察了面膜中三种中药活性提取物最佳配比;通过单因素和正交实验考察了凝胶面膜成型性最佳制备工艺,并且对自制面膜进行了质量检测;同时将自制面膜和商售的两款面膜自由基清除作用进行了比较。结果:面膜中三种中药活性提取物总加入量为1.0 g/10
期刊
学位