基于LSTM和LDA模型的患者情感分析研究

来源 :浙江理工大学 | 被引量 : 3次 | 上传用户:potato_212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网医疗的发展,平台上出现大量的患者留言文本。通过患者留言的文本挖掘,分析出患者的情感信息,对患者和医院有重要的意义。本文主要从两个方面对患者留言文本进行研究,第一,基于深度分层神经网络的情感极性分类研究,第二,基于LDA模型的情感主题分类研究。主要的创新成果如下:(1)提出了基于卷积神经网络(CNN)模型和长短期记忆(BLSTM)模型的双道融合层。传统融合的方式,将CNN模型和LSTM模型训练出的词向量进行简单向量拼接,缺点是模型在多特征信息的句子训练时,分析出的情感结果常常被非特征方向的信息影响。双道融合层引入权重矩阵,使得改进后的LSTM模型在训练时,在CNN模型分类出的特征向量方向的情感信息被放大,而在非特征向量方向的情感信息被削弱。实验证明,双道融合层对多特征信息的句子的情感分类更加准确。(2)提出了深度分层网络模型。CNN模型和BLSTM模型在情感极性分类领域擅长的方向不同,CNN模型不善于处理时序信息,却在短文本的情感极性分类中表现效果好,而BLSTM模型擅长处理时序信息,但是不能处理好短文本的情感极性分类。改进后的模型分为区域CNN层、BLSTM词语层两层输入,保留语料中的时序信息和特征信息。最后,通过双道融合层进行词向量的拼接,实验证明,新的模型比改进后的模型准确率增加了7.84%,召回率增加了3.35%,F1值增加了2.45%。(3)提出了词向量替换层。针对短文本的主题模型分类会出现上下文依赖性差和词汇量不足的问题,实验对比了词嵌入模型和词袋模型,提出利用词嵌入模型训练出符合整篇文章主题的词向量空间,目的是补充短文本情感主题分类时的词汇量,同时,解决短文本的上下文依赖性差的问题。(4)提出改进的LDA模型。针对LDA模型进行短文本分类时,吉布斯采样层的采样词汇单一的问题,提出在吉布斯采样层以一定概率λ从词向量替换层采样余弦距离最近的词向量,并通过调参,获得最优的概率λ。实验证明,改进LDA模型模型的困惑度下降了1.42%,主题一致性增加了3.75%。
其他文献
随着改革向纵深发展,一些发展过程中必然或者偶然出现的问题也渐渐浮出水面,对之进行理性的分析和解读,已成为经济界、科技界众多有识之士关心的热点。本刊记者不久前参加了中国
如何有效建设高职院校思想政治教育体系、增强思想政治教育工作的实效性,是现阶段各高职院校所急需解决的关键性问题。因此,本文就依据目前我国高职院校建设思想政治教育体系
试验采用原子吸收分光光度计测定了玉米中的微量元素平均含量,结果表明玉米中微量元素的平均含量分别为Fe23.65mg/kg、Cu1.71mg/kg、Mn3.42mg/kg、Zn18.65mg/kg,大部分情况下相当于畜禽
大庆采油院生产保障大队车队,为宣贯《纲要》精神,在“创先争优”活动中,按照大队“安全本质化、管理精细化,服务优质化,岗位标准化”工作思路,以提升管理水平为目的,以提高员工素质
在zài云yún彩cǎi的de南nán面miàn,/那nà遥yáo远yuǎn的de地dì方fɑnɡ,/有yǒu一yì群qún树shù叶yè说shuō:/我wǒ们men想xiǎnɡ像xiànɡ花huā一yí样yànɡ开kāi放fànɡ。/有yǒu一yì群qún花huā朵duǒ说shuō:/我wǒ们men想xiǎnɡ像xiànɡ鸟niǎo一yí样yànɡ飞fēi翔xiánɡ。/有yǒu一yì群qún孔
期刊