基于中文小说的对话角色和情感识别的研究与实现

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:huntergy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的发展,有声小说日益成为人们日常生活的重要娱乐方式。小说供应商人工合成一部有声小说需要投入大量的人力和物力,实现有声小说的自动合成成为近年来的研究热点。有声小说自动合成的关键在于识别出小说人物对话的角色和情感,通过人物的性别、年龄、性格等状况来进行相关的符合人物设定的语音自动合成,同时根据人物对话情感识别的结果进行相关对话情感的设定。目前小说方面的研究主要集中于外文方向,中文小说方面的研究甚少。鉴于中文和外文的差异性,本文针对中文小说进行小说人物对话角色识别和小说人物对话情感识别的研究。本文的主要内容和创新点如下:1)针对小说对话人物角色识别问题,为了能够充分表示对话类型的区别以及表示文本前后的语义特征,提出了一种基于Rule-BertAtten的中文小说对话人物识别方法。首先将对话主要分成四类,根据不同的对话类型,分别采用Rule判断和BertAtten的方法,实验表明,该方法具有更高的准确率。2)针对中文小说对话情感识别数据集缺乏的情况,本文动态地手工标注了《平凡的世界》情感识别数据集,参考的内容有根据正则和句法分析得到的句子类型、SnowNLP分析的情感倾向打分以及NRC情感词典打分的结果,再经过多方考量,将中文对话的情感分为中性(none)、喜欢(like)、气愤(disgust)、生气(anger)、高兴(happiness)、害怕(fear)、伤心(sadness)、惊讶(surprise)八种类别。3)在小说对话情感识别的问题上,鉴于中文小说情感数据集的不平衡性(中性情感多),提出了先二分类再七分类的策略,先二分出中性和其他情感,然后利用SnowNLP的情感倾向和NRC的情感词典规则筛选出二分类结果中明显不属于中性的对话,然后再创新性地提出了针对情感词对其他七种类型的对话进行了对话情感加成策略,最后再七分类,结果汇总。实验结果表明先二分类,再规则筛选,再情感词加成,最后七分类的策略相较于直接八分类有更高的准确率。
其他文献
在后疫情时代,生鲜产品线上需求增长迅速.根据调查发现: 配送速度和生鲜质量已经成为消费者选择生鲜电商平台时重要的影响因素.在此基础上,将货损成本加入形成生鲜电商前置仓选址目标,以中心仓、前置仓及其覆盖区域形成的运输网络配送距离和配送过程中的货损成本作为约束条件,构建前置仓选址模型,并用Excel规划求解得到结论.最后,通过一个实例来说明模型的可行性.
VoLTE是在4G网络全IP条件下的端到端语音解决方案,能提供更短的接入时延和更好的语音质量.以复兴号为代表的高铁列车运行速度快、车体损耗高,这样的无线环境对时延、抖动、丢包敏感的VoLTE业务质量有很大的影响.本文介绍了针对高速铁路网络服务的特点在4G Volte业务及四项感知指标方面,为满足高铁用户高质量服务需求而进行的端到端感知提升的分析研究、基本思路、优化方法及经验.
在“碳达峰、碳中和”的国家战略背景下,控制碳排放成为各地发展经济的前提条件.县域是中国社会经济发展的基础单元,统筹县域经济发展和碳排放的关系对中国实现控碳战略具有重要意义.基于中国172个县级单元的经济发展和碳排放数据,采用线性回归模型分析法,对中国县域经济发展对碳排放的影响进行了分析.研究发现:一、县域碳排放总量与经济总量和工业化水平高度正相关,经济发展水平的提高有助于提升碳生产力,降低碳排放强度;二、县域内工业的集聚有助于降低碳排放强度,但服务业的聚集将会导致县域碳排放水平的上升.基于此,建议在县级国
应急管理领域是与国家安全及社会稳定密切相关的重要领域,利用人工智能相关技术自动发现和识别领域多源数据文本中有价值的情报信息,如领域核心实体及其语义关联,对于突发事件预警及响应有着重要指导意义,而实体识别与实体间关联发现正是可以自动化实现领域信息抽取的关键技术。但是,领域实体识别与关联发现技术当前仍面临以下挑战:首先,中文文本缺少分词边界且词法、语法复杂,导致词特征利用困难,限制了实体识别的效果;其
城市空间形态与碳排放效率存在密切联系,探究两者间关系可以为县域中小城市低碳发展提供指引,并为实现高质量发展提供新参考.文章在大城市碳排放效率评价研究的基础上结合县域中小城市特征,进行碳排放效率评价指标选取及模型构建,通过建立面板数据模型对2005—2020年间长三角地区县域中小城市空间形态对碳排放效率影响进行了实证研究,并分析了城市空间形态对碳排放效率的影响机理.结果表明:城市空间形态紧凑度、复杂度及破碎化程度与碳排放效率密切相关;紧凑程度的提高对碳排放经济效率具有促进作用,复杂程度和破碎化程度的下降会对
文章系统梳理了人居环境质量评价的研究进展,收集了国内外典型案例,从重点内容、评价对象、评价方法、数据来源等方面进行了研究.在此基础上构建了由7个目标层、23个准则层和34个指标层组成的城市人居环境质量评价指标体系,并在2019年城市体检试点工作中进行了应用.实践证明城市人居环境质量评价指标体系作为一个以应用为导向的研究成果,能够客观展现城市建设发展中的问题,同时在应用过程中部分指标在数据获取、评价频次等方面出现不适应地方现状的情况,城市人居环境质量评价指标体系将随着2020年的体检实践继续调整.
在“双碳”目标和县域国土空间规划的双重背景下,县级城市国土空间总体规划成为重要的碳排放治理手段,然而现阶段我国县域缺乏与国土空间规划体系衔接的低碳评价方法.本研究基于“碳源/汇—空间驱动因素—国土空间规划体系”的关联机制,以我国1903个县级城市2010—2018年面板数据为基础,基于SPSS 25.0的数理统计方法展开研究,构建双碳目标导向的国土空间总体规划过程性评价体系,并以武安市为对象进行实证研究,形成国土空间规划关键低碳指标体系和相应规划策略.研究表明:一、过程性评价方法对于动态发展的全国广大县级
空铁一体化发展使航站楼与城市铁路交通便捷换乘成为必然要求,航空限高使得空铁换乘空间多位于地下,多线换乘带来的复杂换乘流线和地下空间带来的换乘空间感知弱等问题导致空铁换乘效率低、舒适性差,而换乘空间的步行可达性是影响换乘效率和换乘舒适性的关键因素.成都双流机场T2航站楼汇聚了空港、高铁、地铁等三种交通方式的换乘,通过研究该典型案例换乘空间的步行可达性来探讨提高地下空铁换乘空间步行可达性的策略.本文运用空间句法中的凸状空间法和视域分割法,结合集成度、可见度等形态变量,对成都双流机场T2航站楼的地下空铁换乘空间
城市中心区是展示城市核心形象的焦点,也是城市最具活力的多元要素融合场所.西方大城市在逆城市化过程中,往往中心区会出现不同程度的衰退,但新街口作为典型的中国大城市中心区,并没有发生衰退现象,同时随着南京的社会经济发展,长期享有“中华第一商圈”称号.本文通过对南京新街口地区空间结构演变历程及特征的梳理总结,认为社会和物质空间相互作用是影响新街口地区发展的主要因素.该地区在政策、人口和产业等多方因素影响下从过去的商业中心转变为综合性功能的CBD,集中表现为商业、商务功能替代原先的居住功能,并且出现商业绅士化现象
以AH-70重交沥青为基质沥青,苯乙烯-丁二烯-苯乙烯嵌段共聚物(SBS)为改性剂,硫磺为稳定剂,减二线抽出油为相容剂,于185℃下剪切1h,再于180℃下发育5h,可制备改性沥青;同时,采用动态力学分析(DMA)方法考察了SBS加入质量分数对改性沥青性能的影响.结果 表明:随SBS加入质量分数的增加,改性沥青的车辙因子增大,高温抗车辙性能提高,温度敏感性降低,应力敏感性减弱,蠕变率增大;cole-cole曲线弧度越小,改性沥青相容性与稳定性越好.