论文部分内容阅读
医疗健康类应用在近十年来随着互联网的发展与普及也如雨后春笋般不断革新进步,普及率也渐渐增加。在这些社区论坛中,患者讨论与身体健康有关的问题,问题囊括其疾病、症状、药物和副作用等各个方面的信息,部分患者分享他们在患病期间的生活情况和情感状态,从而获得情感支持。肿瘤患者在健康论坛中作为相对活跃的用户群体,论坛中拥有其大量包含情感信息的文本数据,如果能利用在线健康社区的大量文本数据,通过文本挖掘获取更为详尽和真实的情感信息,则会对患者情感监测提供更详实和更准确的数据。文章借助Python语言和八爪鱼等工具爬取知乎肿瘤相关话题和与癌共舞平台等在线健康社区中肿瘤疾病患者关于其自身患病期间情绪的情感评论文本,对患者的情感评论文本进行文本预处理、情感分析等步骤之后从最终的文本情感分析标注结果中提取部分画像知识表示元素,而剩余部分的画像知识表示元素则需要患者原始评论的相关信息中进行手工获取。获取的全部的画像知识表示元素采用基于本体的画像知识表示方法进行画像知识表示,从构建的肿瘤疾病患者本体库中提取患者隐性情感信息进而直观地展示肿瘤患者的情感状态。本文的研究内容包括:通过对研究背景和意义的介绍以及对国内外文献的梳理引入本文的研究主题,即针对肿瘤疾病患者构建情感画像。本文提出肿瘤疾病患者情感画像的构建模型,针对肿瘤患者在线评论的情感画像,分为画像知识获取与加工和画像知识表示两步。其中,画像知识获取与加工的核心理论为在线评论的框架语义分析,该方法主要是框架语义理论;而画像知识表示的核心则是基于本体的画像知识表示方法。在线评论的框架语义分析,通过对肿瘤患者在线健康社区平台上的大量文本评论的预处理构建完善医疗情感词典,医疗情感词典包括框架、语义角色、情感词和情感倾向值等信息;其中,语义角色的识别采用基于模式匹配规则的语义角色标注方法,实现对患者评论文本的框架语义角色自动标注。画像知识表示通过构建用户画像的结构模型,这一结构模型具体包含患者实体、显性情感类、隐性情感类和关联数据等,将获取的画像知识表示元素填充至该结构模型中,并对画像结果进行可视化。本文的研究成果为医疗领域情感知识获取、共享和语义查询提供参考,为医疗情感知识组织与知识检索提供基础资源以及关键技术。