论文部分内容阅读
随着社会的发展,人们对自身健康的关注程度日益提高,大家不再满足于疾病的被动治疗,而是转向健康的自主管理,医疗论坛的兴起则很大程度上满足了这一需求。在医疗论坛中,人们可以提出自己感兴趣的话题,并与其他的论坛成员进行讨论,交流观点,与此同时,医疗论坛还提供了患者寻求诊疗帮助和情感慰藉的沟通平台。对医疗论坛进行深入的分析,一方面可以客观科学的掌握论坛成员的真实需求,为疾病的诊疗过程提供参考,另一方面可以优化医疗论坛的交互界面,提升用户体验,提高用户参与的积极性,在很大程度上促进医疗论坛的发展。健康的广泛关注也提升了学者对于医疗领域的研究热情,研究角度也各有侧重。国内医疗相关的研究大多集中于医疗体制或者具体诊疗的改进,对于医疗论坛的研究则更多的采用调查问卷或内容分析等方法,但是这些简单的统计分析方法并不能满足日益增长的文本。医疗论坛的发帖文本主观性较强,而且每个帖子都具备主题和情感极性两种属性,因此,可以基于两种属性展开研究,探索医疗论坛中人们关注的热点主题和情感极性。因此本文致力于采用更为科学有效的方法,以脑血管病医疗论坛为切入点,对论坛发帖的主题和文本情感进行分析,主要的研究内容如下:(1)提出了基于改进的LDA主题模型的医疗论坛的主题识别方法。通过对LDA主题模型的研究,并综合脑血管病医疗论坛发帖文本的特点,提出改进的LDA主题模型,并提出主题识别的整体框架;(2)提出了基于深度神经网络的医疗论坛文本情感分析方法。通过对深度神经网络的研究,选取具体模型,对脑血管病医疗论坛发帖文本的情感极性进行分析,并提出文本情感分析的整体框架;(3)主题识别和文本情感分析的实证研究。借助三九健康网脑血管病论坛下的发帖文本,对脑血管病医疗论坛的主题识别和文本情感分析进行实证研究,对实证结果进行评价,最后分别对主题识别的结果、情感极性分析的结果和两者相结合的结果进行分析,并对结果的进一步应甩提出建议。通过对脑血管病医疗论坛主题识别和文本情感分析的研究,得出了以下结论:(1)通过与LDA主题模型和加权后的LDA主题模型的实验对比,证明了改进的LDA主题模型在脑血管病医疗论坛主题识别领域的适用性;(2)通过与朴素贝叶斯和支持向量机的实验对比,证明了基于深度神经网络的多层感知器在脑血管病医疗论坛文本情感分析领域的适用性;(3)通过实证研究,分析出三九健康网脑血管病论坛用户关注的6个热点主题,每个帖子的情感极性,以及每个主题的情感极性分布,并建议可以将研究结果为医生的诊疗过程提供参考,将主题与情感极性标签化处理用于医疗论坛的优化,而对于该医疗论坛的研究也为课题中脑卒中云平台医疗论坛的建立提供了参考。