论文部分内容阅读
消费者的医疗保健观念从过去的被动就医,甚至讳疾忌医,到如今Web2.0时代的积极管理,主动分享。消费者的就医模式也从原来的医院挂号临床就医,向着关注预防和日常保健、康复方向转变。也因此,学术界、医学界、商界都在积极探索如何才能为普通消费者提供更加精准、便捷和全面地医疗保健服务。而确认消费者对健康信息关注的主题是把握消费者健康信息需求,进而提供精准医疗保健服务的先决条件。然而,就目前的研究来看,对消费者健康主题分析的研究通常聚焦于某一类具体的疾病,所用到的数据样本多直接来自于消费者的,且用到的研究方法也大多是问卷调查法、实验法、访谈法等定性的研究方法。这些都有可能导致样本量过小,研究范围过窄,导致结论不够全面,适用性不够强。因此,本文提出结合使用定性和定量方法,对来自于为大众普遍使用的社交媒体上的多种疾病数据进行采集分析,提炼健康主题,提取特征词汇及特征词间关系,最终构建消费者健康知识图谱,深入分析和讨论了知识图谱对于消费者健康信息素养提升和健康信息系统设计的启示,并探索了知识图谱的具体应用场景。本文的创新工作主要体现在以下几点:(1)研究对象的创新。本文综合了四类社交媒体平台上三种不同疾病的UGC数据作为研究对象,尝试最大程度地覆盖不同文本类型的不同疾病的健康信息文本,在此基础上构建消费者关注的健康主题体系,并绘制图谱和得出相关结论。(2)研究方法的应用创新。本文提出了将定性研究方法开放式编码与定量研究方法文本挖掘相结合,完成主题提炼和代表主题的特征词提炼,以及特征词间关系提炼,有效地从大量且结构不一的文本数据中提取了多层次的主题特征,利于可视化展示和解读。并在知识图谱实现时引入图形知识库作为解决途径。(3)研究成果的创新。本文通过研究分析,发现,如果假设消费对各类疾病的关注度一致,消费者对于各类疾病的不同主题关注度存在明显差异;不同健康主题之间也有远近亲疏之分;来自不同社会化媒体的用词用语在描述同一种疾病时也存在差异等有趣结论。