在线医评信息文本主题挖掘及打分机制优化研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:chenjzh68
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国综合国力的不断增强,整体的医疗服务能力以及医疗安全水准也在不断提高,然而医疗资源的供给不足与分配不均等问题仍然存在,医患矛盾仍在不断产生。众多研究表明,患者对于医生或医院提供的医疗服务不满意是导致医患矛盾的主要根源。而大批在线医疗社区相继出现,使得患者可以在远程享受医疗服务的同时对医疗服务进行自主评价,在线分享就医经验,由此产生了大量患者对医生和医院评价的在线医评信息,这些医评信息的合理利用将对提高整体的医疗服务水平,改善医患关系起到重要作用。本文首先基于大众点评的在线医疗评论信息,综合运用文本挖掘的各种理论与方法展开研究,基于LDA主题模型进行评论热点内容的识别,并依据主题关键词信息对各主题进行命名,之后对主题进行二级分类与概括汇总,最终归纳出:医院主题大类下对应就医流程,就诊环境,设备设施三个主要子类,医生主题大类下对应技术水平,服务态度,医德医风三个主要子类,患者主题大类对应就诊情绪,疾病描述两个主要子类。接着本文提出一种情感分值计算模型用于计算各条评论的主题情感分值:即通过整合通用情感词典并辅助语料词汇建立特定领域情感词典,结合主题关键词,否定词和程度词通过自定义规则完成对每条文本的主题情感计算;应用上述情感分值计算模型对整体的主题情感倾向进行了分析,结果发现各主题下的患者评论均是正面情感倾向居多。最后本文以评论情感值为依据对平台打分机制进行验证与优化:首先对不同医院在不同主题下的情感值进行计算汇总,并将其与医院的原始打分进行对比,结果表明情感值与打分值之间具有较高一致性,证明了该方法的合理性;然后对不同主题和原始打分项进行相关性分析,以此来验证原始打分机制的有效性;进一步根据相关分析结果构建总打分关于各主题的回归分析模型,根据回归结果提出了改善医患关系的部分建议和打分体系的扩展优化方案。本文的研究为深入分析在线医评信息提供了一定的指导意义。首先本文的主题挖掘结果揭示了患者在就医时更为关注哪些方面的信息,对于针对性地提升患者满意度具有参考价值,同时也丰富了关于患者就医行为的研究成果;其次本文使用基于领域情感词典和主题关键词的情感值计算方法,依据评论的特点为每条评论指定唯一的主题,避免了主题矩阵稀疏导致最终结果过拟合的情况,使得每条评论得到的情感倾向值更具有集中性和针对性,准确性也较高;最后,本文以主题情感值为依据,验证了原始打分机制的有效性,并对其进行了基于主题的优化,对帮助平台提升用户体验具有一定的指导价值。本文的不足之处有:情感值计算规则在定义时存在一定简化,如弱化了程度词的词序与距离影响,可能造成程度词的重复使用;回归模型中没有考虑诸如文本长度,疾病类型等非标签化变量的影响,忽视了可能存在的调节作用和其他变量间的交互作用;数据信息不全面,如缺少患者与医生之间的关联和互动信息等。
其他文献
信托财产独立性原则作为信托制度的基础,在各国信托法中均有体现,信托一旦设立,信托财产即与受托人、委托人、受益人(“信托关系人”)的自有财产相独立,任何信托关系人的债权人无法要求以信托财产求偿债务,信托因此被认为具有破产隔离的效果,并逐渐成为常见的财富管理工具。但信托制度在为家庭和企业留有灵活的财产规划空间的同时,也为信托关系人的债权人带来了债务风险。司法实践中已有较多围绕信托财产是否可以被信托关系
学位
互联网行业是深受当代年轻人欢迎的就业领域,也是众多学界、传媒关注的热点话题,近些年来,互联网行业内员工猝死等新闻频频发生,其光鲜的外表背后是以996工作制度为代表的高强度的工作方式,这也引发了大众对于互联网企业内部劳动生产体制的反思。本研究选取J公司作为个案,从空间、时间、技术三个维度去重新阐释互联网公司员工异化劳动过程。经过研究发现,在空间结构上,J公司以一种完全扁平化开放化的格局安放了无处不在
学位
本篇研究主要采用文本分析、深度访谈以及比较研究的方法。研究基于明星黄晓明的社会形象从电视时代的一种模范、优秀的形象到网络观看空间中成为一个又一个网友玩笑、揶揄和打趣的“梗”,其中涉及的观看框架的变化这一现象,重点探讨媒介环境对于社会认知框架的塑造。研究发现,基于大众媒介到数字媒介的观看环境变化,以黄晓明为例的明星形象认知框架特征确实随之也发生了变化。技术媒介通过不同的物质性特征形塑了人们对明星观看
学位
在深化改革、转型发展、社会治理、创新驱动的时代背景下,融合发展是实现区域协调发展、行业互利共赢,支撑创新发展、构筑高质量发展新格局的必然途径。在公共图书馆建设中,融合发展是实现公共图书馆高质量发展目标,助力公共图书馆转型,推动公共图书馆可持续发展的必要手段。然而,我国的公共图书馆融合建设尽管取得了一定的成绩,但仍然存在着同质化严重、缺乏顶层设计和评估标准、相关研究缺乏理论基础等等问题。我们必须思考
学位
贫困是一个由来已久的世界性难题,是经济、社会实现健康与可持续发展面临的严峻挑战,一直以来都是学界关注的重点议题。20世纪60年代开始,国外研究发现了贫困在代际间传递的现象,并参考代际流动研究范式演变出了“贫困代际传递”的概念。贫困代际传递被认为是造成长期贫困的原因之一。因此,贫困代际传递的研究受到了学术界的重点关注,被视作贫困治理的关键问题。近年来,我国的经济社会发展成就显著,减贫工作也获得了世界
学位
学者是科学研究的主体,是推动科技进步的重要贡献者。对学者进行影响力评价可以评估学者的科研水平、衡量机构的人才队伍建设情况以及发现学科领军人物,进而促进个人、机构和学科的良性发展。因此,如何构建一套有效公正的学者影响力评价体系成为学术评价界较为关注的话题。随着学者学术交流方式的变化,传统的以文献计量方法为代表的学者影响力评价方法逐渐展露局限性,新型学者影响力评价方式亟待被探寻。Altmetrics是
学位
人工智能技术的发展给需要大量重复性劳动的客服行业带来了希望,用于客户服务的机器人客服应运而生,这一趋势改变了整个客服行业的劳动力结构和工作方式。电子商务领域是机器人客服应用最广泛的领域之一,不少主流电子商务平台引入甚至自主研发了服务于平台商家的机器人客服。然而,由于目前技术的局限性,机器人客服无法像人工客服一样灵活应对各种复杂的用户问题。业界目前的方法是让机器人客服和人工客服协同接待顾客,然而目前
学位
2020年初,新冠肺炎病毒(COVID-19)疫情爆发,并迅速席卷全球。伴随着疫情的到来和扩散,民众的健康意识和健康素养水平逐渐提升,对于主动健康管理的诉求被进一步激发,越来越多的人尝试借助现代科技来实现更加精细和高效的运动健康管理。在这一背景下,智能可穿戴设备逐渐走入大众视野,被越来越多的人关注和使用。智能可穿戴设备作为一种高效便捷的健康管理终端,在自主运动健康管理、早期疾病的发现和预防中可以发
学位
读者既是高校图书馆的服务对象,也是一种活态资源。在“以读者为中心”的图书馆发展理念与后疫情时代图书馆经费紧缩、采购模式转型的趋势下,读者参与高校图书馆文献信息资源建设成为一种必然。然而,国内高校图书馆的参与实践十分有限,主要以传统的读者荐购与新兴的“准读者决策采购”模式为主;读者荐购存在参与度不够、效率低下等问题;准读者决策参与模式则存在缺乏控制、过于分散等问题。理论研究方面,现有研究多从图书馆的
学位
学术期刊作为学术成果发表的重要载体,是当下科学研究以及教育体系的重要组成部分,在个人评价、职位晋升、项目申请、机构评价等评价活动中扮演着重要角色。自学术期刊诞生以来,围绕学术期刊评价开展的研究已相当丰富。目前,期刊评价方法可分为两类,即基于定性分析的同行评议法以及基于定量分析的文献计量法。同行评议法通常选取特定领域的专家对其领域内的期刊质量进行评估,是当下期刊评价的主流方法。不过,同行评议也存在诸
学位