基于文本挖掘的疾病辅助导诊技术研究

来源 :北京邮电大学 | 被引量 : 10次 | 上传用户:suixin2002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在医疗数据中挖掘有价值信息是一个亟待解决的问题。随着医疗领域文本数据的累积,其中蕴含价值不可估量,对知识发现工具需求日益强烈。此外,就患者而言,有远程自助导诊的需求。为解决以上问题,本文将Bayes分类技术应用于医疗导诊中,并针对医疗文本特征提出优化模型。本文提出基于Jelinek-Mercer (JM)的双层Bayes分类模型。医疗文本具有类别区分不明显、缺乏大规模训练集、某些低频词具有高判别性、多层级等特征,JM双层模型利用JM平滑技术解决训练集不完备的问题,并针对文本多层级特征,构建双层模型,提高分类精度。基于JM双层模型的理论分析,本文完成实验平台搭建,用JAVA语言实现了伯努利和多项式两种Bayes分类器,并分别完成双层模型构建,最后在双层模型基础上引入JM平滑模块。实验结果表明,双层伯努利和多项式模型的分类准确率分别为0.894和0.903,较单层模型分别提高7.84%和6.61%。在双层模型基础上引入JM平滑模块后,精度有进一步提升,伯努利和多项式准确率分别为0.905和0.912。实验中精度最高的是基于JM的双层多项式Bayes模型。最后,将分类精度达0.912的分类器应用于导诊系统中,完成导诊应用系统的设计和实现。患者可以通过远程输入主诉症状,进行自助导诊。利用JM双层多项式Bayes分类器进行疾病类别判定,完成改进的贝叶斯分类模型在医疗导诊领域的应用研究。
其他文献
1引言随着旅游业的蓬勃发展,酒店作为旅游业最大的服务体系,其发展也得到了空间的提升;以前只有大型城市会建设一定量的酒店,如今小到二三线甚至是四五线城市也都可以建立各种规
通过对朝鲜族民歌手卞英花及其老师姜信子两代人的从艺经历的调查,笔者了解到延边朝鲜族民间音乐的传承模式,在社会历史的变迁中,从民间走入学院、并得到发展和创新的全过程
针对山东省煤炭行业碳排放问题,基于2005年~2014年山东省煤炭行业历史数据,首先采用Kaya分解模型,找出影响山东煤炭行业碳排放水平的驱动因素,以及各因素的变化趋势;然后结合
目前规模化、集约化养殖已是当前的趋势,这样兽药残留也就成为了大家关注的一个热点问题。药物残留不仅直接对人体产生急慢性毒性作用,引起细菌耐药性的增强,还可以通过环境和食
中国"入世"预示了市场基础性配置作用下的区域经济更大范围的调整和互动.以"大北京""大上海"区域经济的视角审视并找准秦皇岛的位置,关系到秦皇岛这一港口城市的跨越式发展,
目的:观察苦参汤熏洗结合派瑞松外涂治疗肛门湿疹的临床疗效。方法:将100例肛门湿疹患者随机分为两组,治疗组50例予以苦参汤熏洗结合派瑞松外涂治疗.对照组50例予以单用派瑞松外
胃空肠结肠瘘是胃空肠吻合或胃大部切除术后复发性溃疡的一种罕见而严重的并发症。通过胃镜、肠镜诊断优于钡剂造影检查。手术时需要切除瘘管及过大残胃,残留胃窦部应彻底切
发生在20世纪90年代初的苏联解体和苏共衰败,是世界共产主义运动的重大挫折.剧变的进程证明,搞垮苏共的重要力量是苏共党内的腐败分子和异化者.
作为危害最大的原虫病,重庆本地经感染的病猪数量大增,严重影响生猪养殖业的健康可持续发展。文章汇总各项资料,结合临床实践,就此病的诊治要点做汇总阐述,为今后科学防治此
"比较新闻学"虽说在我国起步比较晚,但对于它的研究却是新闻传播学研究中发展最快的领域之一,近几年有许多成果问世.这些成果大都是"中西新闻的比较",对于我们借鉴西方新闻传