【摘 要】
:
探索适合医学文本的分词方法,为医学数据挖掘和临床决策支持的语义分析奠定基础。分别使用单纯中科院ICTCLAS分词、ICTCLAS+自定义词典、ICTCLAS+统计分词和ICTCLAS+自定义词
【机 构】
:
中南大学信息安全与大数据研究院,医学信息研究湖南省普通高等学校重点实验室(中南大学),湖南省高等学校医学大数据2011协同创新中心,中国科学院成都文献情报中心,中南大学湘雅医院
论文部分内容阅读
探索适合医学文本的分词方法,为医学数据挖掘和临床决策支持的语义分析奠定基础。分别使用单纯中科院ICTCLAS分词、ICTCLAS+自定义词典、ICTCLAS+统计分词和ICTCLAS+自定义词典结合互信息统计分词4种策略,对1 500份出院记录中的病历文本进行分词处理,并从准确率、召回率和综合指标值等3个方面对分词结果进行评价。以人工分词的50份出院记录结果为标准依据,4种分词策略的综合指标值分别为45.77%、58.76%、64.93%和78.06%。结果证实,自定义词典结合基于互信息的统计分词方法,能够有效地对病历中出院记录文本进行分词处理,可以满足临床数据分析的需求,具有良好的推广意义。
其他文献
四川省运动技术学院是四川省输送优秀竞技体育人才的主阵地,同时承担四川省备战“全运会”的主要任务,目前四川省运动技术学院正在积极谋划四川竞技体育可持续发展,而运动员
经过多年调查与实践,我发现学生感觉习作难的原因是:无啥写(没素材);不会写(不会表达);不会改(不会修改)。这些原因,使学生对作文产生畏惧感,教师觉得作文难教。如何解决学生
在对小波域数字水印的嵌入算法研究的基础上,利用混沌序列所特有的不可预测性,提出了一种基于混沌映射的小波域数字图像水印算法.首先在密钥控制下,对二值原始水印图像进行置
研究性学习的应用,对英语专业教与学有很强的指导意义,要求我们在英语专业教与学中应重视并合理运用研究性学习,以培养学生的各种能力。
液化气储运过程事故机理十分复杂, 针对事故机理研究进行了仿真软件开发, 介绍了仿真模型、软件分析设计过程及软件的特点.
具备自主学习的能力意味着获得确定学习目标、主动实施学习计划、以及对学习进行监控和评估的能力。本文以湖南工程学院英语专业阅读课程改革中的有益尝试,自主学习任务书为案
从法学教育的角度出发,培养合格且优秀的法律人应抓住素质教育的两个环节,即"外部灌输"与"内心培养",并通过其发挥法学教育的"层次效应".
传统的课堂教学,教师单调呆板地“讲”,学生无精打采地“听”,整个课堂如一潭死水,教学效果甚微!因此,我们必须努力改革传统教学模式,把思想品德课堂打造成学生学习的乐园。 一、精心设计导课环节,激发学生的学习兴趣 新颖别致、动心触情的课堂导入,能吸引学生的注意力,引导学生的思维方向,启发学生的学习动机,调动学生的学习情绪,使学生很快进入角色,积极投入学习。思想品德课堂的导入方法多种多样,教
2007年底,自治区党委、自治区人民政府下发《关于全面实施职业教育攻坚的决定》和全区职业教育攻坚动员大会召开以后,中共广西党委书记郭声琨提出要尽快启动、早见成效,目前全区各地“职教攻坚”工作进展如何?日前,记者就此采访了广西教育厅副厅长黄宇。 黄宇副厅长介绍说,2月26日至3月9日,教育厅组织两个检查组,先后深入贵港、玉林、梧州、贺州、桂林、柳州、来宾、河池、百色、崇左等10个市及其所辖的16个