中文医学文档分词及关键词提取研究

来源 :2012中华医院信息网络大会暨第五届中美医院信息化论坛 | 被引量 : 0次 | 上传用户:dsa3635468456645
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:分词和关键词提取,是中文自然语言处理的基础,本文通过对中文电子病历文档的分词和关键词提取研究,为电子病历结构化研究提供条件[1]。对象:从省内某三甲医院电子病历系统中导出的170份肾内科电子病历的现病史部分,约为59000个中文字。过程与方法:选择分词系统,利用ICTCLAS系统作为研究工具,通过加入医学专业词典以及一些必要的调整和人工干预,提高其在医学领域的分词准确率。结果:采用本方法的处理,分词系统对现病史的分词准确率有了显著提高,达到90%。结论:以170份的现病史做样本进行研究,结果基本达到预期,若扩大样本容量,其结果能达到或高于本研究的结果,有一定的推广意义。
其他文献
提出采用Nbear框架实现的基于B/S模式的医院图书馆管理系统的设计开发模式。Nbear提供了许多灵活的工具和组件且结构严谨,大大提高了系统的开发效率,增强程序的可维护性。建立
[摘要]科学技术的不断提高促进了电器大量的生产,然而其中带来的质量上的不确定性也在加大,严重的影响了电器的使用以及厂家的信誉。本文以低压电器的质量检验以及测量为讨论对象,对如何改进检验措施,以确保低压电器的正常工作进行研究,希望为电器质量的稳定性提高提供建议。  [關键词]低压电器;质量;不确定性;检验  随着科学技术的不断发展,电器的技术含量也在逐步提高,尤其是在环境保护与资源节约方面,有了长足
问题近两年,对于拉动国民经济、推动城镇化、改善人民生活发挥了重要作用的房地产市场,国家开始逐步地加强调控,采取了一系列措施:严格房地产信贷和土地管理,提高项目资本金
EDA(Enterprise Digital Assistant,即企业级掌上电脑)在欧美等发达国家已逐渐普及,同类技术也开始在国内一些大型医院逐渐开展,融入EDA及无线网络和RFID技术的医疗信息系统,将为临
会议