面向医疗文本的实体及关系标注平台的构建及应用

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:woai2011ni
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医疗文本数据是推行智慧医疗的重要数据基础,而医疗文本为半结构或非结构化数据,难以对其直接进行应用。对医疗文本中所包含的实体及实体关系进行标注是文本结构化的重要手段,也是命名实体识别、关系自动抽取研究的基础。传统的人工标注方法费力费时,已难以适应大数据发展的需求。该文以构建中文医学知识图谱的任务为驱动,构建了半自动化实体及关系标注平台。该平台融合多种算法,能够实现文本预标注、进度控制、质量把控和数据分析等多种功能。利用该平台,进行了医学知识图谱中实体和关系标注,结果表明该平台能够在文本资源建设中控制标注过程
其他文献
受限于标注语料的领域和规模以及类别不均衡,中文人名识别性能偏低。相比人名识别训练语料,人名词典获取较为容易,利用词典提升人名识别性能有待进一步研究。该文提取人名词
国家"互联网+"战略的推动,企业对人才的数据分析方面的能力要求日益增加,在现阶段的高职院校市场营销专业(后面都改成市场营销专业)中,原有课程体系无法满足时代的要求,同时
本文对<大唐天竺使之铭>进行了全面研讨,并提出相关结论.首先,就碑铭的篆额书写风格,指出其对汉碑额篆书风格的继承和创新特色,并论证碑额"出"(之)应释为"之"字之不谬;其次,
作为百姓的养命钱,养老保险基金的安全备受关注.经过多年的发展,如今的养老保险经办机构在管理、 运行方面有了长足进步,但在财务内部控制方面还有很多短板,亟待完善.我国养
新闻与案件的相关性分析是法律领域新闻舆情分析的重要环节,可转化为新闻文本与案件文本的相似度计算任务。借助孪生网络计算文本相似度是一种有效途径,其对平衡样本具有良好
如何利用断断续续的电子证据线索来确定计算机犯罪之间的相互关联的犯罪动机、行动、相互作用和时间安排是计算机取证人员重现犯罪现场、确定犯罪嫌疑人的关键步骤,本文针对这个问题探讨了电子证据取证中的三种推理分析技术及其应用。
国库集中支付制度改革,直接加强了预算单位财政资金执行的效率和安全,有效严肃了财经纪律,同时也是推动各项改革的基础保障.文章通过完善预算管理体系,加强预算执行的事前规
近年来,随着"棱镜门"等信息安全事件的不断被披露,构建可靠的信息安全管理体系又一次成为政府与诸多企业管理者热议的话题。通常,在建立信息安全管理体系(ISMS)过程中,组织机构会投入很多资源进行资产收集、风险评估,采取种种控制措施降低风险,整个过程通常会耗费各职能部门的巨大精力,不但实际效果参差不齐,而且系统风险短板也很难被弥补。如何建立更有效的信息安全管理体系?以等级保护政策要求的第三级系统为例,
1995年11月29日,在中华人民共和国国务院代表、国务委员罗干,国务院特派专员、西藏自治区人民政府主席江村罗布,国务院特派专员、国务院宗教事务局局长叶小文的共同主持下,在西藏拉萨大昭寺释迦牟尼佛像前,举行了庄严的金瓶掣签仪式,在严格按照藏传佛教仪轨和历史定制选出的三名候选男童中,来自西藏那曲地区嘉黎县的六岁男童坚赞诺布中签,并报经国务院批准,正式继任为十一世班禅额尔德尼.历时六年的十世班禅大师转世灵童寻访认定工作终于有了一个圆满的结果.
近日,由中国建筑科学研究院有限公司(以下简称"中国建研院")中国建筑技术集团有限公司(以下简称"中技集团")承担的国家重点研发计划子课题"装配整体式预应力混凝土框架设计方