医疗领域文本结构化

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:liongliong483
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有通用分词工具对医疗专业术语的识别效果不理想,影响了医疗文本结构化的效果。针对该问题,提出一种基于词向量的新词发现方法,利用新词发现过程中构建的词库抽取信息,得到结构化数据。使用Google开源词向量工具word2vec训练文本,将词映射到抽象的n维向量空间;根据词与词之间的得分、词的左右信息熵和在文本中的词来发现新词,把发现的新词加入用户自定义词库;设计信息抽取规则,根据发现的关键词提取对应的关键信息,将其组织为结构化数据。实验结果表明,用该方法进行结构化处理在准确率上比传统方法提高了10%,在效率上
其他文献
提出了一种采用集中式处理方式的ZigBee无线传感网络定位系统。该定位系统由网关节点、参考节点、子网关(增强型参考节点)、移动终端节点和PC服务器组成,可实现实时定位、终端报
近年来,随着中国老龄化趋势日益加剧,城市养老空间环境建设特征与老年群体的行为和心理需求矛盾日益突出,探索如何营造适宜老年群体的户外活动空间和护理环境,对于改善老年群
研究认知无线电网络的分布式数据采集问题,讨论SU用户的合适载波侦听范围(PCR),提出一种兼顾公平性的异步分布式数据采集算法(ADDC)。ADDC算法以分布式策略把快照数据收集到基站,没
通过对直流系统无功控制逻辑分析和无功功率需求的计算,结合胶东换流站交流滤波器组的类型,提出在停用某一大组交流滤波器的前提下,胶东换流站相应的最优直流功率运行方案。
基于智能电网的负荷管理系统的设计问题,首先分析了基于智能电网的负荷管理系统的组成、功能以及建设和设计的重要性;其次给出了基于智能电网的负荷管理系统的设计结构;最后
作为一种有效的带电检测技术,红外测温能够及时发现复合绝缘子缺陷,防止电网故障,提高系统稳定性。给出500 kV复合绝缘子现场红外测温的具体方法及步骤,通过大量现场红外测温
RSSI与TOF是当前处理室内定位问题的两种应用较为广泛的技术,但是其适用性受到限制且精度不高。针对室内复杂环境跟踪定位问题,采用基于RSSI和TOF两种节点测距算法进行融合计算以提高测距精度。对两种测距算法分别进行分析,建立系统运动模型,通过卡尔曼滤波对采集数据进行有效的噪音过滤;在统一的实验平台实现3种融合算法,分别为平均法,加权法和神经网络法,对仿真图形进行分析对比。实验结果表明,神经网络法