一种改进的实体识别方法实现

来源 :现代计算机 | 被引量 : 0次 | 上传用户:bibby_514
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体识别是确定多个数据记录对应的是否为同一个真实世界实体的过程。在基于相似度和概率的记录匹配技术的基础上增加数据预处理和后期处理,并给出一个通用的实现框架。实验结果表明,在同样的数据集之上,改进后的方法比改进前的方法得到更好的实体识别效果。
其他文献
<正> 在欧氏空间中任何一个正交变换(保持任何两个向量的内积不变的线性变换)一定保持任何向量的长度不变,也保持任何两个向量夹角不变。如所熟知,保持任何向量长度不变的线
目的观察米非司酮(mifepristone,RU-486)治疗子宫内膜异位症(endometriosis,EMS)的疗效、副作用及不良反应和卵巢储备功能的影响。方法30例确诊为EMS的患者,以RU-486,10 mg/d,口服,3个
目的 探讨家属行为对老年患者院前急救的影响因素,为制定相应对策提供依据。方法 对205例老年患者院前急救的病例进行回顾性分析。结果 家属行为与老年患者的院前急救的成功与
宫颈糜烂是妇科常见病,占已婚妇女50%以上。临床表现为白带增多,下腹或腰骶部疼痛,盆腔沉重感,不孕等,是宫颈癌发病高危因素之一(宫颈糜烂2.5%发展为宫颈癌)。改善和治疗宫颈糜烂对宫颈
开放教育模式的设计理念充分显示了对教育对象的人文关怀,然而实践过程中,由于虚拟网络环境的加入,使得教育过程的生动性、丰富性受到影响,并极易导致学生学习的孤独感和心理
目的评价彩色多普勒超声对胆囊息肉样病变的诊断价值。方法对经手术病理证实的胆囊息肉样病变57例声像图表现进行回顾性分析。结果4例胆囊癌病灶内探及彩色血流信号75%(3/4),46例
在大规模的子图匹配过程中,如果直接对原有数据图进行查询,那么所需要的内存和时间开销都是相当巨大的。而根据现实网络的特性,假定用户大多数查询都在社区范围内,如果通过图分割算法将数据图分成多个分区,如此可在不同的分区中同时进行匹配查询,可以极大提高查询效率。提出基于启发式策略的图分割算法(HSGSA),经实验证明,分割时间不会随着图规模的增大而急剧增加,对内存的消耗也不会显著增加,并且分割后进行匹配存
真菌性阴道炎是生育期妇女最常见的阴道感染性疾病之一,发病后患者外阴瘙痒、灼痛,严重时坐卧不宁、异常痛苦。我们采用伊曲康唑联合微波治疗真菌性阴道炎,取得了满意效果,现报告
目的探讨老年高血压患者脉压及脉压指数与心电图异常的关系。方法随机抽样调查65岁以上人群进行血压及心电图检查,对其中120例高血压病患者进行分析,以脉压〈65 mm Hg,65-85