基于随机森林的实体识别方法

来源 :集成技术 | 被引量 : 0次 | 上传用户:mqkxxmvo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
实体识别是将一个或多个数据源中描述同一现实世界实体的数据对象分到同一组的过程,它在数据清洗、数据集成、数据挖掘中起着至关重要的作用。然而,实体的特征具有随时间演化的特性,这使得实体识别面临巨大的挑战。传统的实体识别方法解决了特征随着时间规律性的改变问题,但没有考虑到数据的不规律变化。该文提出了基于分类的方法解决特征不规律演化的实体识别问题。该方法首先利用机器学习中改进的随机森林的方法计算记录的相似性,接着提出了一个新型的两阶段聚类算法完成记录聚类过程,最后通过在真实数据集上的对比试验证明了该算法的有效性。通过在真实数据集上的实验,证明了该方法能够有效提高演化实体的识别准确性。
其他文献
重视高校青年英语教师的职业发展,使其教育理念、职业素养、知识储备等方面得以提高迫在眉睫。学校和社会只有意识到其职业发展的必要性,找准切入点,才能为青年英语教师的顺利成
基本算法为解决要求极高的数学优化问题,需要相关基础算法具备最快、最可靠的实现方式。ILOGCPLEX就是在满足这种需求的情况下应运而生的。ILOGCPLEX提供了灵活、高性能的优化
当前,各级各类医院(尤其是大型综合性医院)检验科门诊的工作状况与医院、检验科的规模、功能和建设目标均不相匹配。出现了“大医院、大检验科、小检验科门诊”现象,无法实现检验
会计电算化专业构建“课、岗、证、赛”深度融合的课程体系探讨已经很多,但是课程体系是由不同的课程构成的,具体到一门课程“课、岗、证、赛”如何融合却鲜有研究的,笔者就《会
安德鲁·怀斯是美国怀乡写实主义绘画大师,他的绘画具有抽象意味的绘画语言,蕴含着丰富而真挚的思想情感,在超写实的优美自然景象和诗情洋溢的作品中,给观赏者以内心强烈的震
钢铁生产过程中为了获得更好的产品性能,需要用盐酸进行淋洗或浸泡。酸洗后会产生大量腐蚀性和污染性的废液,酸洗废液直接排放会造成严重的环境污染。针对该废液,加入过氧化
文章采集新疆吐鲁番地区传统家庭用烤馕酵子,对酵子中的细菌进行分析。应用传统分离培养方法分离得到乳酸菌15株,均为革兰氏阳性。提取菌株DNA,扩增16S rDNA序列,并测序。乳
我们每一个人都会常常在不经意间做出一些自己都没有注意到的小动作,不要小看这些小动作哦,从这些小动作中,往往能看出一个人的性格特征。
期刊
河北驼梁国家级自然保护区,2001年3月经河北省人民政府批准建立的省级自然保护区,2011年4月16日晋升为国家级自然保护区。保护区位于平山县境内,地理坐标为东经 Hebei Tuoli
土壤微生物量碳、基础呼吸作用、土壤代谢商是表征土壤质量的重要指标,并且与土壤本身的理化性质有关.脱氢酶活性是土壤微生物种群及其活性的重要敏感性指标之一.通过室内培