【摘 要】
:
中文地名构词能力强、特征多样,难以从文本中准确定位到地名的位置和边界.为实现复杂中文地名的准确自动识别,深入分析了复杂中文地名的特征,将地名识别问题转换为序列标注问
【机 构】
:
南京财经大学信息工程学院,江苏省现代粮食流通与安全协同创新中心,江苏南京210003
论文部分内容阅读
中文地名构词能力强、特征多样,难以从文本中准确定位到地名的位置和边界.为实现复杂中文地名的准确自动识别,深入分析了复杂中文地名的特征,将地名识别问题转换为序列标注问题,训练条件随机场(conditional random field,CRF)模型对地名进行识别,并结合规则对CRF结果进行了修正和补召.为进一步提高对复杂地名的识别精度,设计了一种基于信息熵和点互信息的复杂地名识别算法,该算法利用地名数据库生成关联性词典,并基于该词典对文本相邻用字之间的关联性进行计算,从而确定复杂地名与上下文的边界,最终实现复杂地名的识别.实验结果显示,所提方法能够将现有的规则集合高效地用于地名识别,与CRF模型配合,提高了识别精度.在测试集上所提出的地名识别算法的准确度都高于包括深度学习算法在内的目前主流的识别算法.
其他文献
随着成品油市场的逐步向民营资本和外资的开放,中国石油石化市场由国家统一配置原油资源和中石油、中石化两大集团集中垄断中国成品油市场的局面将被打破,逐步形成国有大型石油
在虚实融合中,虚实场景显示的较高精确性和较好实时性是良好用户体验的必要条件。然而,环境干扰、算法时间空间复杂度以及高帧频处理速度等问题严重影响虚实融合效果,现存的虚实融合方法很难同时满足精确性和实时性的要求。针对此难点问题,提出了一种基于局部加速的精确虚实融合方法,利用明显特征建立虚实场景映射关系,同时对融合区域进行局部搜索匹配。具体创新体现在以下2点:1)提出了一种虚实场景的普适标定配准方法;2
近年来随着人们的物质生活水平的不断提高对于幸福感问题的研究引起了社会的重视,研究者们也在这方面投入了很多的关注,但是大多数的研究都集中于人们日常生活质量的主观幸福感
企业债券如果发行主体为公司制企业,即为公司债券。企业债券市场对一国的经济和金融的发展具有重要意义。首先,与贷款相比,债券融资在体现借款人意愿方面,具有更强的灵活性,
起重机可以举起重物,将其移动到侧面并放下.希腊人在2500年前就使用这种方法建造了大理石寺庙;如今,每秒钟世界各地都在使用高大的到岸龙门起重机来装卸集装箱船时.
股票回购是从上世纪50年代引起理论界注意的,研究的核心问题,始终围绕着回购动机展开,60年以来,一个看似简单的公司掏钱到市场上买回自己发行的股票的行为背后,却可以挖掘出
1月24日,“创亿杯·2009广播电视十大优秀企业评选”活动颁奖在北京举行。洞察行业的发展趋势,倡导品牌力量。为创建广电行业加快发展的市场环境,引导企业品牌意识,共同推动
摘 要:通过分析高中数学作业对于学生巩固知识、培养能力中发挥的作用,以及新课程背景下存在的现实问题,对新课程背景下高中数学作业的有效性进行了探讨。 关键词:高中数学 作业 有效性 作业,作为教与学的交叉点,它是学生学习知识、发展思维、培养能力的最经常性的一项实践活动,是学生在亲身实践中巩固知识、深化知识、形成技能的重要环节;是教师用来检查、了解教学效果的重要手段和方式,是驾驭和调控教学活动
为了应对气候变化,许多政府都在制定雄心勃勃的可再生能源计划.问题是,每次我们的能源需求最大的时候,可再生能源却并非充足可用.例如,太阳下山后,太阳能就不可用了,此时我们