【摘 要】
:
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于
【基金项目】
:
国家科技支撑项目(2012BAH24B00)
论文部分内容阅读
本文在介绍分析常用中文分词方法及其特点的基础上,针对地名地址字符串,提出基于地址要素识别机制的地名地址分词算法。该算法基于整词二分分词词典,采用FMM算法,增加了基于地址要素的识别机制,从而有效地实现了对地名地址串的拆分。识别机制通过判断地址要素的完整性完成对未登录地址名称的处理,解决了分词算法对未登录地址名称的识别问题。测试证明新算法能够有效实现对地名地址串的拆分,从很大程度上解决对未登录地址名称的识别问题。
其他文献
随着新课程改革的进一步深化,农村小学语文这一特殊领域迫切需要一系列教学模式方法对其加以指导。本文属于国家级课题"区域性农村小学课堂教学模式改革研究"之下的系列子课
自1954年建校以来,北京舞蹈学院在60年的发展历程中始终引领者中国当代舞蹈教育的不断向前发展,从早期舞蹈中等职业教育到新时期以来的舞蹈高等教育,北京舞蹈学院的教育教学
大数据也称之为"Big Data",是随着计算机技术发展而来的一种技术,目前已应用于多个行业的数据处理分析中。本文首先概述了大数据处理技术,指出了新时代测绘地理信息服务面临
小学阶段是提升学生综合素养的关键时期,而数学是小学阶段极为重要的一门学科,它不仅能够提升学生对数学的认知,还可以进一步培养学生的逻辑思维能力。但从实际的授课情况来
为探讨含水煤样动静组合加载下的力学特征,利用改进split Hopkinson pressure bar(SHPB)和RMT–150试验系统对自然和饱水7 d煤样进行了三维动静组合加载、三维静载对比试验。
目的:通过检测脓毒症患者与健康志愿者血中氨基酸水平,了解机体不同状态下血中氨基酸谱的变化特点,以及不同临床结局时脓毒症患者血氨基酸谱情况,为脓毒症患者的合理营养治疗
水具有灵活、巧于因借、形式多样等特点,不仅能起到组织空间、协调水景多层次变化等作用,更能明确游览路线,给人以明确的方向感。主要介绍水景观的特性及依水景观的设计形式,及水
十九世纪末期 ,托尔斯泰成为俄罗斯社会的精神领袖 ,他的思想体现了俄罗斯民族文化的特质。在忏悔中完善自我 ,托尔斯泰认为 ,只有不断反省、忏悔 ,人才能克制自身的动物性 ;
江南丝竹于2006年被列入第一批国家级非物质文化遗产名录,以其特有的地方风格和浓郁的江南韵味而广泛流行于江浙沪,并得到全国各地人民的喜好,是中国民族民间音乐中的一朵奇
随着互联网技术的成熟,电子商务的竞争越来越激烈。如何获得更多顾客份额尤其拥有一定数量的忠诚消费者是网站盈利的本质。本文通过实证研究影响网络消费者忠诚度的因素为网