【摘 要】
:
语言调查采集到的数据存在相当程度的差异,需要进行二次加工。本文基于编辑距离算法实现从语言和方言词汇大数据中的词汇相似匹配及数据的对齐和定位。通过对达让语数据进行
【基金项目】
:
教育部人文社会科学研究青年基金项目(15YJC740141);江苏高校哲学社会科学研究项目(2015SJB783)
论文部分内容阅读
语言调查采集到的数据存在相当程度的差异,需要进行二次加工。本文基于编辑距离算法实现从语言和方言词汇大数据中的词汇相似匹配及数据的对齐和定位。通过对达让语数据进行的3次实验发现,在做距离计算时,以词算而不是以词加括号内注释的整体去算的方式在保证抽取词汇召回率的基础上准确率会显著提升。实验结果表明,基于编辑距离的数据抽取方法是可行的,具有较好的检索效果。
其他文献
呼吸科重症患者常并发呼吸道、肺部真菌感染.给治疗带来一定的困难.也威胁患者的生命。为了寻求有效的预防方法,除合理应用抗生素,严格执行消毒隔离措施外,我们采用了5%苏打水对199
吉安地区的传统村落孕育了独具特色的庐陵文化,蕴藏着丰富的红色文化,对其进行保护与传承就是保护珍贵的历史文化和资源遗产。除传统的保护手段外,影像可以作为传统村落形象
善于使用物理教材,提高教材的使用质量,需要我们以严谨的态度理解教材的内涵,以科学的精神达成教材目标,以文化的视角呈现和升华教材的价值。完成从"教教材"转向"用教材教"再
本文论述了科技英语词汇的相关特点,并针对这些具体特点探索相应的翻译技巧和方法。
针对特种车辆传动箱螺纹孔处疲劳损坏的情况,基于金属物理及弹塑性原理的冷挤压强化技术和螺纹齿各部位挤压量的不同匹配对疲劳强度的影响,找出了较佳的挤压强化方案.按疲劳损伤
从翻译的文化本质入手,以70年代西方译界出现的"文化转向"为背景,语言学家尤金·奈达提出了"功能对等"的理论作为依据,从功能对等的概念出发,去探究翻译对等的实质和不同的文
生态环境部日前正式下发《重污染天气重点行业应急减排措施制定技术指南》,在重污染应急期间,对环保绩效水平不同的企业进行分类施策。其中,达到超低排放的A类企业,在重污染天气
目的探讨BCLC B期肝癌患者进行手术治疗的预后及危险因素。方法回顾性分析经手术治疗的805例BCLC A期和B期肝癌患者的临床资料及预后情况,对比BCLC A期及BCLC B期患者的预后
<正>人们最初比较重视智力因素对学生学业成就的影响和预测作用.我们认为,在学习活动中,智力因素和非智力因素共同制约着人的活动效率,其中非智力因素起决定性作用.本研究采
能源管理系统是制造业尤其是高耗能工业进行能源管理,生产监测的重要工具,为企业制定节能减排措施提供了理论和数据支撑。能源数据的采集频率决定着能源管理系统进行数据分析的精细粒度,高效的查询分析速度可以帮助企业管理人员及时发现能耗异常的出现,并采取相应的应对措施。而传统单点关系型数据库,在实际应用中表现出了明显的性能不足,将大数据技术与能源管理系统相结合是必然的趋势。本文就佛山某铝业在能源管理系统使用过