【摘 要】
:
随着我国与柬埔寨国家的交流合作日益频繁,进行柬埔寨的自然语言处理工作变得尤为重要。由于不同语言之间存在较大的差异,因此,其他语言的命名实体识别方法无法直接移植到柬
论文部分内容阅读
随着我国与柬埔寨国家的交流合作日益频繁,进行柬埔寨的自然语言处理工作变得尤为重要。由于不同语言之间存在较大的差异,因此,其他语言的命名实体识别方法无法直接移植到柬埔寨语中。为了提高柬埔寨语组织机构名识别的准确率,本文围绕柬埔寨语组织机构名识别模型构建,扩充组织机构名语料库等关键问题展开研究,并取得了以下成果:(1)提出了一种基于Tri-training的柬埔寨语组织机构名的识别方法。该方法首先利用改进的Tri-training算法,将基于条件随机场、支持向量机和最大熵模型三个不同的分类器组合成一个分类体系,然后利用少量的已标注语料,依据最优化样本选择策略对新加入样本进行选择,结合柬埔寨语的语言特点进行实验。结果表明该方法能够通过利用少量的已标注语料来实现对柬埔寨语组织机构名的识别。(2)提出了一种基于马尔科夫逻辑网的柬埔寨语复杂组织机构名识别方法。该方法首先采用条件随机场模型对简单的组织机构名进行识别,然后结合柬埔寨语的语言特点,得到一阶逻辑规则,将一阶逻辑规则融入到马尔科夫逻辑网中,并利用LazySAT推理算法来进行复杂组织机构名的识别。结果表明该方法能够使柬埔寨语复杂组织机构名达到更好的识别效果。(3)设计并实现了柬埔寨语组织机构名识别原型系统,为柬埔寨语命名实体识别的研究提供了有力支撑。
其他文献
由于环境温度过低、负荷变化频繁、百叶窗缝隙不严等原因,间冷塔结冻事件时有发生,严重时需要更换整列翅片管束,影响机组正常运行。通过分析间冷塔冻结原因,提出循环水多重利用、
随着我国教育综合改革的不断深化,新课改也随之出现。近年来,我国的教育行业在快速发展,小学语文教学改革也受到了广泛的关注。在当前时代背景下,语文教学应从德育与心理健康
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食
Back to yield
本文从对金融理论发展与发展金融理论的概念区别出发,在对金融理论发展的脉络进行回顾的基础上,分析了现代金融理论中新的走向,特别是对新制度金融学和行为金融学的发展进行
目的研究硫唑嘌呤片(免疫抑制剂)在健康人体的相对生物利用度并评价其生物等效性。方法20名健康志愿者自身交叉、单剂量口服硫唑嘌呤受试和参比制剂各100 mg后,用反相高效液
目的:探讨七味白术散联合思密达对小儿秋季腹泻的治疗作用。方法:将85例腹泻小儿,随机分为2组,治疗组采用七味白术散联合思密达治疗;对照组单用思密达治疗,观察临床疗效和止泻时间
在机器视觉系统中,镜头的主要作用是将目标成像在图像传感器的光敏面上。针对生产过程中机器视觉系统在保持工作距离不变的情况下需获得不同的放大倍数,采用机械补偿形式,利
推进美丽乡村建设不能片面追求所谓的现代文明,应把乡村文化的根留住。在工业化、城镇化快速发展的历史进程中,浙江省通过《千村故事》"五个一"行动计划促进保护利用历史文化村
英语中的反身代词内涵丰富,用法复杂,历来是语言学界争论的话题。由于汉语反身代词与英语反身代词在语言形式、语法功能等方面存在差异,因而中国英语学习者习得英语反身代词
众所周知再生纤维素纤维中的粘胶纤维已在常规的非织造布生产中应用了很长时间,另外,莫代尔纤维因具有较高的强度,尤其是在湿态下更为优良,因此拓展了它的应用空间。本文较多的涉