基于最大熵模型的越南语交叉歧义消解

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:wilsonpfan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
越南语中存在大量的交叉歧义片段。为了解决交叉歧义给分词、词性标注、实体识别和机器翻译等带来的影响,该文选取统计特征、上下文特征和歧义字段内部特征,尝试性地构建最大熵模型,对越南语的交叉歧义进行消解。该文通过三种方法整理出包含174 646词条的越南语词典,然后通过正向和逆向最大匹配方法从25 981条人工标注好的越南语分词句子中抽取5 377条歧义字段,分别测试了三类特征对歧义模型的贡献程度,并对歧义字段做五折交叉验证实验,准确率达到了87.86%。同时,与CRFs进行对比实验,结果表明该方法能更有效消解
其他文献
目的探讨原发性肝癌(PHC)的发生与乙肝病毒(HBV)感染之间的关系.方法采用放射免疫法对福建泉州地区220例原发性肝癌患者、220例良性肝病患者与295例健康人群进行血清HBV标志
十八大以来,我国经济平稳较快发展,即便在全球经济低迷、金融危机阴霾未散的背景下,我国经济发展依然取得了令世界瞩目的成绩。这得益于以习近平同志为核心的党中央,准确把握全球