基于最大熵模型的越南语交叉歧义消解

来源 :中文信息学报 | 被引量 : 0次 | 上传用户：wilsonpfan

【摘要】

：

越南语中存在大量的交叉歧义片段。为了解决交叉歧义给分词、词性标注、实体识别和机器翻译等带来的影响,该文选取统计特征、上下文特征和歧义字段内部特征,尝试性地构建最大

【作者】

：

熊明明刘艳超郭剑毅余正涛周兰江陈秀琴

【机构】

：

昆明理工大学信息工程与自动化学院,昆明理工大学智能信息处理重点实验室,昆明理工大学国际教育学院

【出处】

：

中文信息学报

【发表日期】

：

2017年4期

【关键词】

：

交叉歧义歧义消解最大熵模型越南语词典 CRFS cross ambiguity disambiguation maximum entropy mode

【基金项目】

：

国家自然科学基金（61262041,61472168）, 云南省自然科学基金（2013FA030）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

越南语中存在大量的交叉歧义片段。为了解决交叉歧义给分词、词性标注、实体识别和机器翻译等带来的影响,该文选取统计特征、上下文特征和歧义字段内部特征,尝试性地构建最大熵模型,对越南语的交叉歧义进行消解。该文通过三种方法整理出包含174 646词条的越南语词典,然后通过正向和逆向最大匹配方法从25 981条人工标注好的越南语分词句子中抽取5 377条歧义字段,分别测试了三类特征对歧义模型的贡献程度,并对歧义字段做五折交叉验证实验,准确率达到了87.86%。同时,与CRFs进行对比实验,结果表明该方法能更有效消解

其他文献

原发性肝癌与HBV感染的关系探讨（附220例分析）

目的探讨原发性肝癌(PHC)的发生与乙肝病毒(HBV)感染之间的关系.方法采用放射免疫法对福建泉州地区220例原发性肝癌患者、220例良性肝病患者与295例健康人群进行血清HBV标志

期刊

PHCHBV感染原发性肝癌抗HBC阳性血清HBV性病地区福建模式

新常态下宏观调控新框架渐趋成熟

十八大以来，我国经济平稳较快发展，即便在全球经济低迷、金融危机阴霾未散的背景下，我国经济发展依然取得了令世界瞩目的成绩。这得益于以习近平同志为核心的党中央，准确把握全球

期刊

宏观调控方式中国经济发展成熟经济低迷全球经济发展结构性改革金融危机政策框架

基于最大熵模型的越南语交叉歧义消解

与本文相关的学术论文