【摘 要】
:
翻译项目中翻译文档的分词效果的好坏直接决定了翻译的质量.目前存在的统计分词方法如互信息、t-测试度、接续指数等对高频词的提取并不理想.论文分析了现有的统计分词的方法
【机 构】
:
北京工业大学计算机学院,北京100124
论文部分内容阅读
翻译项目中翻译文档的分词效果的好坏直接决定了翻译的质量.目前存在的统计分词方法如互信息、t-测试度、接续指数等对高频词的提取并不理想.论文分析了现有的统计分词的方法,改进了互信息计算的方法,结合t-测试度、接续指数,提出了一个综合统计量-词效应.以词效应为基础,提出了一种中文术语提取方法.实验分析表明,基于词效应的中文术语提取方法能够提取出待翻译文档中的术语,并且不需要对文档进行任何预先处理.
其他文献
2020年,公司的工作指导方针是:以习近平新时代中国特色社会主义思想、党的十九届四中全会精神为指导,全面深入贯彻中央经济工作会议精神,坚守“四新”理念,坚持“瞄准一个中
作为博弈论的重要分支,联盟博弈论研究在决策者间存在战略合作联盟以期获得较高的收益的博弈行为.本文利用可信性理论,分析在模糊环境下的联盟博弈问题.首先,定义了模糊联盟,
宇航、高空和海拔在3000m以上的高山、高原作业都属于低气压环境下的作业,以及进入这类地区的观光、旅游、登山等活动,都面临着低气压对人体健康的影响问题。因为在海拔3000
Credibility distribution based on credibility theory is an important way to research the fuzzy variable.In this paper,we first present different definitions of
2020年上半年,与全国各行各业一样,公司经历了庚子新年席卷全国的新冠肺炎病毒感染疫情下的防控抗疫,直面这场全球性疫情带来的隔离防控、经济受损的局面.大灾面前,公司一方
报告期内,突如其来的新冠疫情给国家经济生活带来了极大的冲击,春节前,浙江省启动重大公共突发卫生事件一级响应后,景兴纸业生产原料收购量锐减,原料库存无法满足全部机台生
2020年上半年,新冠肺炎疫情对中国经济造成了巨大的影响,国内消费明显下滑,造纸行业国内市场需求萎缩,出口受阻,给公司完成年度任务目标带来了巨大的挑战.冠豪高新坚定预算目
2020年上半年,突如其来的新型冠状病毒疫情加剧了全球经济的长期停滞,大面积停工停产、物流运输放缓和终端需求萎缩等各方面不利因素使整个集团的生产经营面临巨大的挑战.面
持久性有机污染物(POPs)类有机污染物排放因子和各影响因素间的函数关系是不明确的.本文采用基于模糊等价矩阵的聚类方法对浙江省一般工业废物焚烧企业二恶英类POPs的排放因
图的最小顶点覆盖问题是一个典型的NP-hard组合优化问题,在诸多领域有着重要应用.近年来,传统遗传算法等各种智能优化方法被引入到该问题的求解中来,但效果不理想.文章基于理