特定领域术语的自动获取

被引量 : 0次 | 上传用户:dengjuanjuan8288
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
领域术语自动获取是自然语言处理领域的一项重要的研究课题。随着自然语言处理(NLP)应用领域的不断扩展,对于领域专业词汇词典的需求也越来越迫切。研究证明把领域知识应用于信息处理的各种技术,例如信息检索、信息提取、数据挖掘等中去都会取得很好的效果,而这种方法的性能在很大程度上依赖于一个庞大的领域术语库。到目前为止,领域术语库主要依靠人工构建,代价十分巨大而且进展缓慢。因此,如何自动的对获取领域术语,并且及时发现领域新术语,对把握学科领域的发展现状、未来趋向等具有非常重要的理论和现实意义。 目前,国内对领域术语获取的研究主要集中在基于语料库的分析上,并且对领域术语自动获取的研究还不是很多。国外的研究很多局限在西方语言上,对于汉语并不适用。因此,自行研制适合于汉语的领域术语自动选取的方法,对汉语术语标准化、中文信息处理来说无疑具有十分重要的意义。 本文正是针对目前领域术语库主要采用人工构建的这种现状,对领域术语自动获取进行比较深入的探讨,本文的研究工作主要包括以下几个方面: 1、对已有的领域术语自动选取模型的本质、优缺点进行了分析和比较。 2、提出并建立了一种基于CBC聚类方法的领域术语自动获取模型,该模型避免了单纯以领域相减或统计方法获取领域术语的局限性。 3、通过对术语评分选取种子术语,并且引入修正的余弦公式来进行术语间相似度的计算,并设计了领域术语自动获取系统的核心模块。
其他文献
苦瓜是一种药食同源的植物,最早在印度用于治疗糖尿病。目前,苦瓜降血糖的特性越来越受到人们的重视。针对苦瓜皂甙和多糖的应用前景,本论文综合苦瓜皂甙和多糖现有提取工艺
二、国外食品安全监管体制改革的共同特征和发展趋势随着食品产业链条的不断延长和国际贸易量的日趋扩大,食品不安全因素越来越复杂、风险越来越大。各国政府都不得不重新审视
目前高层建筑具有施工范围广,功能复杂,以及施工难度大,楼层多等主要特点,而对于高层建筑的电气设计工作,也有了一个更高的要求。因此,对于现代高层建筑电气设计,需要从多个
传统翻译教学中,翻译技巧的教学多以举例、翻译实践为主要教学手段。文章尝试基于功能对等理论,在翻译实践教学中,针对新闻文本的翻译技巧开展赏析教学,并在译例赏析中归纳该
21世纪是科学技术竞争的时代,科学技术的竞争是人才的竞争,因此,人力资源的开发越来越重要,员工培训是企业人力资源开发的重要手段,也是企业发展的基础工作。 通过员工培
在学术界,不少人一直在诟病工农兵文学的政治性。其实,政治性并非工农兵文学所独有,而且也并非工农兵文学的本质,其本质是人民性。工农兵文学的人民性不同于西方批判现实主义
“知识本位”是一种知识选择的方式,指在知识选择上特别重视学科本身的逻辑和结构;“知识本位教育”则是一种教育选择方式,它将本来宽泛的教育概念狭隘化,把知识传授等同于教
小型实心轴编码器采用常规联轴器安装时,其轴线与驱动轴的轴线之间存在有不同轴、不平行等综合误差,致使联轴器出现疲劳破坏,缩短编码器寿命,严重影响编码器的检测精度。介绍
基于统计学习理论的支持向量机是当前机器学习领域的一个研究热点。它具有良好的泛化性能、可解决非线性问题、具有稀疏性和全局最优解等优点,但在标准分类模型和参数选择方
研究性学习作为培养学生创新精神和实践能力的重要载体已成为我国基础教育课程改革的一个亮点。师范类五年一贯制担负着培养从事基础教育工作的大专生的重要使命。长期以来,