学术英语文本中连续短语单位的提取方法

来源 :解放军外国语学院学报 | 被引量 : 0次 | 上传用户：WRYJL2001

【摘要】

：

现有的语料库检索软件和统计手段多用于计算两个单词之间的搭配力，而如何测量多个单词之间的黏着力是语料库语言学尚未解决的问题。本文提出新的算法以一阶隐马尔可夫过程为基

【作者】

：

李晶洁卫乃兴

【机构】

：

上海交通大学外国语学院,上海交通大学语言文字工程研究所

【出处】

：

解放军外国语学院学报

【发表日期】

：

2010年2期

【关键词】

：

连续短语单位假拟二元序列转化概率均值加权法熵互信息

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

现有的语料库检索软件和统计手段多用于计算两个单词之间的搭配力，而如何测量多个单词之间的黏着力是语料库语言学尚未解决的问题。本文提出新的算法以一阶隐马尔可夫过程为基点，进一步结合Silva和Lopes的“假拟二元序列转化”理论，并以新JDEST语料库为测量对象。通过检验和比较，新算法能够较为有效地改进短语单位的识别与界定，提高计算机自动提取连续短语单位的准确性。

其他文献

预制式二格化粪池户厕建设及卫生效果研究

目的研制具有粪便无害化处理效果的二格式化粪池。方法根据前期调查数据及预试验结果，挑选其中一种结构形式的二格式化粪池，建设并进行粪便无害化处理效果评价。结果化粪池采用

期刊

预制式二格式化粪池卫生效果Prefab Two-grille pool Healthy effect

纳博科夫的后现代空间叙事

纳博科夫从20世纪文化思潮的转变和自身的流亡经历中汲取了全新的时空观念。他通过树立自己独特的空间意识,运用诸多后现代主义艺术手法,用平面化的视觉空间体验消解了历史的

期刊

纳博科夫后现代空间记忆空间叙事

洞庭湖区不同环境渔民血吸虫病肝纤维化调查

目的了解洞庭湖区不同血吸虫病流行环境渔民血吸虫病肝纤维化发生情况. 方法用便携式B超诊断仪对3种不同类型环境血吸虫病流行区的911名渔民进行肝实质及门脉纤维化分级诊断,

期刊

日本血吸虫病渔民环境类型肝实质纤维化门脉纤维化洞庭湖区Schistosomiasis japonica Fishermen Environmen

南通市血吸虫病传播阻断后纵向监测

南通市属水网型血吸虫病低度流行区.所辖8个县（市、区）中有7个县（市、区）、87个乡（镇）、849个村流行血吸虫病,经过积极防治,1998年达到传播阻断标准之后进入全面监测巩固阶段.现将

期刊

血吸虫病纵向监测南通市传播阻断后传播阻断标准低度流行区乡(镇)监测报告

俄语对反辞格及与汉语对偶的比较

对反（антитеза）是一种重要的俄语句法辞格，但俄语语言学界对这一辞格的研究尚不深入。对反辞格具有深化事理、强调思想、突出情感等修辞功能，可分为对偶式和对立式两种类

期刊

俄语汉语对反/对偶Russian Chinese antithesis

脾切除术后的体位改进指导及护理

脾切除病人由于术前病程长，脾功能亢进、贫血、营养失调等原因造成机体抵抗力下降，术后自身免疫功能低下，极易并发膈下脓肿，常常影响脾切除术后的康复，并大大延长住院时间，给病人心

期刊

脾切除术后护理方法体位改进自身免疫功能低下缩短病程脾功能亢进机体抵抗力营养失调

蚕桑产业推动扶贫的建议探析

就目前的发展来看,大力发展蚕桑产业,能够带动经济的持续发展,这是目前“精准扶贫、精准脱贫”的基本方略,也是重要的脱贫模式之一.在对蚕桑产业助推精准扶贫现状分析的基础

期刊

蚕桑产业扶贫发展

2000—2001年新济洲血吸虫病监测

南京市江宁区新济洲是江苏省最严重的血吸虫病流行区之一,"八五"期间该洲被列为江苏省血吸虫病防治试点区,"九五"期间试点区缩减为洲尾6个自然村.经过9年的综合防治,疫情得到

期刊

新济洲血吸虫病监测健康教育

湖沼垸内以消灭传染源为主综合治理血吸虫病的效果

期刊

血吸虫病传染源防治湖沼垸内

健康教育减少小学生接触疫水行为的研究

研究健康教育于预措施减少湖区小学生接触疫水的行为。方法在洞庭湖区选择５０所血吸虫病疫情比较严重的学校，四年级学生为研究对象，通过基线调查，针对儿童的兴趣制作了血防科普动画

期刊

健康教育血吸虫病行为改变Health education Schistosomiasis Behaviour change

学术英语文本中连续短语单位的提取方法

与本文相关的学术论文