【摘 要】
:
基本名词短语识别是自然语言处理领域非常重要的子任务。文中总结了一些有代表性的基本名词短语识别方法,并对多种典型英语基本名词短语识别的结果进行了比较和对照,提出并实
【机 构】
:
哈尔滨工业大学计算机科学与技术学院,东北林业大学信息与计算机工程学院
【基金项目】
:
国家自然科学基金(编号:60302021,60375019);国家863高技术研究发展计划项目(子课题)(编号:2002AA117010-09);科技部政府间国际合作项目(编号:CI-2003-03)资助
论文部分内容阅读
基本名词短语识别是自然语言处理领域非常重要的子任务。文中总结了一些有代表性的基本名词短语识别方法,并对多种典型英语基本名词短语识别的结果进行了比较和对照,提出并实现了边界统计和词性串校正相结合的英语基本名词短语识别方法。该方法把基本名词短语识别分成主次分明的两部分,边界统计作为主要部分能够正确识别出大部分基本名词短语,词性串规则作为辅助手段在对前者识别出的基本名词短语进行核对和校正的同时还对边界统计方法遗漏的基本名词短语进行再回收。此方法中,词性串规则弥补了边界统计无法顾及基本名词短语内部组合规律的缺点,提高了精确率和召回率。采用此方法,基本名词短语识别的精确率达到96.22%,召回率97.59%,Fβ=196.90%,F值超出了目前报道的最好结果。
其他文献
目的:探讨血清胱抑素C(cystatin C,Cys C)的水平在肾病早期诊断中的临床应用价值。方法:采用颗粒增强透射免疫比浊法测定110例肾功能损害患者血清中Cys C,苦味酸法测定血清肌酐,
<正>韩愈的《师说》是针对唐代中叶士林中人以相师为耻的现实而写的一篇檄文,阐释了韩愈关于教师作用、从师原因、从师原则及从师方法等方面的不凡见解,其观点不同寻常甚至惊
基于模型的用户界面开发环境(MB_UIDEs)旨在通过使用某种特定的方法给设计人员提供一种更加系统的用户界面开发途径。文章介绍的就是一个新的基于FMP模型的用户界面开发环境
<正>一、一元二次不等式及其解法1.形如ax~2+bx+c>0(或<0)(其中a≠0)的不等式.例1解不等式x~2+x-6>0.分析不等式左边可以因式分解,根据"符号法则——正正(负负)得正、正负得
研究了滇池流域入湖河流丰水期大型底栖动物群落特征及其与水环境因子的关系.在滇池流域29条入湖河流2009年7~8月进行大型底栖动物群落调查,并在2008年9月~2009年8月进行逐月17
鲁迅的作品思想博大精深,艺术风格多样,既是中国文学的宝贵遗产,又是世界艺术宝库的一朵奇葩。鲁迅的作品语言丰满而洗练,隽永而含蓄,诙谐而峭拔,于个性的表达中酣畅着审美的
文章尝试从颈源性眩晕的发生与颈部解剖的关系这方面着手分析颈源性眩晕可能的机制。目的在于为临床诊疗提供一些有益的思考,以期能够举一反三、在复杂的征象中抓住重点,提高
探究中医辨证分型治疗冠心病不稳定性心绞痛的临床疗效。选取2015年5月-2016年11月甘肃省华亭县人民医院收治的冠心病不稳定性心绞痛患者89例,以双盲法分为观察组与对照组,对照
提出了一种模块化气浮调节式人工沉床装置,并应用于富营养化水体的生态修复.该装置克服了水深变化大、富营养化水体透明度低、夏季藻类和浮萍泛滥等不利因素对水生植物生长的
本论文首先论述了中英思维模式的主要差异,包括形合与意合的差异、直线型思维与螺旋型思维的差异等。并阐述了如何培养英语思维能力:使用口语教学,为训练外语思维创造语言环