【摘 要】
:
语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息
【基金项目】
:
国家 8 6 3计划资助项目 (2 0 0 1AA114 2 10 ,2 0 0 2AA1170 10 );国家自然科学基金资助项目 (6 0 1730 0 5 )
论文部分内容阅读
语言知识库的规模和质量决定了自然语言处理系统的成败。经过 18年的努力 ,北京大学计算语言学研究所已经积累了一系列颇具规模、质量上乘的语言数据资源 :现代汉语语法信息词典 ,大规模基本标注语料库 ,现代汉语语义词典 ,中文概念词典 ,不同单位对齐的双语语料库 ,多个专业领域的术语库 ,现代汉语短语结构规则库 ,中国古代诗词语料库等等。本项研究将把这些语言数据资源集成为一个综合型的语言知识库。集成不同的语言数据资源时 ,必须克服它们之间的“缝隙”。规划中的综合型语言知识库除了有统一的友好的使用界面和方便的应用程序接口外 ,还将提供支持知识挖掘的工具软件 ,促使现有的语言数据资源从初级产品形式向深加工产品形式不断发展 ;提供多种形式的知识传播和信息服务机制 ,让综合型语言知识库为语言信息处理研究、语言学本体研究和语言教学提供全方位的、多层次的支持
其他文献
1904年济南开埠和商埠划界后,受当时资金和施工条件地制约,建设进展缓慢,而且商埠建设是从一大马路开始逐渐向南发展。比起店铺林立的二大马路,经三路要安静许多,商业形态也
“市场正是因为投资者的恩惠而存在”这一基础性理念是促使本文写就的直接动因。随着市场经济的发展,为追求规模经济,上市公司收购行为迅猛增加,这引起多方利益冲突,尤其是处于弱
某型号旋挖钻机在满载提升时发动机声音异常,存在发动机掉速问题,钻孔时出现工作速度较慢故障。根据工作原理分析故障原因,实施改进方案。改进后,在相同条件和负载压力下,钻
一那天下午,我回到甘露园,到五号楼下超市门口喝啤酒,顺便找收废品的老曹淘换个东西。我们一边抽烟、喝酒,一边看夕阳慢慢地沉下去,颜色从金黄变成了血红。小广场上已经开始
数据是开展跨国定量研究的前提与基础,深入理解数据资源有助于提升科研层次。社会科学中常见数据资源主要通过统计、抽样调查和数学建模三种路径生成,而运用于跨国比较研究的
痛风(gout)是一种慢性代谢紊乱疾病,以血中尿酸增高为特点。随着经济发展和生活方式改变,其患病率逐渐上升,已引起国内外医学界的重视。本研究旨在观察清热祛湿汤治疗痛风风湿郁热
电子天平是目前较先进的称量方法,其主要依据电磁力平衡原理对物体的重量进行称量,相比旧式称量器具,电子天平承重的数值更加准确、可靠,并且承重数据可以通过数值直接体现出
目的比较经皮椎间孔镜(PTED)和Quandrant微创通道下治疗单节段腰椎间盘突出症(LDH)的临床疗效。方法单节段LDH病人74例,按手术方式不同将病人分为两组,PTED组45例,采用经皮椎
阐释学和接受美学与文学翻译研究之间存在着一种本质的联系,从中我们可以看出,前二者与文学翻译研究在研究对象和研究范围方面有着惊人的交叉重叠性。此外我们还发现,中外大量的
国有企业建立现代企业制度的基本途径是公司制改造,进行公司改造的关键是建立和完善法人治理结构。国有企业建立法人治理结构的难点在于公有制条件下,特别是在企业党组织参与管