论文部分内容阅读
由香港教育学院语言资讯科学研究中心主办的“汉语语料库及语料库语言学”圆桌会议于2011年5月6日~8日在香港教育学院召开。来自美国、英国、法国、新加坡、日本、中国大陆和香港台湾高校及科研院所的专家学者40余人参加了会议。应邀到会的内地学者专家分别来自中国社会科学院语言研究所、教育部语言文字应用研究所、北京大学、清华大学、微软亚州研究院、北京外国语大学、复旦大学、山东大学、华中师范大学等单位。
与会专家代表既有长期主持、参加、参与汉语语料库研究“数十年磨一剑”的邹嘉彦、游汝杰、黄昌宁、郑锦全、王士元、周海清等“元老级”专家,也有长期海外经历、参加或参与美欧等境外国家地区语料库研究项目的魏婷兰(Thekla Wiebusch)、陶红印、肖忠华、李行德、黄居仁、方称宇、陆镜光、陈克健、罗凤珠及国内主持本领域重大创新工程的孙茂松、傅爱平、何婷婷、陈振宇、段慧明、吴云芳等一大批中青年领军学者,更有多位在语料库语言学领域脱颖而出的学术新秀。“老中青”济济一堂,共同探讨汉语语料库语言学的发展是本次圆桌会议的一个突出亮点。
在网络资讯和中文国际化的背景下,全球华语面临大交流、大融合、大发展的新形势和新挑战。总结回顾汉语语料库和语料库语言学发展的历史经验,交流人工智能、自然语言理解和语言教学及知识挖掘领域汉语语料库基础应用研究的新探索和新成果、展望汉语语料库和语料库语言学发展前景,成为这次圆桌会议的主题。
圆桌会议开幕式上,香港教育学院校长张炳良教授、香港教育学院署理副校长(研究与发展)卢成皆教授、语文学院院长陈国球教授、香港教育学院语言资讯科学研究中心邹嘉彦教授发表欢迎词。
著名语言学家王士元教授做了题为《语言与汉语语料库语言学》的专题报告,介绍了语料库语言学的基本原理和语言研究的发展,针对语言研究的新趋势提出来汉语语料库语言学如何“向前看”、如何充分发挥语料库的功能和价值的问题。
本次圆桌会议主席、香港教育学院语言资讯科学研究中心总监邹嘉彦教授首先对会议的宗旨和前瞻作了简要而深刻的概括。作为15年前领先启动“北京、上海、香港、台湾和新加坡五地华语共时语料库(LIVAC)(http://www.livac.org)”的首席专家,邹嘉彦教授重点介绍了15年来跟踪华语世界语言发展所记录下来的新生词语产生、扩散、传播、演化的分布数据,提出了从共时语料库延伸到“跟踪”语料库的新发展。
洛杉矶加州大学亚洲语言与文化系陶红印教授做了题为《从文本分析到多模态分析:汉语语料库语言学的挑战》的报告。
会议发表的主体报告和论文,选题前沿、数据翔实、经验丰富、亮点纷呈,既涉及到语言研究与语料库方法及语料库语言学相关的理论、方法、应用实践等基本问题,也涉及到社会语言学、功能语言学、计算语言学、对比语言学、儿童语言学、佛经语言学以及文体学、风格学等交叉学科;既有共时语料库、历时语料库、当代语料库、方言语料库、儿童口语语料库、佛典语料库、双语语料库、专利语料库、博客语料库等等不同类型语料库的研究报告,还有讨论语料的分词、标注等加工原则、方法、标准,以及文本描述、自动预测、知识挖掘、自动提取语法关系、自动生成语法树库、基于云计算的语料库建设和基于web自动标注等方面的探索。特别是台湾中研院历史语言研究所的历史语料库、香港教育学院语言资讯科学研究中心的LIVAC共时语料库、国家语委现代汉语规范语料库、北京大学语法信息词典、清华大学语法树库、美国、英国和欧洲的深加工附码语料库等海内外各具特色的语料库,都有主要研制者或参与者在会上进行交流,为本次会议增添了厚重而深远的学术意义。
无论是会议参加者的代表性、还是热点论题的前沿性,无论是交流论点的权威性,还是达成共识的一致性,都使此次圆桌会议成为汉语语料库语言学发展历史上的一次里程碑性质的国际性专业峰会,而每位与会代表都是这一重大学术事件的亲历者和见证人。闭幕式前,美国加州大学的陶红印、台湾中研院的陈克健、北京清华大学孙茂松、香港理工大学黄居仁、香港城市大学方称宇五位教授对圆桌会议发表了总结性感言,分析现状,发人深思;展望未来,鼓舞人心。
在之后的自由发言中,场面热烈,亮点不断。山东大学盛玉麒教授倡议成立“全球华语信息资源建设协作组”,联络全球专业人员和热心人士,以全球华语语料库资源共享、系统最佳化为目标,整合已有各类汉语语料库,避免低水平重复,搭建统一的系统平台,使“古今、中外、雅俗、声像”汉语资源各得其所、相得益彰,满足不同层次用户的需要。这一倡议引起与会者的热烈反响。
与会专家代表经过两天半紧张、有序、高效和热烈地研讨,就以下方面达成共识:
1.网络已成为新型的信息传输方式,同时也是未来社会的一种生存方式和语料库建设的主要信息资源。
2.语料库方法逐渐受到各相关领域和相关学科的重视,已成为新型的人文社会科学特别是语言学的研究“范式”,具有重要的不可替代的作用和价值。
3.迄今为止已建和在建的不同类型、不同层次的汉语语料库将继续发挥巨大的资源检索、服务等作用。
4.提高语料的加工深度和精度、处理好语料库“量”和“质”的关系,是当前和未来汉语语料库语言学面临的巨大挑战和重要任务。
5.为适应全球华语大融合、大发展的机遇与挑战,急需瞄准国际前沿目标、发挥已有资源优势、构建通用的立体化平台、建设与时俱进的动态优化系统,满足不同类型、不同层次的需要,应是汉语语料库研究者责无旁贷的历史使命。
6.树立资源价值观念和知识产权保护意识,按照“学术优先、政府主导、统一规划、共建共享”的原则,探讨“产、学、研、社、企、政”联合共建模式,努力争取政府和社会多方面的参与和支持,是汉语语料库语言学走上快速发展的通道的基本路线。
(盛玉麒 济南 山东大学中文信息研究所 250100)
与会专家代表既有长期主持、参加、参与汉语语料库研究“数十年磨一剑”的邹嘉彦、游汝杰、黄昌宁、郑锦全、王士元、周海清等“元老级”专家,也有长期海外经历、参加或参与美欧等境外国家地区语料库研究项目的魏婷兰(Thekla Wiebusch)、陶红印、肖忠华、李行德、黄居仁、方称宇、陆镜光、陈克健、罗凤珠及国内主持本领域重大创新工程的孙茂松、傅爱平、何婷婷、陈振宇、段慧明、吴云芳等一大批中青年领军学者,更有多位在语料库语言学领域脱颖而出的学术新秀。“老中青”济济一堂,共同探讨汉语语料库语言学的发展是本次圆桌会议的一个突出亮点。
在网络资讯和中文国际化的背景下,全球华语面临大交流、大融合、大发展的新形势和新挑战。总结回顾汉语语料库和语料库语言学发展的历史经验,交流人工智能、自然语言理解和语言教学及知识挖掘领域汉语语料库基础应用研究的新探索和新成果、展望汉语语料库和语料库语言学发展前景,成为这次圆桌会议的主题。
圆桌会议开幕式上,香港教育学院校长张炳良教授、香港教育学院署理副校长(研究与发展)卢成皆教授、语文学院院长陈国球教授、香港教育学院语言资讯科学研究中心邹嘉彦教授发表欢迎词。
著名语言学家王士元教授做了题为《语言与汉语语料库语言学》的专题报告,介绍了语料库语言学的基本原理和语言研究的发展,针对语言研究的新趋势提出来汉语语料库语言学如何“向前看”、如何充分发挥语料库的功能和价值的问题。
本次圆桌会议主席、香港教育学院语言资讯科学研究中心总监邹嘉彦教授首先对会议的宗旨和前瞻作了简要而深刻的概括。作为15年前领先启动“北京、上海、香港、台湾和新加坡五地华语共时语料库(LIVAC)(http://www.livac.org)”的首席专家,邹嘉彦教授重点介绍了15年来跟踪华语世界语言发展所记录下来的新生词语产生、扩散、传播、演化的分布数据,提出了从共时语料库延伸到“跟踪”语料库的新发展。
洛杉矶加州大学亚洲语言与文化系陶红印教授做了题为《从文本分析到多模态分析:汉语语料库语言学的挑战》的报告。
会议发表的主体报告和论文,选题前沿、数据翔实、经验丰富、亮点纷呈,既涉及到语言研究与语料库方法及语料库语言学相关的理论、方法、应用实践等基本问题,也涉及到社会语言学、功能语言学、计算语言学、对比语言学、儿童语言学、佛经语言学以及文体学、风格学等交叉学科;既有共时语料库、历时语料库、当代语料库、方言语料库、儿童口语语料库、佛典语料库、双语语料库、专利语料库、博客语料库等等不同类型语料库的研究报告,还有讨论语料的分词、标注等加工原则、方法、标准,以及文本描述、自动预测、知识挖掘、自动提取语法关系、自动生成语法树库、基于云计算的语料库建设和基于web自动标注等方面的探索。特别是台湾中研院历史语言研究所的历史语料库、香港教育学院语言资讯科学研究中心的LIVAC共时语料库、国家语委现代汉语规范语料库、北京大学语法信息词典、清华大学语法树库、美国、英国和欧洲的深加工附码语料库等海内外各具特色的语料库,都有主要研制者或参与者在会上进行交流,为本次会议增添了厚重而深远的学术意义。
无论是会议参加者的代表性、还是热点论题的前沿性,无论是交流论点的权威性,还是达成共识的一致性,都使此次圆桌会议成为汉语语料库语言学发展历史上的一次里程碑性质的国际性专业峰会,而每位与会代表都是这一重大学术事件的亲历者和见证人。闭幕式前,美国加州大学的陶红印、台湾中研院的陈克健、北京清华大学孙茂松、香港理工大学黄居仁、香港城市大学方称宇五位教授对圆桌会议发表了总结性感言,分析现状,发人深思;展望未来,鼓舞人心。
在之后的自由发言中,场面热烈,亮点不断。山东大学盛玉麒教授倡议成立“全球华语信息资源建设协作组”,联络全球专业人员和热心人士,以全球华语语料库资源共享、系统最佳化为目标,整合已有各类汉语语料库,避免低水平重复,搭建统一的系统平台,使“古今、中外、雅俗、声像”汉语资源各得其所、相得益彰,满足不同层次用户的需要。这一倡议引起与会者的热烈反响。
与会专家代表经过两天半紧张、有序、高效和热烈地研讨,就以下方面达成共识:
1.网络已成为新型的信息传输方式,同时也是未来社会的一种生存方式和语料库建设的主要信息资源。
2.语料库方法逐渐受到各相关领域和相关学科的重视,已成为新型的人文社会科学特别是语言学的研究“范式”,具有重要的不可替代的作用和价值。
3.迄今为止已建和在建的不同类型、不同层次的汉语语料库将继续发挥巨大的资源检索、服务等作用。
4.提高语料的加工深度和精度、处理好语料库“量”和“质”的关系,是当前和未来汉语语料库语言学面临的巨大挑战和重要任务。
5.为适应全球华语大融合、大发展的机遇与挑战,急需瞄准国际前沿目标、发挥已有资源优势、构建通用的立体化平台、建设与时俱进的动态优化系统,满足不同类型、不同层次的需要,应是汉语语料库研究者责无旁贷的历史使命。
6.树立资源价值观念和知识产权保护意识,按照“学术优先、政府主导、统一规划、共建共享”的原则,探讨“产、学、研、社、企、政”联合共建模式,努力争取政府和社会多方面的参与和支持,是汉语语料库语言学走上快速发展的通道的基本路线。
(盛玉麒 济南 山东大学中文信息研究所 250100)