对自动分词的反思

来源 :全国第七届计算语言学联合学术会议 | 被引量 : 0次 | 上传用户:yk_001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动分词是中文信息处理诸多应用系统的一个不可或缺的模块.二十年来国内外许多研究人员曾经在这块土地上辛勤耕耘,并取得了一定的成果,但从实用化的角度上来考察仍不尽人意.本文通过对自动分词任务的定义,分词歧义消解知识的调查,以及在统计语言模型的统一平台上实现自动分词,说明面向计算机的语言知识颗粒度极细、颗粒数量极大,在本质上不同于面向人的语言知识,也不是传统的句法-语义知识所能覆盖的.重新审视我们在自动分词乃至中文人息处理整个领域的思维模式和技术路线,实属必要.
其他文献
艾丽斯·沃克(Alice Walker,1944—)是美国当代优秀的黑人女作家。身为一名黑人女性,沃克更为关注黑人的困境、沉默的黑人女性以及生态环境等社会问题。生态女性主义试图通过
在数据挖掘中,聚类分析是一个重要研究方向,它研究的内容、方法和工具被广泛应用于现实生活中。比如金融诈骗、医疗事故诊断、图像处理、信息检索和生物科学等领域。近年来,
贾谊的《过秦论》和杜牧的《阿房宫赋》有许多可比之处。在比较中阅读,有助于我们更深 入地理解这两篇文章。
伴随着社会经济的不断发展,我国人才政策也有所变化。近些年,人才租赁行业不断发展,成为目前我国劳动力市场进行人力资源的柔性化管理的重要途径。人才租赁政策虽然近几年才
城市空气污染源分为天然源和人为源,对有毒气体、颗粒物质和温室气体等污染类型进行了分类综述,提出了一些减少污染的策略,介绍了利用污染物作用机理结合模拟分析、分子碰撞
加入WTO后,随着广告产业规模扩大及对外资全面开放,研究广告产业成为新的理论热点。但总的说来,我国广告产业研究还处于起步阶段。针对当前广告产业研究中的不少模糊认识,辩
张爱玲在文学创作中极善于调用各种色彩,并通过各种色彩的奇妙搭配来表达情绪、意义及笔下人物的命运。强烈的色彩对比和色彩与意象之间的密切关系,显示了张爱玲在颜色运用上
<正>肝硬化是病毒、长期酗酒或者药物刺激等致使肝细胞坏死、病变的慢性肝脏疾病,肝硬化发展到晚期时会出现肝腹水,致病机理比较复杂,为治疗造成了极大的困难[1]。选择2013年
会议
科学教育从洋务运动时期在古老的中国大地上萌芽,经历了维新运动和辛亥革命的深化,在民国时期形成制度化。山西大学堂是近代中国最早建立的三所具有近代意义的大学之一,在近
人类经济的发展,始终在波动中前行,新常态只是我国经济发展中的蓄力过程。造成新常态出现的原因较多,但核心问题是,我国的消费支出无法带动劳动产出,使得经济长期处于停滞。