基于上下文的中文分词方法

来源 :计算机光盘软件与应用 | 被引量 : 0次 | 上传用户:gy19910192
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文总结和分析了常用的中文分词方法,并提出了一种基于上下文的分词算法。算法的原理是在文档中抽取最长重复字串,进而得到索引项。这种分词方法使得分词更加简单准确。
其他文献
为全面掌握青岛铁路地区急性传染病的流行动态,分析流行因素,为制定防治措施提供依据,现将青岛铁路地区1956—1995年急性传染病疫情资料划分为4个时期进行分析。40年间共计报告
文章主要探讨了多媒体技术如何才能提高课堂教学效果和教学质量而展开的一系列分析和研究。分析的内容主要包括多媒体等名词的概念、多媒体课件的统一性、课件不能完全“替代
施工工地职工食堂食品安全卫生管理是施工项目管理工作的重要组成部分。尤其是以农民工为主的职工食堂更容易产生疏漏。本文就一例工地食堂食物中毒事件进行调查分析,并提出切
用新兴的电解催化系统,采用特殊工艺自制的DSA类电极为阳极,对苯酚模拟污水进行了处理,得出本试验范围内的最佳处理条件为:电流密度15 mA·cm-2或10 mA·cm -2,Na2SO
本文就如何建设覆盖省、市、县三级,统一规范的消防专业指挥系统进行思考。
通过改造原气浮设备,提高含油污水的处理效果,稳定出水水质.并将原达标外排污水作为水源,经过过滤、消毒等深度处理,达到国家生活杂用水水质标准后,进行储存、加压,用于机车
按卫生部要求,2005年10月1日起施行《餐饮业和集体用餐配送单位卫生规范》(以下简称《规范》).该《规范》为确保铁路站车餐饮供应的卫生安全提供了法规依据和保障.在站车餐饮供