一种基于词频统计的中文分词方法

来源 :科技展望 | 被引量 : 0次 | 上传用户:jwc4542
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词是中文搜索引擎中的基本任务,本文总结和分析了常用的中文分词方法,并提出了一种基于统计的分词算法.算法的原理是在文档中抽取最长重复字串,进而得到索引项.这种分词方法使得分词更加简单准确.
其他文献
近年来,城市滨水区因其独特的自然及人文环境而备受关注,在全球范围内掀起了城市滨水区的建设热潮。正是在这样的背景下,里下河地区城市滨水区开发项目如火如荼的展开,随之出现了
中国景观电影自2002年出现以来,就一直处于媒体热议的中心。长期以来,不俗的票房成绩与舆论的普遍争议,造成了景观电影上座率与满意度的错位。如何平衡商业和美学的关系,成为景观
徐渭一生经历坎坷,著录颇丰,其首创大写意画风与其人格性情有着内在的一致性;其诗、书、画体现了鲜明的一体性特点,对其身后的中国画和文人画发展产生了深远的影响。   庶出的
期刊