基于Web文本挖掘中的一种中文分词算法研究

来源 :电脑开发与应用 | 被引量 : 0次 | 上传用户:LIUANQING5201314
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于Web文本挖掘问题,提出了一种改进的索引结构的词库组织体系及基于该词典结构的中文分词算法。同时,加强消除歧义方面的处理,分词精度有所提高。试验结果表明,采用该方法可较大提高中文文本的切词速度及信息的查全查准率。
其他文献
从班级的一般含义和班级建设的实质入手,分析了高职班级的特征,并对比班级建设的一般内涵,概括了高职院校班级建设的六个方面的特殊内涵,结合班级建设的教师团队形成,提出了"
9月20日至10月20日开幕的首届北京国际艺术双年展是北京乃至全国最大的国际艺术双年展,是继上海双年展、广州三年展和成都双年展之后的又一个国家规格的艺术双年展。一时,海
期刊
<正> 大悟县是个国定贫困县,经济比较落后。受各种因素制约,大悟农行业务经营十分艰难,基础设施建设严重滞后,安全工作面临的形势一直非常严峻。1998年,支行新一届党委成立后
《雕塑家的人体模特儿》是一部引进版人体摄影模特艺术专著,由Stemmle Publishers GmbH出版公司授权吉林美术出版社独家出版。本书同其他书籍一样,有许多自己的特点,每一个特
期刊
<正> 历史沿革和现实处境决定农业银行必须认真研究农村信贷工作,主要是指县及县以下的信贷业务。鉴于过去的教训,农行普遍认为农村信贷预期风险远远超出预期收益,因而近年来
读过由卢辅圣先生所著的《中国文人画通鉴》一书后,我们从中完整获得的将是中国文人画创作思想、艺术观念及表现手法的沿革,及其价值内涵的变迁。此书可以说填补了文人画研究的
期刊
研究了课堂教学质量的综合评价问题,基于不确定理论提出了不确定综合评价方法。在这个方法中,将每个评委对每项评价指标的评价当作不确定变量,提出了基于期望值的不确定综合评价
为提高西方经济学的教学质量,教学者应认真编写选用教材,教师发挥出积极引导作用,增强学生的主体学习性,最终实现教学改革的意义。
阐述了在利用Visual FoxPro开发通用试题库管理系统时,确保系统具有通用性和对试题管理与维护的开放性是极为重要的。结合笔者在系统开发中的实践经验,提出了利用Rich Textbox