中文分词技术在搜索引擎中的应用研究

来源 :计算机与网络 | 被引量 : 0次 | 上传用户:kangcj66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词作为机器翻译、文本分类、主题词提取以及信息检索的基础环节,近年来得到了广泛的关注。搜索引擎技术的广泛应用和中文信息处理的发展,使得全文检索和中文分词技术的研究逐渐深入,涌现出了众多优秀的中文分词算法。本文结合中文分词算法的研究现状,分析了分词技术与搜索引擎的信息检索相结合需要解决的关键技术问题,并讨论了中文分词技术在搜索引擎中的应用。
其他文献
各地市场监督管理局相继成立后,原来相对独立的多个行政执法部门的工作正处于融合与磨合中,“监督管理市场秩序,查处价格收费违法违规行为”是市场监督管理局重要职能之一,目
当今高等院校教育教学管理发展过程中,教学工作为重中之重,因而教学管理工作也深受重视。各高校也逐步提高对教学秘书自身的素质要求。本文作者拟结合个人工作经验,对教学秘书素
为了使粉煤灰或黄泥浆液形成高质量的三相泡沫,研制了专门用于不均质固体颗粒发泡的三相泡沫发泡器.介绍了发泡器的发泡机理,模拟了发泡器内不同扩散角度下泥浆流速和管内静压的
目的通过对原发性高血压患者血、尿中性粒细胞明胶酶相关脂质运载蛋白(NGAL)及血胱抑素C(Cysc)同肾损害的关系进行研究,探讨其在原发性高血压患者肾损害早期诊断中的意义.方法:选
基于时分信号处理方法和桥路平衡补偿思路,提出用时分补偿原理改善电源波动对催化瓦斯传感器的稳定性和精度造成的影响.利用微处理器实现时分补偿对瓦斯的检测,提出了2种A/D转换积分算法.结果表明:新型检测方法将桥路电压的测量转化为基于微处理器的时间测量,消除了电源波动的影响,其精确度比传统测量方法提高约1.5倍,稳定性提高约3倍.
1.数据和日志文件分开存放在不同磁盘上数据文件和日志文件的操作会产生大量的I/O。在可能的条件下。日志文件应该存放在一个与数据和索引所在的数据文件不同的硬盘上以分散I/O,
为了有效地进行采动巨厚湿陷性黄土地表裂缝损害的控制和治理,在对西部几个矿区开采地表裂缝破坏调查的基础上,应用概率积分法计算基岩顶界面的应力应变分布规律,分析其与地表裂
面向对象软件测试是保证面向对象软件开发项目质量的重要手段,而测试用例设计是实施面向对象软件测试的重要方面。从软件测试的技术出发,讨论了软件测试的技术特点,如何选择合适的测试方法,如何进行测试用例设计与工具选择,结合项目说明了测试实施和阶段划分。该领域的测试理论和技术还待完善,最终目的是克服软件测试的局限性,提高软件质量。
目的:探讨一体化护理模式对慢性阻塞性肺疾病(COPD)患者呼吸训练依从性的积极作用。方法:选取某福利院收治的86例COPD患者,随机分为对照组(实施常规护理)和实验组(实施一体化护理),对比
在小学数学课堂教学中,教师巧妙地运用电子白板进行辅助教学,能化静为动,变抽象为具体,缩短学生的认知过程,突出教学中的重点,化解教学中的难点,促进学生思维能力的发展。当