基于搜索引擎的中文分词评估方法

来源 :情报科学 | 被引量 : 0次 | 上传用户:yangpin1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词的结果是影响搜索引擎中文检索结果质量的重要因素,能否准确有效的分词对提高搜索结果的相关性和用户满意度都至关重要。本文回顾和整理了中文分词评估所依靠的理论依据,同时建立了一套完整的基于搜索引擎中文分词评估方法。这套评估方法涵盖了评估样本的提取、评估人员选取、评估标准的制定、以及评估流程的设置等各个方面。实例分析的结果表明此方法是行之有效的。在此基础上,作者进一步对实验评估的结果进行了深入讨论,并提出了提高评估效果的几条建议,包括如何考虑评估人员背景、取舍评估项目等。
其他文献
对CNKI期刊全文数据库2000-2005年O-X类论文进行了统计分析,结果表明:论文总数有逐年增长的趋向,2000年至2005年增长率为52.66%,增长最快的是T工业技术类;论文最多的是R医药、卫生类
科学技术的发展给我们的生产和生活带来了质的变化,智能化是科学技术发展的重要表现。结合实际对基于RFID的智能感知与分析技术进行了探讨。
本文以金融网站作为信息来源,以财务分析作为主要分析方法,以定量分析为主对竞争对手分析作了一个比较全面的论述。
随着科技的创新和发展,科学教育已经成为当代社会人才培养的重要组成部分。作为幼儿科学教育的引导者,我们应该在生活中让幼儿体验初步探究的快乐,培养科学探索的兴趣。《幼儿园教育指导纲要(试行)》指出:“环境是重要的教育资源,应通过环境的创设和利用,有效地促进幼儿的发展。”幼儿园环境要对科学教育活动的开展起到良好的支持作用,在创设时就必须遵循探究性、互动性、过程性等原则,并围绕科学教育的内涵,加强科普教育
信息化建设中大数据的产生,要求“数据库技术”课程教学必须适应技术发展。文章给出了高职院校计算机专业“数据库技术”课程改革现状,在此基础上,从课程标准、课程设计、课
从2016年国家工信部正式发部《纺织工业发展规划(2016-2020)》至今,浙江省纺织业依据规划指引,逐步迈向产业中高端发展道路。浙江省政府工作报告(2019)指出:对于以纺织业为代
应用电磁干扰理论,分析了干扰案例的干扰机理和耦合通道,导出了干扰案例的等效电路,建立了Matlab仿真模型并进行了验证,最后根据上述模型给出了消除干扰的解决措施。Matlab仿
据悉,武汉理工大学信息工程学院刘新华教授团队研制出皮肤解码机器人。该机器人针对中国18-45岁女性的脸部进行数据采集,目前采集样本还不够多,一旦采样率达到80%,中国女性"颜
为确保信息资源战略制定全面性、系统性与针对性,本文把信息资源作为图书情报大系统的一个子系统研究,认为信息资源系统由信息资源获取与组织、信息资源加工、信息服务三大要素
新冠肺炎疫情防控期间,我校积极响应教育部"延期开学,不停教、不停学"的工作指示,教师们改变传统的线下授课模式,积极探索有效的线上教学模式。文章以我校食品科学与工程专业