【摘 要】
:
信息检索是当下获取和查询信息最重要的途径之一,是互联网中基础的服务。信息检索在给用户获取信息带来便利的同时,也存在弊端。当用户输入错误查询词串时,信息检索系统返回的信息可能偏离了用户的真实意图,从而导致用户流量的丧失。因此,信息检索中查询纠错问题是一个亟待解决的难题。本文通过对中文纠错方法的研究发现,当前研究人员提出的方法存在以下不足:1.研究方法只针对常见的部分错误类型,并未考虑少数但现实存在的
论文部分内容阅读
信息检索是当下获取和查询信息最重要的途径之一,是互联网中基础的服务。信息检索在给用户获取信息带来便利的同时,也存在弊端。当用户输入错误查询词串时,信息检索系统返回的信息可能偏离了用户的真实意图,从而导致用户流量的丧失。因此,信息检索中查询纠错问题是一个亟待解决的难题。本文通过对中文纠错方法的研究发现,当前研究人员提出的方法存在以下不足:1.研究方法只针对常见的部分错误类型,并未考虑少数但现实存在的错误类型,导致纠错效果不理想。2.多注重纠错方法研究,而忽略排序模型对纠错结果的影响,或仅使用单一的特性对得到的候选集进行评分,致使用户得到的候选项可能不是最优选项,这就严重影响了纠错的效果。针对以上不足,本文提出了基于搜索引擎的中文纠错方法。首先对用户网络日志展开研究,对输入的查询词错误原因进行分析,并根据错误原因进行分类,最后针对不同类型采用不同的纠错策略。本课题在研究过程中主要涉及以下工作:1.改进了一种针对多种错误类型的纠错策略。通过对键盘按键按照相对位置赋予相应的权重,来改进纠错策略中拼音纠错方法中对于键相邻错误纠错的不足。2.改进了排序模型建立方法。在融合N-gram模型、查询词点击率、词形相似度和编辑距离四个因素的基础上,通过引入拼音相似度特征来建立排序模型,提高纠错方法的准确率。
其他文献
随着外国人对学习中文的热情高涨,开发一个中文语病分析工具将会为中文的教学提供较大的帮助。但是目前市面上已经有比较成熟的英语语病分析工具,而与中文相关的语病分析工具至今仍待发展。因此本文旨在开发一个基于深度学习的中文语病分析系统,该系统可以判断一个中文文本段是否有语病(Detection)、识别出语病类型(Identification),并指出语病在文本段中的位置(Position)。本文在已有的研
光的固有属性包括频率、强度、相位和偏振,偏振作为光的基本物理特性之一,它可以携带重要信息,不仅包括所探测目标的准确信息,还反映了传输介质的内部分布特征。论文主要利用
国家“一带一路”倡议和“走出去”等战略的提出与大力推进,使得中国对外承包的国际项目数量逐渐增多,市场份额也随之越来越大,由此带来的对于国际工程物流的服务需求也就应声上涨,对中国的工程物流企业来说是重大利好。与此同时,全球市场竞争日趋激烈,客户的需求也越来越高,这对于所有的企业来说都是巨大的挑战。由传统的国际货代转化而来的工程物流服务企业在金融危机前由于市场竞争不充分,依靠自身资源和经验经历了发展的
《大雅可鬻——民国前期书画市场研究(1912-1937)》是一部研究民国前期书画市场中书画家的生存发展状态和书画作品的交易特点的学术著作。这一著作的译介对中国文化“走出去”、构建中国国际学术话语权、提升我国文化软实力具有重要意义。随着国际多领域学术交流的日益频繁,学术著作的翻译已成为文化沟通和知识借鉴的有效途径。但受到学术著作自身行文特点和中英文化差异所限,汉译英时还是面临着一些翻译挑战。本项目报
二十世纪九十年代以来,信息化水平已成为新经济时代衡量一个国家和地区综合实力的重要标志,已经引起了世界各国的普遍关注。国民经济信息化基础是企业信息化。企业在运营过程
金属有机骨架(MOFs)是由金属阳离子或团簇与具有多种配位模式的有机配体配位形成的多维多孔晶体材料,其具备的超高比表面积、多孔结构等显著特性使得MOFs常被当做反应载体,通
具有芳香化结构的木质素有生产高附加值化学品的巨大潜力。木质素可以在300-400℃的温度下反应形成小的自由基片段,供氢溶剂能够供给氢自由基稳定木质素碎片,有望在无催化剂
我国资本市场自成立以来,经过近30年的发展,资本市场不断完善,但相较于制度较为完善的发达国家,我国还存在一些差距。其中较为突出的就是股票价格毫无预兆的暴涨以及暴跌,而这样的现象并不少见,这不仅使得外部的投资者损失严重,也严重影响股市健康发展。正因如此,股价崩盘风险受到社会上各界人士的重视。学者们也试图分析其原因以及影响因素,寻求有效的应对措施,以稳定投资者情绪、促进股市正常运行,健康发展。国内关于
近年来,随着科技的进步,基于生物的身份识别技术被大量应用于身份识别系统中。如基于虹膜的身份识别、基于指纹的身份识别、基于人脸的身份识别。人脸识别主要通过对人脸特征
随着国家对“放管服”改革的稳步推进,旅游业监管系统深化“放管服”改革具有积极的意义。理论层面有利于深化对治理理论的认识;丰富旅游业监管手段;创新旅游业监管模式。实践层面有利于切实解决P市旅游业监管的问题;探索完善旅游业监管的路径;检验“放管服”改革实践。本文采用文献研究、调查研究、比较研究和实地研究等研究方法,从治理理论视角出发进行研究。行文按照“问题—原因—对策”的逻辑,通过对P市旅游业监管情况