基于自然语言处理技术的电子商务搜索引擎研究与实现

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:baozhuangpms
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网蓬勃发展的今天,互联网上的信息更是浩如烟海。人们在享受互连网带来的便利的同时,却面临着一个如何在如此海量的内容中准确、快捷地找到自己所需要信息的问题,由此互联网搜索引擎应运而生。当前对于搜索引擎的研究是互联网技术中最热门的领域之一,人们通过搜索引擎的反馈来浏览互联网。 论文中对搜索引擎的原理、组成、数据结构、工作流程等方面做了深入而细致地研究与分析。搜索引擎的未来发展方向是个性化、智能化。对于不同搜索引擎来说,不同用户群搜索相同的内容将得到不同的更适合用户的搜索结果。系统地研究了自然语言处理的方法和目前该领域的理论、技术,深入研究了汉语自动分词方法,对常用的各种分词方法做了比较研究,改进了MM方法,提高了切词效率,详细阐述了分词所用的词表结构。索引和搜索部分借助Luecne实现。Lucene全文搜索引擎库是一种高性能、全功能的搜索引擎,其库文件全部是由Java 类来实现的。Luecne 是可以免费使用的一个开源项目,任何一种需要全文搜索能力,特别是需要具有良好跨平台能力的应用程序都适合使用Lucene技术。最后采用JSP等技术设计开发了一个的完整的网络搜索引擎。
其他文献
本体是一种重要的知识表示形式,它是共享概念模型的明确的形式化规范说明,并在语义Web、知识工程、软件工程、生物医学信息学和社会化网络等领域中得到广泛应用。然而,本体创建
随着网络技术的迅速发展,网络安全问题已经成为当今网络技术的研究重点。通常黑客和病毒是通过系统中存在的漏洞对目标主机进行系统攻击的。漏洞扫描技术就是对系统中存在的
构件技术已成为软件产业发展的关键技术之一,推行基于构件的软件开发是当前软件生产的世界潮流。构件的描述和检索是充分发挥构件技术优势、实现软件复用、构筑高质量软件产品
随着互联网技术的快速发展,使得Web技术得到了广泛的应用,并且获得了巨大的成功。Web技术有着良好的通用性、平台独立性和交互性。信息化的不断发展,促使Web技术应用到不同的
随着语义Web的快速发展,行业应用数据越来越多地选用RDF格式进行发布,RDF语义数据规模呈现爆炸性增长趋势,三元组条数已经远远超过百亿。RDF数据规模的急剧增大加深了语义数
传统的网络入侵检测技术使用手工分析和编码的方式已经不能适应网络新攻击层出不穷和数据量日益增大的趋势,知识发现能从数据集中识别出有效的、新颖的、潜在有用的模式,数据
Android的广泛应用使得Android系统缺陷越来越受到关注。由于Android平台存在一些安全机制问题,使得简单的权限机制不足以用来保证手机端软件行为的安全。而传统的Android框
随着监控系统在工业、城市建设等各个行业发挥越来越重要的作用,用户对监控系统也提出了更多的需求。然而目前市场上的监控系统组态软件尚不能满足市场需求,在监控系统软件的
大力发展公共交通作为解决城市交通问题的方法已成为社会共识。但是单纯增加公交车数量或公交线路并不能从根本上解决问题,单纯的数量增加反而会加大城市交通的压力。因此只有
近年来,深度学习在自然语言处理领域受到了更多的重视,基于深度学习的神经语言模型和词句嵌入模型相继被提出,这类模型以其高准确率、低复杂度的优点被学术界和工业界广泛研