彩铃智能搜索引擎的设计与实现

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户:sophie8112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
彩铃业务是一项由被叫(或主叫)用户定制,为主叫用户提供一段悦耳的音乐或一句问候语来替代普通回铃音的业务。用户申请开通彩铃业务之后,可以自行设定个性化回铃音,在其做被叫时,为主叫用户播放个性化定制的音乐或录音,来代替普通的回铃音。近几年来,随着彩铃业务的迅猛发展,彩铃平台中的铃音数量与日俱增,数以万计的铃音出现在用户的眼前,各家铃音制作商创作的千奇百怪的彩铃使用户越发不知所从,难以挑选,现有的各种接入方式中的传统铃音查找方式已经不能满足用户的需要。另一方面,由搜索巨头Google公司所引领的搜索技术革新使得搜索领域有了突飞猛进的发展,各种分词、索引、排序等算法不断涌现,并出现了以Lucene、Nutch等为代表的开源搜索引擎工具,搜索技术已经日趋成熟。垂直搜索是目前搜索领域的重点发展方向之一。它是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,将非结构化数据抽取成特定的结构化信息数据,网页搜索是以网页为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理。本文所介绍的彩铃智能搜索引擎正是利用现有的搜索技术,针对彩铃平台所开发的一套高效、智能的垂直搜索引擎。第一章引言简单介绍了目前垂直搜索引擎的发展现状。第二章对彩铃平台做了一个总体的介绍,从组网、数据、接入方式等方面分析了彩铃平台的特点。第三章介绍了目前搜索引擎领域中所用到的关键技术,以及今后的发展趋势。第四章是本文的重点之一,在对彩铃平台中各项数据进行了统计分析后,研究了在彩铃平台中应用搜索引擎技术的可行性,并提出了目标系统所应具备的能力,随后对各种不同搜索方式的搜索流程进行了设计,在全面分析了系统功能后,提出了一套较详细的系统框架设计方案,并定义了与外部功能实体间的交互协议。在第五章中,重点说明了彩铃智能搜索中所用到的分词、模糊匹配、权值算法等关键技术;其中SKM算法是针对彩铃平台的数据特点开发出的模糊匹配算法,在本章中做了详细论述;本章第三节则重点讨论了在搜索结果排序过程中所使用的一套独特的权值算法,对单字、关键词、铃音等对象的权重计算方法做了详细的阐述。第六章则利用现有测试数据对算法的效率与已知算法进行比较,并对算法性能做了详细讨论。
其他文献
材料(资料或对象)与方法让读者在同等条件下可重复出该结果,是科技论文的重要特征。其撰写应注意以下几个方面:①紧扣主题;②科学、真实;③典型、新颖;④符合伦理学原则。材
随着网络的普及和飞速发展,网络资源已经成为一个普遍全球的信息宝库,使得人类全部的信息资源以前所未有的方式和程度在全球内互相连通,它作为一个开放的分布式的信息空间,网络中
学位
海洋平台作为海上石油开采和相关工作人员生产生活的场所,对开采作业顺利进行,确保工作人员的人身安全起着关键作用。海洋平台是大型的海洋工程结构,所处的环境极其复杂,对海
物流产业是现代社会化大生产和专业化分工不断加深的产物,随着我国经济的增长和服务业的快速发展,物流行业不仅影响着社会的发展和人民生活水平的提高,而且也是衡量一个国家现代
构造了高阶loop代数A2的一个特殊子代数,由此建立了一个3×3等谱问题,利用屠格式得到了一族Liouville意义下的可积Hamilton方程.通过建立双对称约束,得到了该方程族的两组约
统计分析软件用于对已有业务数据的分析,可以发现数据中隐藏的内在联系和潜在规律,可以有效支持各个行业的业务分析,给予决策者以有效的帮助。一般的统计软件把数据存储、数
目的 研究老年心肌梗死患者通过人性化护理的应用效果观察.方法 将我院收治的140例老年心肌梗死患者作为研究对象,将患者分对照组70例和观察组70例.对照组对患者进行常规护理
数据网格提供了一个高性能、大容量、高速传输的并行分布式广域计算平台,解决了分布异构的广域网环境下大规模海量数据的一体化存储和管理问题。为了有效降低数据访问延迟、
图像匹配算法的目标是寻找图像之间的同质区域,进而根据同质区域的映射,建立图像之间的空间对应关系。图像匹配是计算机视觉领域中的一个关键问题,也是三维重建、目标跟踪、目标
网络业务的快速增长对互联网服务质量提出更高的要求,而作为业务交换节点成为制约网络性能的“瓶颈”。由于互联网络复杂的动态特性可以通过网络所承载的流量来反映,同时网络