深度搜索到底有多“深”

来源 :电脑爱好者 | 被引量 : 0次 | 上传用户:wekey
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  普通搜索的一般流程
  在了解深度搜索之前,我们先来了解一下什么是搜索。搜索过程简单理解就是用户键入搜索关键字,然后搜索服务器返回符合关键字要求的结果,这样一个交互过程。提供搜索服务的主体如百度、谷歌服务器,或者系统自带的搜索服务,它首先根据用户经常搜索的关键字对搜索资料建立索引,当用户键入的关键字符合索引要求时,就将数据库中所有符合要求的结果展示给用户选择(图1)。
  多方优化的深度搜索
  虽然搜索过程看似简单,但是在实际使用中服务器返回的搜索结果却经常不如人意。比如在实际使用中我们经常要进行组合搜索,比如要在文档库中搜索包含“A”或“B”关键字的文章,此时就要用到高级搜索语法。对于一般用户来说,高级搜索语法显得晦涩难懂,作为普通用户,他们更倾向于使用自然语言进行搜索。现在深度搜索即可解决这些传统搜索引擎遇到的难题。
  在结果中筛选的“分面搜索”
  经常在淘宝购物的朋友都会使用淘宝提供的搜索服务,比如我们想购买价格最低并且包邮的小米手机,一般就在搜索框直接输入“小米手机”,然后勾选价格从低到高排序和包邮,这里的“价格排序”和“包邮”选项就是过滤条件,这样可以更精确地得到我们需要的结果(图2)。
  在搜索术语中,淘宝提供的就叫分面搜索(Faceted Search),它可以实现更精准的搜索。深度搜索使用类似的分面搜索技术,但是那些过滤条件是内置在搜索引擎中的,而不是像淘宝那样显示放置在搜索页面中。深度搜索引擎具有卓越的检索词解析和自然语言理解能力,用户输入简单的搜索关键字,深度搜索则返回更接近用户需求的搜索结果。比如虽然直接输入的只是“小米手机”,但是返回的结果中默认会按价格排序,并且包含包邮选项。当然这些都是分析的结果,深度搜索服务器需要分析大量用户的搜索习惯,然后将最佳结果推送给用户。
  为搜索资料做深度索引
  资料的索引是搜索的基础,搜索服务器必须为被搜索的资料建立详细的索引。传统的搜索引擎建立的索引包含的信息不够丰富,比如通过传统搜索引擎搜索一场演唱会的信息,一般得到的搜索结果就是演唱会举办地、价格、参加明星等信息(图3)。
  不过对于深度搜索,它建立的索引信息就要复杂得多,除了上述信息外还要分析很多元素,比如乐队以前的演出内容是否和最新演唱会类似?人们是否喜欢以前的演出?乐队粉丝呈现什么样的人口分布?演唱会会场如何等。深度索引通过建立搜索资料详尽的索引信息来满足用户的搜索需求。当然具体包含哪些索引信息,需要搜索服务器根据用户的地理信息、人口特征、兴趣点信息和位置数据库,以及社交网络等进行分析和处理(图4)。
  这样用户只要在前台简单输入“XX演唱会”作为搜索关键字,其他关于该演唱会的丰富索引信息,会全部被纳入深度搜索服务器的后台运算当中,从而给用户返回一个丰富而适当的搜索结果,比传统搜索要精确得多。
  深度理解用户的搜索企图
  深度搜索引擎在前台只需要用户使用他们熟悉的自然语言进行搜索,这样后台服务器就需要有强大的自然语言学习能力,涉及到查询解析和自然语言理解技术。比如用户输入“哪一家餐厅适合Mike的结婚周年纪念日”作为关键字进行搜索。
  搜索引擎首先要理解用户搜索需求,比如上述例子,深度搜索要先解析出是“Mike结婚纪念日”+“餐厅”,解析出结果后,搜索引擎就需要在后台进行分析并推送检索结果。但是深度搜索并非像传统搜索那样,直接推送XX餐厅。它使用了深度查询,比如会分析谁在搜索(如从搜索关键字判断可能是Mike的朋友)?他们在哪(可以通过IP地址确定)?天气怎样?他们过去搜索了什么?他们的亲人朋友是谁等因素进行后台复杂的分析,然后向用户推送查询结果。
  比如深度搜索知道搜索者在北京,那么就不会将其他地方的餐厅推荐给用户。如果深度搜索数据库知道搜索者讨厌垃圾食品,就不会显示麦当劳的结果给他/她。此外,它还会搜索你的社交信息,比如一般朋友喜欢什么你可能也会跟着喜欢,这样将他们的偏好都考虑进来,通过深度查询,深度搜索就能将最精确的搜索结果推送给用户(图5)。
其他文献
JPEG图片无损转换  通常,将图片转换为JPEG格式,或者对JPEG格式的图片进行旋转变换时,都会有不同程度的图片精损失度。通过XnView的特殊旋转和转换功能,可以实现JPEG图片的无损转换或旋转。  先通过XnView官网http://www.xnview.com免费下载该软件。安装之后在任一图片文件夹上点右键,选择“用XnView浏览”即可管理和处理图片。在XnView浏览器窗口中选择要旋
期刊
【挑战题描述】  由于工作需要,我购买了一张天翼的手机上网卡,现在已经有3W多积分。虽然天翼积分商城可以用这些积分兑换实物,但是里面可以兑换的实物太少,而且收货地址还要和手机卡归属地一致(我的上网卡是淘宝购买,归属地在外省)。如何才能突破上述限制?(题号:20141304)  【解题思路】  默认情况下在天翼积分商城购买的商品收货地址要和手机卡归属地一致,不过这只是对实物商品的限制。在天翼积分商城
期刊
前几年购买的Android网络电视大多没有Wi-Fi功能,如果要配备无线网卡,我们就必须购买特定型号的专用无线网卡,这给老电视的Wi-Fi升级带来不便。其实现在的无线路由器都支持WDS无线扩展技术,我们可以利用无线路由器接收上一级的Wi-Fi,然后再借助网线就可以让老电视实现无线上网了。  这里我们以水星MW305R路由器设置为例。首先要确认主路由LAN口的IP地址,为了描述方便这里假设主路由为A
期刊
公司拥有专门机房的朋友可能会对那些设备当中暴力的高转速风扇印象很深,一般专用于机房的机箱风扇都有共同的特点:转速非常高、风量大、风压强,但是完全牺牲了静音属性。这种散热虽然可靠性很高,但不见得适合所有人的需求。比如在家中或办公室使用单独的文件服务器,距离我们生活工作的位置太近,如果使用这类暴力风扇无疑就是严重的噪音污染(图1)。  使用普通的散热风扇作为服务器散热是完全可以的,不过要对风扇精挑细选
期刊
【挑战题描述】  本地搜索工具一般分两大类:一类先建立索引数据库;另一类借助NTFS文件系统特有的USN日志进行搜索,不过它不能搜索文档内部,只适合文件名快速搜索。是否有不建立索引又能进行全文搜索的方法?  【解题思路】  基于文件名搜索已有很多工具,比如Everything、Quick Search等,不过文件名包含的信息较少,搜索难免不全面。而借助建立索引进行全文搜索的工具,能够对文件内容直接
期刊
打好基础 科学用键盘  键盘输入要依赖于每个基本键位,因此,对键位的熟悉和利用程度就从根本上决定了汉字的录入速度。那么,有什么好办法来提高对键位使用的熟练程度呢?秘诀有两条:一是方法科学,二是多加练习。  要练就高速打字的功夫,科学的方法很重要。双手的10个指头都要发挥作用,只有分工明确、各就其位、各行其职才能发挥最大的效能。  盲打键位定位是依靠食指在“F”和“J”键上的识别点进行区域划分,“F
期刊
【挑战题描述】  使用Windows 7系统下的IE浏览器直接下载文件时,会发现浏览器自作主张将某些下载文件直接删除了。我的下载我做主,怎么才能避免这种情况发生,并将删除的文件重新恢复?  【解题思路】  之所以出现这样的问题,主要是现在的Windows系统有一个名为SmartScreen筛选器的功能。在浏览器下载完文件后,它会对下载的文件进行检测,类似于杀毒软件的下载检测。所以要想解决这个问题就
期刊
如果送你一部智能手机,要求在几分钟之内开发出一款Android小游戏,你敢应战吗?其实在国外的教育中早就实现了,而且从幼儿园就开始这样培养孩子的计算机思维。  硬件准备  一台能上网的笔记本电脑或台式机,最好都带有Wi-Fi,以便将来生成的程序更易传送到手机中(图1)。否则,只能通过数据线下载安装,比较麻烦。对智能手机无特别要求,任何一部市面流行的普通Android智能手机足以符合开发要求。  软
期刊
理科老师 专业符号不用愁  中学代数老师常常会用到一些角度、集合、等式的专业符号,而物理、化学或生物老师又常常会遇到一些与容积、距离、压力等有关的物理量或单位符号。以前老师们总是要借助于Word的符号库、ASCII码表、输入法软键盘等进行录入。  其实,如果安装了QQ拼音输入法,利用该输入法提供的拼音符号输入器,可以很方便地输入各类数理化生单位符号。QQ拼音符号输入器开启后,不用像软键盘那样反复切
期刊
为驱动程序  植入自动指令  要给一台新买的笔记本重新安装更适合于自己的系统,需要安装一系列的驱动程序,而这些驱动程序最好能够按一定的先后顺序进行安装,因为若不按一定的顺序,可能会出现一些兼容性方面的问题。如何将下载的或驱动光盘中提供的驱动程序按一定的顺序进行自动化安装,这是需要我们研究的问题。  比如,有的电脑需要按先装芯片组驱动,再装显卡、声卡、网卡等驱动,最后安装随机软件的顺序进行安装。而有
期刊