基于语义分析的垂直搜索网络蜘蛛

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:aiqinghua5223
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通用搜索引擎数据量庞大,但查询结果不够准确。分类目录正好相反。为了综合两者优势,对垂直搜索引擎进行了研究和分析。着重研究了垂直搜索引擎的核心模块——智能网络搜索蜘蛛。提出了搜索分析的新概念——规则。研究了蜘蛛中定义支持同义词的语义词典的方法,给出了按照规则分析和检索的实现方法和流程。程序需要定义多种规则,让蜘蛛依照规则进行网页爬行和信息采集。最后给出一个项目实例,证明了上述方法的可行性。
其他文献
鲁西化工股份有限公司针对未来磷酸生产将普遍使用低品位磷矿的实际情况,积极探索低品位磷矿萃取工艺。通过采用将两套磷酸萃取槽串联使用的方法,大大提高了磷得率和磷酸产量,为
湖北省黄麦岭磷化工有限责任公司尾矿库在线监测系统日前通过专家组的验收,这标志着该尾矿库的安全监管水平再上新台阶。
本文除简介马复初所辑《指南要言》的基本内容外,探究马复初在摘录马注《清真指南》过程中,如何突出其行文主旨、简化内容、论证阐释、变换语词、揭示内涵,以及意译外来词等
本文对图书馆内部网络IP地址存在的问题进行分析,提出了采用代理服务器和路由器进行内部网IP地址分配和管理,较好的解决了IP地址资源匮乏和网络安全问题。
经过18个月的建设,国内首个大颗粒钾肥项目近日在青海盐湖工业集团公司建成并投产,填补了我国无大颗粒钾肥生产的空白。
经过半年多的反复实验,甘肃瓮福化工有限公司利用“三次浮选工艺”,在降低选矿尾矿含磷技术攻关上取得重大突破。日前,该公司选矿尾矿含磷平均指标控制到4%以下,同时磷精矿中氧化
分析了特征选择与特征抽取的特点与不足,针对Fisher线性鉴别准则存在问题,在一种加权散度差线性鉴别准则的基础上提出了一种基于散度差与SVD相结合的文本特征抽取方法。在解决了类内散布矩阵的奇异性问题困扰同时,通过对低阶矩阵的奇异值分解取代了对高阶矩阵的特征值求解,计算量大大减少。在最低限度减少信息损失的前提下实现了特征维数的大幅度减缩。试验结果表明,这种方法在文本分类上的准确性较好。
<正>从大数据和云技术相继在安防行业大展拳脚之际,视频结构化技术被得以重视,成为安防巨头企业争相展示的技术类别。从大数据和云技术相继在安防行业大展拳脚之际,视频结构
目前云南中低品位胶磷矿资源工业化开发迫在眉睫,云天化集团在破解这一世界性难题上迈出了坚实的第一步。该集团下属的一批磷复肥生产企业近两年积极探索中低品位磷矿资源综合
在必和必拓加紧收购加拿大钾肥公司之时,中海化学开始另辟蹊径寻找替代目标公司。目前中海油下属公司中海化学正与钾肥巨头白俄罗斯钾肥商谈收购事宜。此前加拿大钾肥公司曾与