【摘 要】
:
垂直搜索引擎技术逐渐在用户生活中占有举足轻重的地位,用户对搜索行业信息的需求逐渐细化,而支持企业信息的垂直搜索引擎并没有得到完善。通过对企业信息搜索引擎的需求分析
论文部分内容阅读
垂直搜索引擎技术逐渐在用户生活中占有举足轻重的地位,用户对搜索行业信息的需求逐渐细化,而支持企业信息的垂直搜索引擎并没有得到完善。通过对企业信息搜索引擎的需求分析、系统设计并对其中关键技术的研究,建立了一个企业信息搜索引擎,为用户提供与企业信息相关的信息搜索服务。1.对基于隐马尔可夫模型(HMM)的Web信息抽取进行了系统的研究。建立了企业信息的隐马尔可夫模型,利用隐马尔可夫模型的主要算法来解决模型的训练及解码问题,进而对信息进行抽取。对已形成的模型参数进行优化,再次进行信息抽取。实验结果表明优化后的隐马尔可夫模型进行抽取的效果更好。2.对于企业信息搜索引擎的中文分词技术进行了研究。基于正向最大匹配分词算法,对中文分词的词典机制进行优化,设计了双字双层和独立长词表的词典机制,在占用空间与查询时间及词典维护三方面与其它词典机制进行比较评价,并根据此机制建立了企业信息专业词典,应用于企业信息搜索引擎。3.在开源架构的基础上,利用文中研究的信息抽取及中文分词部分利用所研究的两个关键技术进行改造,建立了企业信息搜索引擎。实验表明改进后的企业信息搜索引擎能更好地满足用户对企业信息搜索服务的需求。
其他文献
人脸检测是计算机视觉与模式识别领域非常活跃的研究课题,在视频监控、人机交互、图像检索、视频会议、身份验证、虚拟现实等很多方面都有着广泛的应用。随着智能计算技术发
植物抗性基因的研究是目前生物信息学领域重要课题之一。自发现第一个抗性基因至今,已有70余条抗性基因经过生物实验验证,并逐步应用于分子育种、转基因等方面的研究中。越来
基于模拟仿真技术的自适应优化算法,在保证数据库正常工作的同时,收集数据缓冲区工作特征数据,制定并实施优化方案。从而避免传统人工优化方式带来的一系列问题。同时,数据缓
随着计算机图形学的不断发展,以及电影、游戏领域对计算机模拟的需求不断增加,对于自然景物的模拟已经成为了研究热点之一。在自然景物中,树木是其中的一类重要组成部分。如
如何合理高效地组织图像数据、结合图像特征,将人工智能及知识发现等技术合理地运用于图像分类中,是当今计算机视觉研究领域的一个热点问题。自组织特征映射神经网络(SOFM, S
近年来,国内外第三代移动通信(3G)技术发展非常迅速,随着我国3G牌照的正式发放,三个3G系统先后投入使用。TD-SCDMA(Time Division-SynchronousCode Division Multiple Access)作为我
缓存技术是提高响应速度、处理效率及系统性能的关键性技术,在分布式全文检索过程中,具有重要的应用价值。研究分布式全文检索中的缓存技术,具有很高的理论价值和应用基础。
当前的IP网存在体系结构无序、网络行为不确定、可管理性差、无法保证QoS等种种痼疾,根本原因还在于体系结构设计存在缺陷。这些缺陷导致网络的可知和可管理性较差,网络的可
随着社会的发展,人们对于身份认证的要求越来越高,传统的身份认证方式已经不能满足人们对于身份认证安全性和可靠性的要求,基于生物识别的身份认证技术越来越广泛地应用于人
随着Internet的迅速发展,网络的规模也随之变大,结构也越来越复杂,所以对大规模的网络进行研究已成为网络研究的必然。由于网络模拟成本比较低,易于使用等优点,所以网络模拟