基于Web的竞争信息抽取研究

来源 :湖北工业大学 | 被引量 : 1次 | 上传用户:hsu_mike
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪的社会正随着互联网和个人计算机迅速发展,得益于此,互联网上流通的信息也在不断地增长,并已经成为当今人类工作和生活中紧密联系的一部分。与此同时,由于万维网是一个虚拟的“自由平台”,所以舆论自由使得互联网上的信息迅猛增长。基于Web的开发和应用也越来越频繁。这与不断发展的网络相得益彰。然而随着网络信息的不断丰富,如何从浩瀚如海的网络信息中获取我们需要的信息成为一个大家都很关心的课题。随后,各式各样的搜索引擎浮出了市面。它们向用户提供了简易方便的检索服务。人们可以从中检索中查询到自己需要的信息。然后随着用户对信息准确度需求的不断提高。如何能够保证查准率的前提下,又能够提高查询的效率和查全率成了现有检索系统的一个难题。这种高效的检索对于用户来说具有重大的意义。基于Web的关于实体信息抽取研究正是解决如何在海量Web信息中找到用户需要的实体信息的一项技术。本文着重研究了实体关系的抽取。鉴于现代社会的迅速发展带来了无处不在的竞争。作者将重点更加细致的定位于同类型实体信息的抽取(即竞争信息的抽取)。丰富网络资源使竞争信息挖掘成了可能。目前看来,无论是对商家制定策略或是研究学者钻研某一课题,同类实体信息的挖掘都显的十分重要。然后现有的搜索引擎并没有这样的功能,用户需要对查询出的每个结果页面进行理解和阅读。消耗了大量的时间,而且达到效果不能令人满意。作者在这样的背景下,提出了一种以输入实体信息为前提的查询其竞争详细信息的算法CoSorter.它可以运用一些特定的语法结构,抽取到不同实体信息之间的关系。本文的任务是从网页中自动抽取给定实体的竞争者名字,经验证分析正确可行,并具有一定应用价值。使得之前的抽取工作变得非常有意义。
其他文献
随着网络的发展,为了能够有效地组织和分析海量的网页信息,人们希望能够对网页实现自动分类。因此,网页分类技术便成了快速且有效地组织网络上海量信息的一项重要技术。在众
信息化系统能给应用的业务领域带来巨大的变革,但是随着业务领域行业的功能细化与服务全面化,伴之而来的是给相关业务领域的信息化系统开发带来了巨大的挑战,即要求系统开发人员
随着实时监控系统数据流、网络应用中的网页记录和点击流等动态的应用环境中,不断产生海量的、时序的、实时变化和潜在无限的数据流,对数据流的挖掘已经成为数据挖掘的研究热
优化问题作为生活和生产系统中最为常见的问题,进一步提升优化技术的求解效率具有十分显著的理论和现实意义。传统基于梯度的优化方法具有理论完备、算法效率高、计算结果稳
人类主要通过视听觉感知系统来获取外界环境信息以认识世界,随着神经生理学和认知心理学的发展,人类对自身感知系统的了解逐步深入,如何模拟视听觉的注意机制,并将其应用到对运动
为了能够满足业务变化频繁的实际需求,提高开发效率,节约开发维护成本,论文将面向服务的架构引入到网络评审系统的开发中。利用面向服务架构,可大大提高系统的可复用性,保持
随着网络的广泛应用,特别是政府信息和军事数据在网络上的传输,给网络安全提出了更高的要求。当前网络攻击方法层出不穷,入侵手段更是不断更新,使得网络安全问题日益突出。如何使
Internet的快速发展不仅为组播的应用提供了良好的环境,还提供了许多机会,但同时也对组播的安全和性能提出了更多的要求。目前,已经提出了许多可靠组播协议,但大多是针对不同
面对日趋激烈的全球化市场竞争与社会化信息程度的不断提高,企业要想获得长足的发展,就必须拥有自身可靠的业务核心系统。核心系统关系到企业的生死存亡,如何在定制与实现核
商务复杂系统的建模仿真近些年得到了广泛的关注,国内外的众多公司企业、科研机构都投入了很大的精力。本文针对供应链的库存时间序列,采用的定性建模与仿真方法与以往的研究方