基于web数据挖掘的企业竞争情报系统设计与实现

被引量 : 0次 | 上传用户:wxf19860413
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联信息的多元化,互联网上海量的信息源能提供丰富的情报信息来源,因此互联网上的开源情报越来越受到情报工作人员的重视。本文通过互联网开源情报搜集技术和情报分析理论的研究,旨在构建集情报采集、情报分析、情报服务于一体的企业竞争性情报系统。本文系统地阐述了企业竞争情报的理论,提出了基于Web开源数据挖掘的企业竞争情报系统体系构架,将企业竞争性情报系统划分为情报搜集子系统、情报分析子系统和情报服务子系统。然后本文对各个子系统的设计和实施中所涉及的关键技术进行了探究。在情报搜集子系统中采用了主题的网络聚焦爬虫和元搜索数据采集技术保证数据采集主题的相关性,构建网络爬虫器对Web数据进行自动采集和下载,通过网页正文抽取技术、PDF与Office文档文本转换技术对下载的半结构化数据进行结构化处理,并对结构化数据采用“I-Match”算法进行文本查重,将数据全文索引后保存,构建起企业竞争性情报系统的情报自动采集和数据处理平台。在情报分析子系统中,采用中文文本信息处理与挖掘相关的技术和方法对搜集的结构化数据进行了情报分类分析,分析结果构建起企业竞争情报的产品体系。基于Web开源数据构建的企业竞争性情报系统,能使企业充分开发和有效利用互联网这个海量信息仓库,并从中挖掘竞争性的价值情报,对于构建企业竞争战略、提高企业核心竞争力具有十分重要的意义。
其他文献
钻井工程中,恶性漏失严重影响勘探开发的进程,恶性漏失堵漏技术是油气钻井技术的“瓶颈”之一,是急需解决的技术难题。目前恶性漏失堵漏仍然主要是依靠经验和多次重复(十几次
随着我国经济的稳步快速发展和城市化的进行,我国的城市建设面临越来越严重的土地压力。同时在我国的农村地区也出现了空心村现象,这种现象导致我国的农村地区建设用地依然占用很大的比例。我国城市发展建设用地和农村地区建设用地增减挂钩政策和“乡村振兴”战略的实施,使得我国农村地区成为城市建设用地的重要来源。由于我国的农村居民点分布散乱没有经过统一的科学规划,缺乏足够的基础设施,农村居民点布局优化有了重要的现实
我国金属导体生产历经六十年巨变,出现了引以为荣的15项重大进步和技术创新。
作为Web2.0社会性网络软件的重要特征,交互是进行网络学习的重要保障,是实现在线交流对话、共享的重要途径。交互的结构和深度直接影响到学习者在线知识建构的质量,影响到教
冯梦龙之“三言”和凌濛初之“二拍”都和江南有着极深的渊源,200篇中有三分之二的篇数涉及江南地域。江南文化的浸润使冯梦龙和凌濛初自觉或不自觉在创作时带上浓郁的地域文
随着集装箱船大型化的日益发展,其舵效差,反应迟钝,较差的制动性也给驾驶员带来了不小的难题,本文试从大型船的特点入手,结合实际操作的经验和体会,从沿海航行、抛锚作业、靠
<正> 汽车凸轮轴配件在我们验收产品和办理质量三包中,除汽198—63和 NJ25—75部颁标准中规定的一般几何尺寸精度,都可以用普通量具和在有连动分度刻盘的偏摆仪上予以测试外,
实践教学环节是实现高职教育培养目标的重要组成部分,也是培养社会需求人才不可或缺的一步。本文论述了高职院校进行工学结合的重要性,结合商务英语、旅游英语专业的实践教学
论述了目前国内外环保型电线电缆材料的研究、制造和应用,以及相关标准制定和采用的现状,提出了《十一五》期间我国对环保型电线电缆材料研究和生产应着手的几项工作,并对电
汉语与日语是截然不同的两种语言,有着各自不同的表达方式。此外,汉日语言中还存在着词汇涵盖范围不对应的现象,本文就汉语中的特殊表达方式"一+量词"的翻译以及词汇含义不对