基于时序关系的金融领域热点话题检测

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:tanglang1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网在人们的日常生活中扮演着越来越重要的角色,每天都会有纷繁复杂的新闻事件以各种各样的形式发布到互联网上。相对于以前传统的报刊杂志,在信息爆炸的当今时代,快节奏的生活中大多数人已经习惯了选择互联网作为信息获取的主要来源。各种各样的网络信息往往让我们应接不暇。然而大多数人更多的是关注自己感兴趣的某一领域内的新闻事件,比如体育、科技、财经等领域的热点话题。如今网络上的信息大多是采用传统的新闻网页形式发布,当用户对某一事件没有进行持续关注时,他们往往只能借助搜索引擎等工具去搜索前段时间发布的相关历史事件。因此,对同一话题相关事件进行整理,并以时序顺序呈现给用户的方式往往更有实际意义。为此,本文针对金融领域各上市公司的新闻事件的时序关系进行研究,旨在建立一个新闻事件时序关系自动分析系统,能准确对历史事件进行分类,并对新事件进行追踪报道。本文的主要研究内容包括有股票新闻的获取和分类、个股新闻话题的提取、话题关键词的提取以及新话题的发现和追踪。首先针对本课题的需要对沪深两市的各上市公司的新闻进行定时爬取,并进行预处理及个股分类,然后利用文本挖掘的相关方法从金融新闻文本集中提取相关热点话题,并通过分析新闻话题中每个具体事件,给出一个对该话题的关键词描述,最终在现有事件分类的基础上,每天对当天发生的新闻进行准确的话题分类。本文以从各大金融网站采集到的实时股票新闻文本为基础,建立了一个对金融领域上市公司热点新闻进行话题检测与追踪的在线系统,并利用和讯、金融界和新浪财经网站的从2012年1月1日至2012年8月的上市公司热点新闻作为本系统的测试语料来进行实验。最终实验结果表明,本文提出的算法模型基本满足在线应用系统的要求。
其他文献
基于P2P(Peer-to-Peer)技术的网络应用是Internet最重要的应用之一。P2P网络以其文件共享和“去中心化”等特点不断引起人们的广泛关注。然而,由于P2P网络规模大、结点动态性
无线传感器网络是由大量资源受限的传感器节点组成,主要用于检测信息的目的,一般传感器节点的运算性能和存储空间大小都受限。随着科技水平的不断提升,无线传感器网络的相关
无线传感器网络(Wireless Sensor Networks, WSN)是一种在监测区域大规模的部署传感器节点,由传感器节点自组织形成的动态网络。这种全新的技术综合了无线通信,嵌入式计算及
近年来,无线传感器网络已经被应用在许多领域并成为一种重要的计算平台。无线传感器网络是由成百上千的传感器节点和-些基站组成。传感器节点可以被分成几个不相交的簇集合。
近年来,随着计算机技术与控制理论的飞速发展,移动机器人的发展受到了国内外广泛的关注。作为一种集环境识别、路径规划与运动控制为一体的高智能系统,它具有重要的科研价值
随着计算机和互联网技术的快速发展,各种计算机软、硬件系统已广泛渗透到人类生产和生活中,然而如何保证计算机系统严格按照人类设计的方式工作已成为当前计算机相关研究课题之
博客,是一种通常由个人管理、不定期张贴新的文章的网站。随着博客的快速发展,博客作为一个重要的信息源的价值也在增加。在自然语言处理方面和其他方面存在着大量的对博客的
伴随互联网技术的迅猛进步,社会步入了大数据时代。人类日常生活中产生了大量的数据。未来,无论是在哪个领域,越来越多的决策将依赖于数据分析。如何合理高效地分析大量数据,
车牌是交通场景图像中十分重要的目标类,是交通领域智能视频分析的核心对象之一。良好图像质量的车牌检测与识别,已经有了较为成熟的实用算法;但针对各种复杂背景或松视角约
网络性能代表了网络基础设施向上层应用提供的服务质量,其对于运营商、用户以及应用都具有重要意义。网络性能测量可以为网络运营商提供网络性能监控的基础,为流量工程提供评测