基于集成SVM数据流分类算法的公司微博金融事件检测方法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:xyw6623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
先前事件检测算法需要大量训练样本并且不能动态检测事件。为了从微博短文本中检测金融事件,提出一种从微博中检测公司金融事件的新模型。结合词嵌入与数据流集成分类算法,词嵌入和触发词典用于中文微博文本表示。带有动态时间窗的集成数据流分类算法(DSESVM)用于在线事件分类,大大减少了训练数据并动态检测事件。使用五家上市公司的微博文本作为语料库进行测试,实验结果表明,该方法不仅降低了训练样本的比例,还检测了概念漂移,可以有效提高微博中公司金融事件检测的准确性,相对于已有方法,其平均F1值提升5.6~7.2百分点。
其他文献
在蜂窝网络覆盖下的D2D通信场景中,D2D对的距离并不是一个确定的值。为了解决D2D用户由于距离过大不能建立直接通信链路的问题,提出一种协作传输CRNG方案。使用蜂窝用户作为D2D对的信息中继,解码并转发D2D用户的信号。该方案在保证中继蜂窝用户的通信质量基础上提升了D2D对的吞吐量。仿真结果表明,CRNG传输方案能够提高D2D用户的数据速率及D2D对的接入率,改善蜂窝系统的服务性能。
针对预制构件生产线中模台利用率低的问题,提出一种改进的类电磁算法与改进的BL定位算法相结合的方法来求解该问题。建立模具在模台上组合分配问题的数学模型。通过改进的类电磁算法优化预制构件投产上线顺序,进而决定对应模具的摆放顺序。由于标准的类电磁算法易陷入局部极值,改进算法加入模拟退火算法的思想来提高算法跃出局部极值的能力,扩大算法的寻优范围。提出一种改进的BL定位算法(Bottom-Left Plac
网络嵌入旨在综合利用网络特性来学习节点的低维向量。然而,传统的网络嵌入方法不能全面考虑外部信息,通常只关注一种属性而忽略其他属性,或者分别学习不同属性的表示。对此提出一种基于多头注意力机制的半监督卷积网络嵌入模型(SMAC)。利用近年来在自然语言处理中广泛应用的多头注意机制与多层图卷积神经网络,将外部信息与结构信息以半监督的方式结合起来,在一个统一的框架中联合优化。通过在真实数据上的对比实验,验证
针对知识图谱(KG)在知识驱动的人工智能研究中发挥的强大支撑作用,分析并总结了现有知识图谱和知识超图技术。首先,从知识图谱的定义与发展历程出发,介绍了知识图谱的分类和架构;其次,对现有的知识表示与存储方式进行了阐述;然后,基于知识图谱的构建流程,分析了各类知识图谱构建技术的研究现状。特别是针对知识图谱中的知识推理这一重要环节,分析了基于逻辑规则、嵌入表示和神经网络的三类典型的知识推理方法。此外,以
基于嵌入式系统设计课程知识点多、硬件型号繁多、结构差异、软件与硬件结合紧密的特点,分析理论教学与实践教学中的问题、主动学习与被动学习的关系,提出半翻转课堂、立体化
目前区间值信息系统的不确定性度量方法大多基于粗糙集的粗糙度度量。实例分析表明该度量方法不满足严格单调性,为了解决这一缺陷,将粒计算方法引入区间值信息系统中,提出一种区间值信息系统的信息粒化模型。引入区间值信息系统的知识粒度和粗糙熵两种度量方法,理论分析出它们具有的严格单调性,在区间值信息系统的不确定性度量方面具有更好的优越性。实验验证了知识粒度和粗糙熵均比传统的粗糙度具有更好的不确定性度量效果。
地理信息系统是由采集、储存、管理、分析、描述和应用于一体的一种重要手段,主要用于获取全部或部分地球表面地理空间分布的数据信息,属于当今最先进的计算机软件系统,在城
轨迹推荐在轨迹数据挖掘中尤为重要,可以帮助用户从大量轨迹数据中快速找到满足用户需求的路线。现有的轨迹推荐方法通常是在原始轨迹数据上考虑特定代价标准最优的前提下返回出行路线,无法体现不同用户的不同行为习惯。针对此问题,将用户前后连贯的活动刻画为行为,提出基于矩阵分解的用户行为概率学习方法。基于学习的用户行为概率,将寻找概率最大路线问题转换为在行为图中寻找最短路径的问题。在真实数据集进行一系列实验,验
针对大数据技术课程教学存在的典型问题,基于OBE理念提出教学目标和评价方案,并以学生问卷调查入手,从平台层、数据层、预处理层、模型算法层、应用层及数据可视化分析层介绍大数据技术实践架构的创新设计,全面阐述课程的3个实验项目设计内容与要求,并给出线上实验指导与评价方法。在综合设计方面提出全面参与竞赛的项目策划,分别以全国大数据应用创新竞赛和“手写数字识别”项目为例,说明竞赛项目的良好效果。
为了改善云平台中多工作流调度时的执行代价和资源利用率,提出一种满足实时云任务需求的主动响应式工作流调度算法。该算法可以分别针对新工作流的到达、任务完成后的虚拟机资源提供、紧迫任务到达等做出主动的实时响应调度策略,从而充分利用虚拟机资源的空闲时槽和更大化的任务并行程度,以混合形式调度来自不同工作流的任务。在确保截止期限约束的同时,有效满足实时云任务的调度需求。大量实时工作流的仿真测试表明,与另外几种