基于异构数据的用户投资分析方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zhangsanjun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
尽管中国证券市场不断发展,投资者热情不断增加,但是很多个体投资者无法对自己的投资作出系统分析。收益率计算是用户投资分析的重要基础,目前传统收益率计算方法在用户复杂投资场景下存在着收益率跳变、收益与收益率正负不一致等问题。传统的用户投资分析方法提供的维度较少且结果不够直观。另外随着互联网信息平台的迅速崛起,金融新闻在快速增加。新闻中的金融事件可以让用户了解自己投资盈亏波动中的事件因素,从而认识证券市场内部规律和提高投资水平。基于此,本文主要研究如何利用证券指数行情、股票行业信息等结构化数据和金融新闻文本非结构化数据组成的异构数据,对用户投资进行分析,研究内容包括以下几个方面:基于结构化数据的用户投资量化评价分析方法研究。为解决复杂投资场景下的收益率计算问题,本文提出基于SEA网格的时间成本双加权收益率计算方法,通过和传统方法对比,验证了其有效性。提出了基于结构化数据的用户投资量化评价分析方法,设计了盈利能力、择时能力等六个维度指标的计算方法,对用户投资进行多维度分析,并实现了用户投资量化分析平台。基于新闻文本数据的金融事件抽取方法研究。为利用金融新闻文本中的事件信息来分析用户投资的盈亏波动情况,本文展开事件抽取方法的研究。考虑到现有方法大多基于有触发词标注的语料,而标注触发词比较耗费精力,因此本文研究无需触发词标注的一种基于多层指针解码网络的事件类型和事件主体联合抽取方法。通过设计标签注意力增强网络将事件类型信息融入词向量,获得性能提升。为解决传统指针解码网络解码多个事件主体时的匹配错位问题,本文加入头尾指针匹配预测,提高解码的准确性。引入对抗训练方法,进一步提升模型性能。实验结果显示,本文提出方法的性能超过了其它对比方法,加权F1值达到了92.11%。使用该方法从新闻文本中抽取出21615条金融事件数据,为后续事件维度分析打下坚实基础。结合结构化数据和金融事件数据的用户投资事件维度分析方法研究。为量化金融事件对股价的影响,本文引入事件研究法分析事件的影响,并设计权重因子量化影响程度。设计对用户投资进行事件维度分析的方法,提出了可信度指标来评估分析结果。实验表明通过结合事件数据,能有效提供用户投资盈亏波动中的事件因素,帮助用户更好分析自己的投资。
其他文献
我国金融市场经过三十多年的飞速发展,制度日趋完善,市场交易也变得越来越活跃。随着人工智能技术在金融市场得到越来越多的应用,如何通过自动投资方法替代人工从金融市场盈利逐渐备受关注。自动投资方法以量化引擎为基础,在感知量化数据上执行不同的投资策略。自动投资引擎是自动投资方法研究的必要工具。但常见量化投资引擎具有商业化、非开源、自由度低、局限性大等特点,难以为面向中国股市的自动投资研究服务。针对上述问题
快速城镇化时代新建住区的设计建造往往会因为忽视“以人为本”而导致公共空间存在许多问题,而飞速的社会经济发展同时又使得住区居民的生活和活动方式产生了巨大的变化。因此,住区公共空间内的活动不断减少,住区失去了其应该具备的活力。目前对空间活力这类问题的传统研究主要是通过自上而下的方法,根据现场实地调研或大数据统计,对空间活力进行建模量化并计算评价,并以此提出相应的活力优化策略。相比于传统的建模方法,本研
当前,我国已全面进入老龄化社会,老年人的社会交往行为及生活交往空间的环境质量越来越受到关注。对于老年人来说,社会职能的淡出会削弱一部分社会关系,缩小社会网络的规模,甚至被孤立导致社会隔离,从而可能引发诸多心理、生理问题。因而,促进积极社交活动,提高与扩大老年人的社交网络对提升老年人的生活质量有非常重要的意义。同时,受到行动能力的限制,老年人主要的社交活动围绕着其所在生活空间展开的比较多,对社区的建
自西地那非在临床观察中被偶然发现非原始目标适应症开始,药物开发渐渐衍生出一个新的领域——药物重定位。该领域致力于为药物寻找新的疾病适应症,让老药“焕发新生”,让未成功上市药物“变废为宝”。由于关注的药物均已经过一定的毒副作用临床验证,对比药物研发,药物重定位极大地降低了经济成本和上市时间,近年来越来越受到各界的探讨与研究。为了更好地学习异构网络中高度非线性特征和适应多源数据的模型延展性,本文选用图
随着消费趋势和竞争格局的不断变化,便利店的终端模式创新、商品组合方式、业务延伸途径、数字化程度、供应链管理的创新以及便利店的拓展等都有待革新,便利商店逐渐向智能化、网络化的方向发展。目前,一般商店都会有售货员或者收银员,通过售货员或者收银员来结算用户购买的商品。然而,当购买商品的用户数量较多时,往往都需要排队,以至于用需要花费较长的时间结账,此外,还需提供售货员或者收银员的人工成本。现有的无人商店
旅游景点的吸引力评估可以对旅游业发达的城市提供建议。一个交通便利、旅游资源丰富的旅游城市能够极大地提升对于游客的吸引力,提升城市收入。因此对于一个以旅游业为主的城市,如何发展旅游产业,合理配置资源对于城市的发展具有重大的意义。而在现阶段,游客的规模和旅游目的地对城市规划者来说仍然很难获取。传统的调查问卷形式成本相对较高,且回收困难。而现有的旅游景点吸引力评估并没有考虑到交通可达性的问题,且考虑的影
追求产品的卓越是企业一直努力想要达成的目标,而产品从设计到量产,并不是一下就能做到最好,所以持续改进是企业的一个必要手段,是企业保持产品竞争力的一个重要措施。文章通过对国内外文献资料进行分析研究,发现PDCA在各个行业的不同领域均取得良好的应用效果。在工业领域,应用PDCA可以提升产品的良率,提高生产效率,改进工艺制程;在教育领域,应用PDCA可以提升教学质量,改进教学管理;在医学领域,应用PDC
小城镇居住街区能耗不仅与建筑单体相关,与群体形态也密切相关。建筑能耗在城镇总能耗占有较大比例,住宅建筑是城镇数量最大的建筑类别,因此,降低住宅建筑能耗可有效降低城镇总能耗。为探讨夏热冬冷地区小城镇居住街区空间形态对街区建筑能耗的影响,文章以浙江省小城镇为例,从该地区小城镇居住街区样本的类型、规模、规划形态和住宅建筑类型四个方面分析浙江省小城镇居住街区空间形态特征,提取出典型居住街区空间形态类型,对
在知识经济时代下,知识资源是各企业形成可持续竞争优势的关键,企业的知识管理水平对企业的生存乃至发展都至关重要。随着时代的快速发展和业主品质需求的提升,工程项目的规模和复杂度也随之增大。目前我国建筑企业并未针对不同建设主体、不同项目阶段开展全面的知识管理实践,缺乏行之有效的知识管理机制,项目各阶段的隐性知识未能得到及时地挖掘与存储就随着项目结束和团队解散而流失,建筑企业的知识整合能力有待提升。鉴于此
连续几年来制造行业客户需求定制化程度日益增大,产品更新迭代速度加快,生存周期越来越短,产品结构越来越复杂,涉及到多个学科和领域,企业在自主设计研发过程以及技术革新活动中产生了相当数量级的项目管理信息,研发团队越来越庞大,原来的项目管理模式已经不适应企业发展的需要,迫切需要流程再造和信息化系统升级来进行综合管理,来提升新产品项目、技术创新项目的研发攻关效率、质量和信息管理能力。本论文采用项目状态梳理