基于互联网文本的P2P平台风险预测研究与实现

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:feihuaxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,金融业借助互联网发展出新的商业模式—P2P借贷。P2P借贷是互联网金融的一种,它为中小型企业融资借贷提供便利的同时,也为个人投资提供了新的渠道。P2P平台是指经营P2P借贷业务的网贷平台。当P2P平台出现支付困难或偿还能力恶化、企业高级管理层出现贪墨事件或携款潜逃等问题而未得到及时的治理和监管时,就会产生金融风险,从而可能引发金融突发事件。本文基于互联网文本数据研究与实现了P2P平台风险预测。首先,本文通过爬虫技术从P2P第三方资讯平台获取P2P平台信息和P2P平台评论文本,依靠人工标注的方法构建P2P领域的情感分类数据集和序列标注数据集。其次,本文利用TextCNN 模型对评论文本做情感分类,得出情感倾向变化的时间序列,达到度量投资者情感变化趋势的目的;通过格兰杰因果检验和皮尔逊相关系数验证投资者情感时间序列和成交量指数之间的关系,实验证明了情感变化趋势与成交量指数有统计意义上的因果关系和强相关性;基于以上的研究,本文提出了基于投资者情感变化的P2P成交量预测方法,发现情感特征在P2P成交量预测中起到显著作用。然后,本文提出了改进的序列标注模型ELMo-BiLSTM-CNN-CRF(EBCC)和P2P平台风险预测模型。本文发现投资者每月负情感倾向的变化趋势与每月的问题平台数量呈正相关,而投资者的情感体现在其对P2P平台的评价中,因此利用EBCC模型提取投资者评论中的关键信息--这些信息蕴含着投资者对P2P平台的真实看法。本文使用评论的文本特征和数据特征训练P2P平台风险预测模型,为阻止金融突发事件提供一种可借鉴的方法。最后论文对数据的采集,数据处理及模型的具体实现进行了详细论述。
其他文献
链霉亲和素/生物素(Streptavidin/Biotin)体系作为目前已知的最高亲和力作用体系,已在生物学研究中获得广泛应用。本文针对Streptavidin/Biotin和Strep-Tactin/Strep-tag两个
<正>《旅游论坛》编辑部原采编系统http://glbjb.cn(注册域名:桂林旅游高等专科学校学报)已于2018年12月月20日起停止接收投稿功能,目前该系统保留2018年12月20日前投稿的审
帕唑帕尼是一种多靶点酪氨酸激酶抑制剂,研究发现帕唑帕尼主要用于治疗肾细胞癌、卵巢癌、乳腺癌和肺癌等疾病,并可能导致腹泻、高血压、头发褪色、恶心和厌食等不良反应。
本文以马克思主义为指导,论述因果关系问题,并从理论与实际的结合上回答某些否定“原因是必要的条件”这一唯物主义观点的说法,辨正析误,阐明其正确涵义。
本文根据咸阳话重要的语音特征,认为咸阳话属官话方言中原官话区关中片与秦陇片的过渡带方言,其内部差异则主要表现在内部区域差异和新老派差异两个方面。
在占据主导地位的理性选择分析框架中,情绪作为一种心理变量与因素的作用往往受到忽视。由此,本文试图回答情绪在国际政治世界中具有什么样的作用,亦即情绪分析的路径,以及情
构境论为中国哲学研究界近来新显现出来的一种原创性思想。历史是人类社会存在及其存在方式的结构性延伸,人类社会历史本身就是一种过程性的生活构境进程。一定的社会历史物
本文通过完成1/5万广东西南部沿海遥感图像地貌解译图,提取了地貌单元的影像特征,并指出其地质意义。
法国1912年的法律创建了现代少年司法制度,未成年人刑法与成年人刑法截然区分。法国的未成年人司法制度经历了从保护模式向混合模式的变化。该发展历程带来对"保护和惩罚的平
成语是汉语中特殊的语言格式之一,生动形象,言简意赅,具有很强的表现力。这种语言格式四字型居多,五字以上的也有一定数量,有关辞书在搜集和注释方面做了大量工作。但是三字