互联网金融舆情监控系统

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:mdskct
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着互联网和互联网金融的快速发展,如何及时有效地对互联网金融企业或产品进行监管,对保障投资人权益、防范金融风险具有重要意义。当前的互联网金融舆情监管主要依靠的是基于人力的各类专项整治监管手段,然而互联网金融涉及业务广,经营方式复杂,传统的监管方式很难及时发现金融舆情并做出有效应对。互联网金融的持续发展在互联网上也催生了一系列关于金融企业或产品的新闻、评论等文本数据,这些文本数据有时效性高、隐含大众情绪、能披露金融舆情的特点,在大数据和自然语言处理技术快速发展的当下,利用人工智能技术对自然语言文本进行分析的方法日益成熟,对金融文本数据进行舆情分析能在一定程度上辅助金融舆情监管。因此,本文主要研究了一种互联网金融舆情分析算法,用于分析发现文本中隐含的金融舆情,并实现了一个互联网金融舆情监控系统,主要研究内容如下:1.为了挖掘金融文本的负面舆情信息,本文提出一种互联网金融舆情分析算法,它是一种流水线结构,分为金融文本实体识别、金融负面实体判别和负面金融实体关键词提取三个算法模型。在对金融文本实体识别方法的研究中,本文实验对比了多种不同编码器和解码器结合的命名实体识别模型,使用了准确率较高、泛化能力强的Fin BERT-CRF模型;在对金融负面实体判别方法的研究中,分别设计对比了多种神经网络模型,最终使用了能利用预训练知识的Fin BERT-Prompt模型,使判别F1分数达到了0.9421,达到了较好的判定效果;为了对金融舆情进行直观展示,本文使用了操作简便有效的无监督的Text Rank算法对负面金融实体进行关键词提取。2.针对预训练模型参数量大,直接使用工程资源消耗大的问题,本文对Fin BERT-CRF模型和Fin BERT-Prompt模型进行了知识蒸馏的实验研究,采用了基于知识加权蒸馏的方法对上述模型进行知识蒸馏,达到F1分数只下降千分位,减少近一半模型参数量的效果。3.本文基于上述互联网金融舆情分析算法,采用B/S架构,以Spring Boot为主要开发技术设计并实现了互联网金融舆情监控系统,帮助监管人员及时发现舆情、治理舆情。本文使用的数据来自微博、腾讯新闻等各大互联网平台的新闻、评论等文本,由国家互联网应急中心提供和打标。本文的核心算法曾在2019年中国计算机学会举办的金融信息负面及主体判定竞赛中获得一等奖,在1653支队伍中排名第一。本文在上述核心算法的基础上,结合了最新的Prompt-tuning研究进一步提升了效果,并进行了模型蒸馏的工程优化,实现了互联网金融舆情监控系统,旨在为金融监管人员和金融监管部门提供了及时、高效、精准的舆情监控和分析服务。
其他文献
期刊
为实现伽师县盐碱荒地的再利用,在取样及室内试验的基础上,通过建立数学模型开展区域盐碱荒地土壤盐渍化趋势预测。结果表明,伽师县荒地含盐量普遍高于耕地及草地;在相同条件下黏性土较砂壤土更易积盐;不采取治理措施的情况下,随着时间的推移,区域盐渍化将进一步加深;地下水位及农业灌溉是造成伽师县盐碱荒地盐渍化的根本原因。因此,应结合实际情况在实施地下水位调控的前提下,加强区域排盐设施的修建及完善。结论可为缓解
期刊
期刊
随着许多具有带宽消耗的新兴业务的快速发展以及其对现有通信速率更高的要求,可见光通信技术成为6G不可或缺的一部分。利用LED光作为载体,400-800THz超高频段进行传输的可见光通信(Visible Light Communication,VLC)技术有望解决频谱稀缺、高速传输的问题,满足新兴业务对高速传输的要求。然而,可见光通信系统中的非线性损伤严重制约了VLC系统传输速率的进一步提高。通过软件
学位
随着云计算的普及,越来越多的用户将敏感信息存储到云服务器中,为保证云平台数据的机密性和可检索性,研究人员提出了关键字搜索的对称加密算法。现有的可搜索加密方案大多为支持单关键词/多关键词的精确搜索方案,而在实际应用中,容易出现拼写错误等问题,导致精确搜索效率和可用性降低。为进一步提高可搜索加密方案的容错性,本文从对称加密和公钥加密两个方向研究了模糊可搜索加密技术,具体工作如下:首先,针对现有对称可搜
学位
分析了工程建设标准实施评估的基本现状,结合重庆市对大批量现行工程建设地方标准开展的实施评估工作,探讨了工程建设标准实施评估不同方法的优缺点,供行业人士参考。
期刊
随着可用遥感图像数据的增加,遥感图像在农业监测、领土安全和其它领域发挥着越来越重要的作用。现有单一卫星传感器无法提供同时满足高空间分辨率和高时间分辨率的数据,因此国内外研究者提出了多种时空融合方法来缓解这个问题,通过融合两个或者多个传感器的数据,得到同时具有高空间分辨率和高时间分辨率的图像。随着图形处理单元硬件的发展和研究的深入,深度学习在许多领域得到广泛应用。在时空融合领域中也提出了一些基于深度
学位
科学认定四荒地经营权法律属性与“再流转”的规范含义是解释四荒地经营权再流转规则的基础。基于历史解释、物债界分的认定标准和承包地“三权分置”改革目标的考量,四荒地经营权承继于原四荒地土地承包经营权,应定性为用益物权。“再流转”的规范含义应指土地经营权设立后的处分行为,由此可认定《农村土地承包法》第五十三条构成四荒地经营权再流转规则。《农村土地承包法》第五十三条并非效力性强制性规定,四荒地经营权再流转
期刊
随着电子商务和流媒体平台的兴起,网络中存储着越来越多的数据和服务,信息过载问题也随之出现,推荐系统是解决此类问题的有效技术之一。个性化推荐不仅能帮助用户快速地过滤信息,还能为商家带来巨大利润,因此推荐系统受到了广泛的研究与应用。协同过滤是推荐系统中使用最为广泛的推荐算法,此类算法主要使用用户与物品的交互数据来挖掘用户的偏好从而进行推荐,交互数据可分为显式反馈和隐式反馈,现有的协同过滤算法普遍采用单
学位
随着企业数字化转型,信息物理系统(Cyber-Physical Systems,CPS)在智能机器人、智慧工厂、智能交通、工业监测等多个行业得到广泛应用。为适应现代化分布式系统发展,许多CPS基于微服务架构部署。随着越来越多服务组件接入CPS系统,导致CPS中服务更加复杂、海量、异质,且存在的诸多不确定性,同时,由于存在大量需要动态生成的微服务,必然会导致服务质量波动剧烈,且影响服务组合效率;此外
学位