【摘 要】
:
在社交网络和网上论坛中,每时每刻都有新的信息在发布.如何利用金融知识图谱从这些非正式文本中及时准确的识别其中的金融实体,捕捉关键信息并辅助投资决策是人们关心的问题.本文研究了如何从Reddit网络论坛获得实时的金融讨论文本数据,通过实体识别模型,识别文本中蕴含的金融实体.针对互联网非正式文本存在着大量的不规范文本,包括名称缩写、简写、拼写错误等,我们构建了一个包含实体别名、简写与常见错误拼写的金融知识图谱,并训练了一个Albert(small)-CRF fine tune模型.在试验测试中,其模型的准确率
【机 构】
:
里外(深圳)网络科技有限公司,深圳 518000
论文部分内容阅读
在社交网络和网上论坛中,每时每刻都有新的信息在发布.如何利用金融知识图谱从这些非正式文本中及时准确的识别其中的金融实体,捕捉关键信息并辅助投资决策是人们关心的问题.本文研究了如何从Reddit网络论坛获得实时的金融讨论文本数据,通过实体识别模型,识别文本中蕴含的金融实体.针对互联网非正式文本存在着大量的不规范文本,包括名称缩写、简写、拼写错误等,我们构建了一个包含实体别名、简写与常见错误拼写的金融知识图谱,并训练了一个Albert(small)-CRF fine tune模型.在试验测试中,其模型的准确率,召回率都优于基准对比模型.另外模型的推断速度达到了5129 QPS(quest per second),提升了金融实体识别的实时性,有利于快速找到金融决策信息.
其他文献
在智慧教育中应用文字识别技术,有利于提高工作效率,有利于助推智慧教育的大众化.基于实际工作项目和智慧教育需求,文章重点探索基于Python的文字识别技术的基本原理、核心技术与应用,并以实践案例予以佐证.
随着C2B的不断发展,民航机票销售代理人已成为航空公司重要销售渠道,而代理人的不规范销售行为会严重影响航空公司的销售收入及声誉.针对这一情况,本文在分析国内代理人销售数据的基础上,采用累加求和、对比分析、市场占比等方法重组生成了代理人活跃度、市场份额、买入卖出偏好等3大类18小类特征属性,提出了一种基于Canopy-KMeans聚类算法的机票代理人行为刻画算法,实证分析结果验证了基于大数据分析代理人行为刻画算法的正确性和有效性.其分析方法和结论有助于航空公司有针对性地采用不同的渠道策略、规范机票销售市场行
针对站用铅酸蓄电池核容充放电的数据分析问题,利用放电电压和容量之间的关系,提出了一种融合隐患系数和放电电压特征的健康评估方法.该方法通过计算隐患系数和对放电电压的预测,实现对蓄电池组健康评估,并在广州局某站用蓄电池组实测数据集上进行了验证,结果表明该方法能够有效发现不良电池.
电网企业正在开展技术架构转型,基于Devops流程提出研发仿真环境构建方案,实现应用在线研发、在线测试、在线发布等一体化、全流程、自动化,提升各类研发、协作、运维效能,实现对用户可见的持续、顺畅、高质量、有效价值的交付.最后,通过实验验证了研发仿真环境的可行性.
海军试验时,为了满足试验要求,保证试验安全,需要无人机在随舰飞行时实时调整某一段航路的勾径,从而使得无人机以设定的勾径值随舰飞行.手动调整航路勾径精度太低,且操作繁琐.测控系统作为无人机系统的核心组成部分,需要承担航路勾径自动偏移的功能.为了解决该问题,无人机测控软件设计了航路勾径偏移功能.本文主要介绍了航路勾径偏移功能的功能描述、算法实现以及功能实现.目前该功能满足了设计的目标,达到了预期效果,已用于海用型无人机实际飞行.
为更好地实现餐厅一体化、智能化管理,提高餐厅点餐与管理效率,提高顾客的用餐体验,实现菜品的自动识别是十分必要的,它是实现餐厅信息化和自动化的重要环节.本文提出了一种基于卷积神经网络的菜品识别算法,主要采用MMDetection框架和Faster R-CNN目标检测模型实现,通过模块化设计初筛以及细分类的方式先处理易混淆的菜品类别,可较好地避免多尺度环境下引起的误识别,为智慧餐厅的研究提供了参考.
针对小型水电站生态流量排放不达标、管理的现代化和信息化水平较低等问题,为了监督小型水电站的生态流量排放的执行情况,设计了小型水电站生态流量监测系统.系统由终端环境监测设备、水文监测平台和人机交互程序组成,提供了客户端、网页和手机APP多种查看方式.实际监测效果良好,系统运行稳定,具有很高的实用价值.
首先,分析了四旋翼飞机的飞行原理,确定了用于姿态表示的体坐标系和地面坐标系;接着,利用动力学公式和PID算法对飞机姿态进行了研究;最后,利用Simulink工具软件建立了四旋翼飞机姿态控制器的动力学模型,并在Simulink中对俯仰角、偏航角、滚转角和升力进行了仿真.仿真结果表明,设计的控制器对四旋翼飞机的姿态调整有很大的帮助.
农业数据采集是农业科研、调查与评估等工作中的重要组成部分.随着农业物联网技术的发展,部分农业数据可以通过传感器自动采集,但是仍然有些数据需要通过人员实地采集,这就涉及如何高效采集数据与共同协作等问题.针对这些问题,研究设计并实现了农业数据采集任务分发系统,用于服务广大农业从事人员系统化采集数据.系统基于NoSQL数据库MongoDB作为底层存储,使用Vue与Spring Boot构建系统前后端,实现了PC端采集任务下发、农业数据采集人员使用手机端录入数据等功能.经过实际应用表明,该系统极大地节省了农业数据
随着大数据时代的到来,旅游业开始向智慧旅游转变.旅游服务信息推荐系统利用大数据技术加强游客与旅游信息之间的联系,为智慧旅游发挥着重要作用.针对传统的旅游信息服务不足,研究利用大数据挖掘技术,改进基于项目的协同过滤算法,分析游客的历史数据和游客与系统的交互行为来获取游客的兴趣,使用Mahout实现分布式智慧旅游推荐系统,为旅客提供高效的个性化服务信息推荐.