面向真实环境的金融问答系统

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:majian_hunu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
金融领域在中国得到了越来越多人的关注,与金融相关的信息也呈爆炸性增长。广大股民基民们迫切需要一个能够针对金融领域答疑解惑的工具。但是长期以来,自动问答系统的研究主要关注的事实类问题,而这类问题只占现实生活中人们所提出的问题的很小一部分,远远不能满足社会对问答系统所期望的全部信息需求。同时,大量的在线网友问答平台和FAQ (Frequently asked questions)服务涌现出来,这类系统集合了所有网民的智慧为有需要的人提供知识服务。如果能将自动问答技术和网友问答系统结合起来,以网友问答的内容作为知识库,通过自动问答的相关技术从知识库中查找最适合的现成的答案,则能在一定程度上满足日益增长的,对金融领域知识的需求。课题的研究工作主要包括:(1)搭建在线问答系统,既能收集问题答案对,同时作为展示平台。(2)编写爬虫获取主流在线网友问答系统的金融领域的问题答案对,建立知识库。(3)总结面向真实环境的问句出现的特殊现象和复杂现象,提出了处理这些现象的预处理方法。(4)研究了自动问答相关技术,包括问题简化,问题分类,问句相似度计算等,并且应用到自动问答系统中。(5)手工标注金融领域问句语料2万句,并且在此基础上研究面向金融领域问句的句法分析技术,将句法分析技术应用于问句分类,问句相似度计算阶段。实验结果表明,证明句法分析可以提高分类和相似度计算的准确度。最后本课题实现了一个面向金融领域的自动问答系统,该系统包含一个面向金融领域的网友问答子系统和一个自动问答子系统。其中网友问答子系统为用户提供一个问答和交流的平台。而自动问答子系统将庞大的在线网友问答数据作为知识库,通过查找并返回现有问题列表中与用户所提问题语义等价或相近的问题答案对来回答用户的问题。本系统的研究成果和采用的技术也能适用于其他限定领域的基于FAQ的问答系统。
其他文献
提出一种新的用于图像认证及恢复的半脆弱水印算法。该算法的水印生成和嵌入都在原图像中进行,图像认证时不需要原始图像和任何有关水印的附加信息,从而提高了水印的安全性和保
研究CSC-(n-N)序列流密码算法簇的安全性,证明产生的第1个密钥字节为0的概率约为2^-n~2^-2n,利用模拟实验验证其正确性,据此提出对CSC-(n,N)的区分攻击。该区分攻击只需利用2^3n+2个密
基于教育史、儿童史的资料,探索美国儿童福利运动中的教育议题,发现这些教育议题针对不同年龄段的儿童,产生的基础是19世纪末20世纪初美国社会严峻的儿童问题,大量出现的关键
管乐队一般分为:礼仪性管乐队和交响管乐队两种形式。礼仪性管乐队主要是在户外进行,除了注重演奏外,更注重的是节奏感。礼仪性管乐队有时也可以做行进演奏,丰富了乐队演出形式。
当前.如何运用十五大精神加强基层党的建设,笔者认为要突出把握“王子”;一是“明路子”搞好新时期党的建设.、管具体操作过程如何.三项基本收则始终人能变:一是党对企业的政治领牙
针对电子产品通信方式和通信协议各异造成的不兼容问题,设计一种支持多种无线接口和多种互连协议的桥接器,在硬件上允许多种设备接入,在软件上实现多种协议的兼容,通过UPnP协
为解决RFID系统中的标签碰撞问题,在分析经典二进制搜索算法的基础上,提出一种基于二进制搜索的改进算法以实现标签的快速识别。算法采用栈和队列技术、后退策略、碰撞位跟踪及并行处理思想,在碰撞处理中,读写器只需发送一个三维向量命令,标签以部分碰撞位参数为应答,减少传输数据量和识别次数;利用队列存储已识别的ID,将读写操作与碰撞处理并行,省去单独读写时间;采用模块并行处理,使读写器具有双核处理能力。测试
关于保险单现金价值是否是一种财产以及其归属问题,我国现行法律及司法解释对此并没有规定,因此给保险实务与司法实践造成了不便。本文试对此做简要分析。 As to whether th
新冠疫情下,在线教学的全面开展暴露出了很多线下教学没有的问题.部分高职院校教师专业化发展意识不强,专业知识、技能不足,教学反思和科研能力亟待提高.如何改变现状,促进教