基于深度学习的《辞海》分词方法

来源 :现代计算机 | 被引量 : 0次 | 上传用户:lichunhui128
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
《辞海》是中国文化重要资产之一,具有重大研究价值.分词是数字《辞海》的研究基础,而《辞海》内容比较复杂,具有古文类型广和知识领域广等特点,给分词任务带来一定挑战.针对《辞海》内容的特点,提出基于深度学习的分词方法,首先对《辞海》内容进行预处理,去除包括文言文、诗、歌等古文内容;其次,选择《新华字典》,并利用CBOW模型训练字向量;最后,选择BI-LSTM-CRF模型执行《辞海》分词任务.实验结果显示,提出的分词方法,准确率、召回率和F1值到分别达到94.18%、94.09%和94.13%,具有较好的分词表
其他文献
基于脱硫塔升气帽漏液问题,研究了一种氨法烟气脱硫循环液优化平衡装置。本装置的漏液收集器设置在脱硫塔浓缩段上部,且位于升气帽正下方,漏液收集器下部通过弯管与平衡回流
在分析UWB定位技术原理的基础上,针对四轮电机ROS机器人,构建UWB室内定位系统。UWB定位系统由四个基站和一个标签组成,其中标签程序用于发送测量命令给各个基站,并测量和各个基站的距离后发送给基站0;基站0负责和上位机进行通信,传送测量结果。定位测试结果表明,精度达0.1m,满足室内精确定位要求。
微观孔隙结构是影响多孔材料宏观物理性质的重要因素,孔隙结构研究对于表征多孔材料物理特性具有重要意义。多孔材料孔隙结果三维可视化便于直观地研究多孔材料内部孔隙结构。以多孔材料CT扫描图像为研究对象,在图像滤波、阈值化处理的基础上,采用Marching Cube面绘制算法对多孔材料内部孔隙进行三维重建,并采用OpenGL技术实现多孔材料三维孔隙结构的可视化、旋转、缩放等可视化,直观呈现多孔材料孔隙内部
阿尔弗雷德·阿德勒,作为精神分析学派个体心理学的创始人,论著颇多,以《自卑与超越》为代表。本文则取此书当中生命的意义、自卑感与优越感两个重点章节进行解读与思考,
人名是文本中表达关键信息的部分,机器翻译系统在人名翻译上的表现对翻译质量具有重要影响。人名翻译作为命名实体翻译的重要部分,具有重要的研究意义。设计与实现基于Django
农村村委会是基层群众性自治组织,村民自治是发展农村基层直接民主的本质和核心。农村村委会自治的健全与否,事关社会主义民主政治的发展进程,为此,对它的现状、存在的问题进
针对城市轨道交通列车群再生能量利用较低的问题,对列车时刻表中的停站时间进行优化可以有效提高列车再生能量利用。停站时间不对列车的区间行驶产生直接影响,但会间接影响列
消防工作是维持我国社会安定和谐的秩序,推动社会经济改革发展进程的必要条件.尤其是在全新形势之下,究竟怎样大幅度提升消防战训工作的质量和效率,是需要许多消防机构深入思
随着信息技术的发展和网络化学习的兴起,线上教学得到快速的发展,越来越多的人开始接受并使用线上教学,让传统的线下教学遭受到巨大的冲击.由于新冠肺炎疫情的蔓延,使得线上
神经网络机器翻译技术模拟人脑神经系统,以深度学习技术为基础,是翻译技术史上的重大发展。本文介绍了神经网络机器翻译及新闻文本的译后编辑研究现状,在特色词语翻译、新闻