基于深度神经网络模型的中文分词方案

来源 :哈尔滨工程大学学报 | 被引量 : 0次 | 上传用户:zzzzzzvb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前已有的分词算法和程序在处理海量网络文本分词时性能下降的问题,本文提出了一种基于深度神经网络模型的中文分词方案。该方案利用基于长短期记忆网络的编码-解码模型对数据模型进行训练,并采用得到的模型进行分词。为了提升分词性能,进一步提出了一种基于词向量的修正方法,对采用上述模型的分词结果进行修正。对典型微博语料数据集的实验结果表明,提出基于模型的分词性能相对于传统的分词软件的分词性能有了较大提升。采用提出的词向量修正方法修正后的分词准确率和F值略优于未修正的分词准确率和F值,从而验证了论文提出的分词方案的
其他文献
反辐射导弹的迅速发展对雷达构成了极大的威胁,研究切实可行的反辐射导弹对抗措施显得十分迫切。首先介绍了低截获概率雷达的定义;然后推导出低截获概率方程,得到雷达截获因子公
在大数据支持下,互联网、多媒体设备与传统教学模式相结合的手段正在悄然进入大学英语课堂。文章针对高校英语专业学生,探讨其对商务英语阅读课程采用混合式教学模式,即录制
压缩机应用领域广泛,主要涉及石油、化工、机械等行业。由于压缩机的应用行业范围广,因此针对压缩机的故障诊断技术研究具有重要的实际意义。针对压缩机的故障机理开展研究分
目的总结3种经吻合支跨区供血反流轴型皮瓣的手术要点,探讨影响手术成败的因素.方法分析17例颈肩部、额部及会阴部3个部位的经吻合支跨区供血反流轴型皮瓣的临床应用情况.结
大学生作为旅游市场重要的消费群体,影响着整个旅游经济的发展。文章以南京高校的在校生为研究对象对当代大学生旅游现状进行了调查与分析,找出了旅游业中存在的一些问题,为
目的对银川市早产儿进行视网膜病变(ROP)的筛查,以了解该地区早产儿ROP的发生情况。方法对608例NICU住院早产儿,采用间接眼底镜或眼底数码相机进行ROP筛查,并随访其预后。结
介绍甲醇制汽油催化剂级配技术。通过不同酸中心数量和酸强度分布的催化剂级配实验发现,与单一类型催化剂相比,采用级配装填方式可以使催化剂性能互补,单程汽油收率大于70%;
中国专利技术——输电网三相自动平衡器,在配电网应用中,利用电网自身的稳定性,通过微机调控,达到三相负载平衡。在技术上,结束了大功率单相负载必须配备电容器,电抗器一类平
目的:初步探讨补体C3含量与无症状乙肝表面抗原携带者的关系。方法:随机抽取80个无症状HBsAg携带者和80个HBsAg阴性健康正常人的血清进行C3含量比较;用酶联免疫吸附试验双抗夹心
目前护理专业已逐步发展成为具有实践技能和护理理论的相对独立的学科,因此,护理实践教学和理论教学并驾齐驱,尤其在"重理论,轻实践"的当代教育形势下,实践教学的优劣成为护生