基于字符级截断式循环神经网络的人名国籍识别

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:leobear
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人名是反映用户国籍的关键信息,不同国籍的人名在结构和组成成分方面存在差异性和关联性。目前,基于人名的国籍识别研究工作大部分将人名切分成多个独立的字符单元,忽略字符间微妙的搭配和序列关系。针对上述问题,文中提出基于字符级截断式循环神经网络的人名国籍识别模型,将人名通过滑动窗口的方式截断成多个子序列,利用长短期记忆单元模型学习不同子序列内部的字符组合关系,通过平均池化操作聚合所有子序列信息,获取最终的人名向量表示。最后根据该人名向量实现用户的国籍识别。截断式的子序列有利于模型更关注人名内部的细微差异。在Oly
其他文献
目的:分析单中心腹膜透析相关性腹膜炎(PDAP)患者感染的致病菌分布特点。方法:收集2013年5月至2018年12月广西医科大学第一附属医院肾内科收治的109例(共发生160例次)PDAP患
城市要基本实现现代化,必须建立一个以治理对象为导向,由政府、非政府组织、企业和市民组成的,具有统一领导、综合治理、合理分工、协调高效和低成本等特征的新型治理体系.在
期刊
以解决2016年上海局机车综合无线通信设备(以下简称“CIR设备”)故障频发,直接影响正常运输组织秩序和车机联控问题为抓手,在对CIR设备故障情况进行客观梳理的基础上,深入分
密云县农民专业合作社服务中心三条渠道促进绿色有机农产品发展。1.“农超对接”。密云县70家合作社的各色产品在北京物美、超市发、华冠超市销售,从去年7月份到现在,共实现收入
机车综合无线通信设备(CIR)应用于铁路GSM-R无线列调通信系统,供列车司机使用。WTZJ-I型设备替代原有的无线列调通信机车台,为机车和地面之间提供语音和数据传输通道。该设备
受众定位、内容定位、功能定位、竞争定位是媒介定位基本内容。本文结合传统纸媒和电视栏目,分析了这四大定位的基本内容和实践方式,提出在稳定的功能定位基础上,唯有这四大定位
目的:评价不同民族儿童皮下脂肪增长状况。方法:使用英制 Harpenden皮脂卡钳 ,测量 14 2 3例 7~13岁维吾尔族 (维族 )、哈萨克族 (哈族 )、汉族、回族 4个民族儿童肱三头肌部
国家治理理论的构建只有融入优秀传统文化,才能实现优秀传统文化与我国体制的互动,建构共同发展机制,并在融入过程中体现中国特色。
随着高等院校的开放和其社会功能的愈加复杂,大学生安全问题成为一个各高校都极为重视的问题。在大学生安全问题上,高校的安全教育是最重要的一环,本文分析了当代大学生安全
冠状病毒是RNA病毒中的一个科(family).最早描述由冠状病毒引起疾病的是Schalk和Hawn,他们于1931年发表文章,谈如何区分禽类传染性支气管炎和其他呼吸系统疾病.1965年,Tyrrel