基于单字提示特征的中文命名实体识别快速算法

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:shuijing0328
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear—chain)模型一般采用L—BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降低特征的规模,并通过在推理过程中引入任务相关的人工知识压缩Viterbi和Baum—wekh格搜索空间,提高了训练的速度。在中文863命名实体识别评测语料和SIGHAN06语料集上进行的实验表明,该算法在不影响中文命名实体识别精度的同时,有效地降低了模型的训练代价。
其他文献
亚裔美国文学选集《哎……咿!》揭示亚裔美国人在美国的历史进程,凸现他们受到的不公待遇,唤醒了亚裔美国人的自我意识,为亚裔族群的觉醒和亚美文学的发展做了铺垫。
目的肥胖被认为是一种慢性炎症性疾病,也是冠状动脉粥样硬化性心脏病、恶性肿瘤的独立危险因素。骨桥蛋白(OPN)是一种具有多种生物学功能的炎症相关细胞因子。检测单纯性肥胖人
针对普通高等学校两课教学过程中存在的学习积极性不高、授课效果较差、高年级两课教育内容不足等问题,探讨了如何通过建设M00C平台下的微课资源库,实现课内和课外、低年级和高
为获得更优的模袋砂堤防沉降预测结果,基于灰色模型,提出一种分数阶灰色模型。运用MATLAB语言编写了相关程序,实现微分阶次到分数阶的改变,并运用该模型对模袋砂滩涂围垦测试
在刑事司法实践中重视违法性认识是时代发展的必然趋势,但同时要注意中国语境,在主流理论框架内研究问题,严格区别大陆法系构成要件理论和我国犯罪构成理论的差异。对违法性认识
蝙蝠是全球分布的第二大类哺乳动物,它可以携带多种病原体,是人兽共患病重要的储存宿主.从目前传染病流行情况看,主要以人传人传染病为主,如艾滋病、结核病等,而蝙蝠引起的传
目的:探究替格瑞洛结合经皮冠状动脉介入治疗(PCI)对急性心肌梗死(AMI)患者心肌灌注及血清血小板活化因子(PAF)、血小板膜糖蛋白Ⅱb/Ⅲa复合物(PAC-1)水平的影响。方法:选择1
在新闻报道中,往往存在这样一些现象:当报道者盼望作品中的优秀人物给人以鼓舞时,得到的却是读者的冷嘲热讽;当报道者希冀揭露不良事实以告诫世人时,扑面而来的竟是这种事实的愈演
针对维英本体共性知识的获取问题,提出一种基于跨语本体重用的快速构建维语领域本体方法。该方法将初始维语本体转换为英语本体,通过本体选择、映射和合并等过程对其丰富,达
本文主要探讨了语篇的信息分析理论,及其在实践中的具体作用.指出:语篇的信息分析有助于人们对语篇的整体理解和贯通,并为语篇进一步的深入分析和研究打下了基础.