一种基于层叠CRF的古文断句与句读标记方法

来源 :计算机应用研究 | 被引量 : 13次 | 上传用户:zhoulijun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对利用自然语言理解技术进行古汉语断句及句读标注的主要挑战是数据稀疏问题,设计了一种六字位标记集,提出了一种基于层叠式CRF模型的古文断句与句读标记方法。基于六字位标集,低层模型用观察序列确定句子边界,高层模型同时使用观察序列和低层的句子边界信息进行句读标记。实验在5M混合古文语料上分别进行了封闭测试和开放测试,封闭测试断句与句读标注的F值分别达到96.48%和91.35%,开放测试断句与句读标注的F值分别达到71.42%和67.67%。
其他文献
在"邓小平理论和‘三个代表'重要思想概论"课的教学中,如何找到一条既能体现"两课"的导向作用,又使学生乐于接受的途径,成为"两课"教师经常讨论的问题.在实践中,我总结出
1 临床资料 80例均符合国家中医药管理局医政司制定的<中医内科急诊诊疗规范>中外感高热急症(风寒化热型)的诊疗标准.年龄在18~76岁;其中男性42例,女性38例;体温39~ 39.9℃65例
1临床资料 70例患儿均符合紫癜性肾炎(HSPN)诊断标准,分为A组35例,包括男20例,女15例,年龄4~15岁,平均年龄8.1岁,临床表现有孤立性血尿或孤立性蛋白尿9例,血尿和蛋白尿15例,急性肾炎型7例
目的:观察川菊止痛胶囊的镇痛度活血化瘀作用,探讨川菊止痛胶囊对偏头痛的作用机制。方法:采用热板法、扭体法观察其镇痛作用,井观察其对血瘀证大鼠血液漉变性的影响。结果:川菊止
期刊
目前检测软件缓冲区溢出漏洞仅局限于手工分析、二进制补丁比较及fuzzing技术等,这些技术要么对人工分析依赖程度高,要么盲目性太大,致使漏洞发掘效率极为低下。结合fuzzing技术、数据流动态分析技术以及异常自动分析技术等,提出一种新的缓冲区溢出漏洞发掘思路。新思路克服了已有缓冲区溢出漏洞发掘技术的缺点,能有效发掘网络服务器软件中潜在的未知安全漏洞(0day),提高了缓冲区溢出漏洞发掘效率和自动化
1临床资料 60例患者全部米自2007-01—2007-06我院普外二科腹部术后住院病人。其中对照组30例,男14例,女16例,年龄19-60岁。治疗组30例,男17例,女13例,年龄21-59岁。两纽病例一般资
2006-03~2008-03我们采用复方鳖甲软肝片联合阿德福韦酯治疗CHB72例,观察了其对CHB患者T淋巴细胞亚群和肝纤维化指标的影响,现将结果报道如下.……
期刊
1 临床资料120例患者均来自2004-01—2006-12我院针灸科门诊及住院患者,疱疹病变部位在胸部或腰部,随机分为治疗组及对照组各60例。其中男性59例,女性61例,年龄分布于40~72岁之间,