古汉语句子切分与句读标记方法研究

来源 :河南大学学报(自然科学版) | 被引量 : 0次 | 上传用户:blus95
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
利用自然语言理解技术进行古汉语断句及句读标注的主要挑战是数据稀疏问题.为了解决这一难题,设计了一种六字位标记集,提出了一种基于层叠式条件随机场模型的古文断句与句读标记方法.基于六字位标集,低层模型用观察序列确定句子边界,高层模型同时使用观察序列和低层的句子边界信息进行句读标记.实验在5 M混合古文语料上分别进行了封闭测试和开放测试,封闭测试断句与句读标注的F值分别达到96.48%和91.35%,开放测试断句与句读标注的F值分别达到71.42%和67.67%.
其他文献
有人说这一“三足鼎立”是澳门博彩旅游业各具优势的最佳组合,但眼见着自己独享的奶酪被生生分去两块,何鸿燊虽说一生不知道“输”字怎么写,也只能强颜欢笑,说“欢迎竞争,不
喷油器积碳是直喷汽油机(GDI)面临的主要问题之一,提高喷油压力可以改善直喷汽油机的喷雾特性和燃烧特性。在自行设计的定容燃烧弹内,研究了两种喷油压力(4 MPa和7 MPa)对3支
<正> 党的十五大对我国改革开放和现代化建设跨世纪的发展提出了宏伟目标和战略任务。在完成这一伟大事业的历史进程中,各级党组织和各级政府肩负着极其重大的历史责任,也给
香港的职业教育和培训为香港经济的飞速发展提供了强有力的智力支持。职业核心能力的引入为全人教育和全人发展拓展了空间。学习和借鉴香港职业核心能力培养经验,从实学到活
<正> 宗庆后又出招了。2004年2月,娃哈哈“水家族”又添新成员——“激活”活性维生素水饮品闪亮登场。娃哈哈方面宣称将把“激活”定为今年的主打品种,预计年销售额将突破5
针对汽车双回路制动系管路II式、X式、HI式、LL式、HH式等5种布置形式,分析了对汽车制动效能及制动时方向稳定性的影响。基于已建立的汽车质心位置与汽车制动效能关系的数学模
伏牛山旅游区在空间组织方面,应以行政区为空间结构主体,以板块组合为特点,形成适合伏牛山旅游发展的地域空间结构;在旅游产品的空间组织方面,应在兼顾一般的基础上,三个板块
为了讨论一类Emden-Fowler方程奇异m-点边值问题正解的存在性问题,运用上下解方法、极大值原理和Schauder不动点定理,在次线性条件下,解决了这类奇异边值问题正解的存在性问
<正> 英文中秘书 Secretary 一词,来自拉丁语 Secre-rum。在中世纪,大不列颠的秘书原本是处理国王通信,处理机密或秘密紧要问题的高级官阶。当今西方秘书的工作范围,随着社会
澳博行政总裁何鸿燊表示,由于其位处外港码头区,面对大海, 故命名为“Oceanus”。他是希腊神话中的河流之父、海洋之神,将可守护着澳门的大门。