基于规则的中文文本时间表达式识别和规范化方法

来源 :信息工程大学学报 | 被引量 : 0次 | 上传用户:J2EE_BOY
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间信息是事件的基本要素之一,时间信息识别在信息处理中处于基础地位。提出了一种基于规则的时间表达式识别和规范化方法。首先对中文文本时间表达式进行分类,基于正则表达式制定规则,利用模式匹配方法识别时间表达式;然后介绍了基准时间的确定方法,基于推理思想详细分析了时间表达式的规范化过程;最后通过实验进行了测试与分析,结果表明文章的方法具有较高的准确率、召回率和F值。
其他文献
目的了解行人工流产青少年对生殖健康、艾滋病/性病知识的知晓情况以及存在的需求,以便更适宜地进行干预。方法对291名22岁以下行人工流产的未婚青少年进行问卷调查,内容涉及
<正>弁言中国近现代新史学的开端,起于梁启超等人的研究和倡导。一九○一年和一九○二年,梁启超分别发表《中国史叙论》和《新史学》》,给中国史学界以极大的震动。在梁启超
阐述了事件新闻文本的时间信息抽取与处理对事件研究的重要性,研究了安全事件新闻的时间抽取与转换。考虑到目前采用的基于时间抽取规范TIMEX2/3和机器学习的抽取处理方法得
针对某高层住宅小区实际情况,对其包含填充体设计及其和支撑体之间的协调与平面布局进行深入分析,提出设计中需要的关键问题,以此提高设计的合理性、可行性与可变性。
按照新的适航规章确定直升机尾减速器连接寿命,并给出结构检查周期.利用有限元分析结合Miner线性累积损伤理论对结构连接按照设计目标寿命进行详细尺寸定义;利用结构疲劳试验结
广播电视传统的新闻采编方式在大数据时代到来的过程中发生了很大的变化,基于一些新闻线索就可以准确预测新闻,结合受众的行为分析人们获取信息的方式和习惯,围绕不同受众对
对人的猎捕不同于一般的狩猎,谁若旷日持久地猎捕手持武器的人,并以此为乐,让他们再狩猎任何东西都没兴趣了。
纯洁性是无产阶级政党加强党的建设的重要目标和价值追求。列宁在领导俄共(布)的过程中提出了一系列丰富的纯洁性建设思想。要保持和提高党的纯洁性,必须严把入口,疏通出口,加
抗战时期,为保证大后方交通建设的顺利进行,提高交通运输效率,保障交通安全和畅通,国民政府制定了大量交通法规,涉及到交通人事、业务、工务和财务方面,也包含了国民政府在这