基于条件随机场与自定义规则的时间表达式识别

来源 :情报学报 | 被引量 : 0次 | 上传用户:hs20081987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文致力于信息抽取中时间表达式的识别与提取研究。首先针对基于规则方法时间识别的缺点,将统计序列标注模型——条件随机场应用于时间识别中,充分利用时间表达式的内部和外部特征进行时间识别,提高了时间识别的准确率。然后通过对识别结果进行分析,自定义规则对识别错误结果进行后处理,进一步提高时间识别的召回率,弥补了机器学习模型获取知识不够全面而导致的召回率偏低的问题。实验结果表明,本文方法开放测试的准确率、召回率和F-值分别到达了91.65%、88.13%和89.85%,较传统方法均有所提高,是一种有效的时间表达式识
其他文献
阐述宇部注塑机驱动工作原理及注塑机驱动改进过程,介绍液压伺服泵新技术的特点及优势,介绍同步功能实现的工作原理和性能比较。通过实际改造及应用,液压泵伺服新技术及同步
现有的知识推荐方法主要是静态知识分类推荐和单个用户个性化推荐,忽略了用户大众在知识访问中表现出的网络集群行为特征。用户的网络集群行为所访问的知识项之间往往隐含着
本体的构建是影响语义Web成功与否的重要因素之一。本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料
关联规则聚类是大量关联规则的一种有效组织方式,本文针对基于商品分类信息的规则聚类方法存在的不足进行了改进,同时考虑了不同层次间的项目语义差别,以及具有不同隶属度的项目
研究背景:传统信息行为研究领域倾向于关注信息搜寻行为,而一定程度上忽视了信息偶遇等其他信息获取方式,事实上偶遇式信息获取已经成为用户尤其是科研工作者重要的信息获取途径
服务器运用虚拟化技术能降低计算资源和能耗的浪费、提高服务器使用率、减少服务器数量、降低运营成本。虚拟化让企业更加绿色,将几十台服务器整合为若干台,是实现绿色IT的重
随着移动终端的不断推广,Android平台的应用范围得到最大化的使用,计算机智能技术在手机中的使用是安卓系统使用的重要方式,并且技术能力得到全面的发展与进步。因此在进行An
当前的共链分析研究主要沿用了共引分析的方法,但由于网络中充斥着大量的非实质性链接,就使这种共链分析的假设前提难以成立,分析结论的可信度低.在本文中,我们提出"实质性共
最新发布的V505是505系列的第五代产品。V505的推出给人耳目一新的感觉,全新设计的构架,摒弃了以往505系列单轴的设计风格,采用了内置Combo光驱的双轴构架。采用移动版赛扬1.7GH
应收账款是工业企业扩大销售,提高市场占有的良好手段,给企业的发展带来积极作用,同时也可能给企业带来消极影响。工业企业应完善信用管理机制,强化应收账款的内部管理制度,