基于CRF的网页动态关系抽取研究

来源 :中国科学技术大学学报 | 被引量 : 0次 | 上传用户:shijun3541
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了基于条件随机场(conditional random fields,CRF)的网页动态关系抽取算法.给出了动态关系的定义,建立了动态关系的表示模型,并用一个六维结构来表达动态关系.与传统关系抽取中基于规则或者基于分类的解决方法不同,本文认为可以将动态关系识别问题转化为一个标注问题,并提出了基于CRF的句子层面的关系标注和抽取方法.在本算法中,首先将一个句子通过语义角色标注(semantic role labeling,SRL)系统进行成分识别,然后将语义角色标注结果以及词的POS类型、词组的命名实体
其他文献
针对无线传感器网络中有QoS需求的目标监控覆盖问题,首先证明了该问题的NP完全性,然后使用线性规划的方法进行了建模.由于涉及的搜索空间太大,直接进行求解较为困难,为此提出了一
仿真实训室集教、学、做于一体,模拟幼儿园环境,把课堂搬到"幼儿园",以达到理论与实践的有机结合,增强专业课的实效性,提高学生的专业实践能力,为学前教育专业培养高素质、强
通威股份(600438)公告称,下属企业合肥太阳能拟在合肥高新技术产业开发区、成都双流区西航港经济开发区,投建年产合计20GW的高效晶硅电池生产项目,总投资预计120亿元,项目以高效单
《动态》:9月19号,围海股份(002586)公告收购千年设计修订草案并复牌,你对于此次公司的收购是如何来评价的?孔铭:根据公告,公司拟通过发行股份和现金方式收购千年设计88.23%股权,
背景与目的研究伪麻黄碱对大鼠的致畸作用,为其应用提供毒理学安全依据。材料与方法将Sprague-Dawley60只孕鼠随机分为4组(每组各15只),即伪麻黄碱高、中、低3个剂量组和阴性
与高速率的拒绝服务攻击相比,慢速拒绝服务攻击难以被现有的拒绝服务攻击检测工具检测出来,其隐蔽性更高.通过分析慢速拒绝服务攻击在不同网络环境中对网络性能的影响,提出使
<正> 车前叶山慈菇(Erytbronium japonicam Decne.)为多年生百合科草本植物。地下部分为鳞茎,呈圆柱状,下细上粗,黄白色,长6厘米左右,直径1.2厘米左右,因其鳞茎含有大量淀粉
近年来,电子阅读正在逐步替代传统的纸质阅读,成为高校读者重要的阅读方式.建立电子教参资源平台的学科服务,其根本也是利用图书馆为桥梁,为师生提供所需的电子化教学参考资
1前言随着信息技术的高速发展和国家对科学教育事业建设力度的加大,在高校图书馆里应运而生了电子图书、视频讲座、语音图书等多种信息资源,这极大地满足了读者的需求,拓宽了读
<正>由于周三(8月23日)台风袭港港股休市,总结过去4个交易,港股从近期地位反弹,总结过去3个交易日,港股累积升幅1.74%,截止昨日8月24日,恒指收报27518点。港股成交再度突破千
期刊