未定义类型的关系抽取的半监督学习框架研究

来源 :南京大学学报(自然科学版) | 被引量 : 0次 | 上传用户:weibo78500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
设计未定义类型关系抽取系统是目前研究的热点.但在没有特定领域的、机器可读的知识作为指导的情况下,面向自然语言文本的关系抽取很难取得令人满意的精确度和召回率,约束可以有效辅助语义关系的抽取.本文描述了一个提取“实体一属性一值”关系的半监督的机器学习框架,在半监督学习任务中,种子主要从维基百科的信息表格中获取,首先用线性分类器找出一些强反例,然后迭代的使用已有的反例数据重新训练分类器再应用到余下的未标注数据上找出更多反例.经过半监督学习得到了一个关系候选实例集,接下来讨论了关系类别验证问题,对于噪声模式,给出
其他文献
为分析某650 MW火电机组发生的异常甩负荷事故,在数字电液系统(DEH)中构建了该机组精确的锅炉-汽轮机对象模型,并利用DEH的仿真功能对事故过程进行了重现,对事故原因进行了分
曲折艰辛路,豪迈世纪行。湖北省第五次人口普查,各级政府高度重视,广大民众全力配合,40万普查大军艰辛努力,全省上下克服了前所未有的难度,付出了前所未有的努力,赢得了前所来有的成果
黑龙江北疆集团股份有限公司是集工、建、商服业经济一体化的省级企业集团,在2006年全国成长百强民营企业中排名第75位。黑龙江北疆集团股份有限公司注册股本14895万元,集团资
针对大规模网络的网络分析,本文提出基于社团为粒度的网络分割方法,以模块度作为评价准则,以节点网络属性作为启发式信息对网络进行分割,使得子图规模相当且具有社团群聚特征
对基于Internet的远程故障诊断和维修向导技术进行了探讨,介绍系统的总体结构、功能模型, 并以柔性制造系统(FMS)为应用对象,采用动态Web技术成功开发了原型系统.实际应用证
目的:观察碱性成纤维细胞生长因子(bFGF)对人脐带间充质干细胞(hUCMSCs)增殖及Ⅰ、Ⅲ型胶原产生的影响。方法:贴壁培养hUCMSCs,流式细胞术分析其表面标记(CD45、CD34、CD105
提出一种眼底图像血管分割的新方法.对于每一个像素点,基于通过该点的不同方向的直线生成一个点特异度,设置点特异度阈值对整幅图像进行血管预分割,然后将整幅图像分成16×16的子图像,通过梯度下降进行局部自适应计算,最适合子图像的局部点特异度阈值被确定并用于子图像血管分割.将所有的子图像分割结果进行合并得到最终的血管分割结果.通过噪音去除、集群感知搜索遗漏血管像素和间断血管片段连接,图像的血管结构最终得
以转子角速度和不平衡量为参数,用数值方法研究了具有非线性刚度的Jeffcott转子发生动静件径向碰摩时周期振动的分岔现象,并通过数值模拟获得振幅突变流形和分岔集。所得结论对
利用振动信号频率成分结构和频率幅值研究了汽轮发电机组振动故障的综合自动诊断方法.根据振动故障的频谱特点,将振动故障分为4个模式类,并确定故障类模式中心,在故障类的层
介绍了基于RP的快速金属模具制造技术,分析了影响模具制造精度的因素。提出金属模具的精度闭环控制系统。研究了在精度闭环控制系统中关键技术--铸造凝固过程的数值模拟技术。改