基于多学习策略的网页信息抽取方法

来源 :计算机应用与软件 | 被引量 : 5次 | 上传用户:slrjlc2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于网页信息具有异构和动态的特点,致使现有的大多数网页信息抽取方法都存在适用性差的问题。为此,将传统的文本分类器和隐式马尔可夫学习策略结合起来,提出了一种基于多学习策略的网页信息抽取方法。该方法在获得网页文本记录的局部最优分类抽取结果基础上,还利用了整个网页文本结构信息对抽取结果进行进一步优化。实验结果表明,该方法不需要对新的站点进行学习,就能获得较高的信息召回率和抽取精度,具有较强的适用性。
其他文献
2013年至今,每年的中职招生周口女子职业中专都能超额完成预设目标,招生人数逐年递增,在周口市同类学校中稳居第一名。现就我校的做法做一下简单阐述,以期与各兄弟学校交流经验、互相学习。  一、领导高度重视  我校之所以连续多年超额完成招生任务,主要得益于县领导和县教体局的高度重视。对于春季招生,县教体局有一套行之有效的方法。每年除了在全县教育工作会议上强调职业教育,县里还专门召开春季招生工作动员会,
本刊讯(记者 李亚婷)5月12日下午,河南省暨郑州市首届“职业教育活动周”启动仪式在郑州职业技术学院举行。副省长徐济超出席启动仪式并宣布河南省暨郑州市首届“职业教育活动周
二次分配问题(QAP)是经典的组合优化问题之一,广泛应用于许多领域中.针对QAP,提出了一种新的蚁群算法一改进的快速蚁群系统(IFANT).该算法通过限制迭代最优解与当前解的信息素升级的
针对公交车站台等车人数众多、拥挤,候车时间过长这一突出问题,设计了公交车运行状况实时管理系统。乘客可以实时掌握车辆位置信息,实现合理等车,也有利于公交公司对司机、车辆运
作为文化的传承者,教师应切实承担起传播科学精神、孕育科学素养的责任。但如何才能在历史教学中培养学生的科学精神?笔者从教师专业发展、科学精神、科学态度、科学探究方法
你不能控制他人,但你可以掌握自己;你不能选择容貌,但你可以展现笑容;你不能左右生活,但你可以改变心情.积极的心态不是天生的,而是后天养成的,是人主动创造出来的.
提出了一种在Mediator-Wrapper结构中嵌入基于XQuery语义缓存的异构数据集成系统的查询处理方案,主要包括查询包含关系判定、查询分解和重写。同时提出利用树型同态算法解决XQuery查询语义包含关系的判断问题和Web环境下的缓存替换策略,旨在提高信息集成系统的查询性能。
RNSS网络监控管理系统代表了目前安防行业的领先技术,它不仅具备常规网络监控系统的功能和优点,而且在使用功能上新增了矢量电子地图、预览组、集群技术、预案引擎、流媒体转发、集中网络存储及下载等快捷高效的实用功能,这些功能非常适合应用于高校的楼宇智能化实验室的建设,文章以广西机电职业技术学院RNSS开放型网络实验系统建设为案例,探讨了如何将安防行业高端技术应用于高校教学及实验室建设。
“犬不择家贫、子不嫌母丑。”宋人留下的这句饱含人文哲理的不朽格言,数百年来在我们民族的道德文化传承中,一直发挥着积极的教化作用。然而,目前在大学校因里发生的一件事情,却
1月25日,2016年河南省参加全国职业院校技能大赛中职组比赛工作座谈会在郑州召开。省教育厅副厅长尹洪斌出席座谈会并讲话。郑州、洛阳、平顶山、焦作等省辖市教育局主管局长