从WEB文档中构造半结构化信息的抽取器

来源 :软件学报 | 被引量 : 0次 | 上传用户:ltavip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了对WEB上不规则的,动态的信息按照数据库的方式集成和查询,采用对象交换模型建立了WEB的信息模型,为了将页面中各个部分表示为对应的OEM对象,设计了半结构化信息的抽取算法,并给出了测试结果,该方法可以抽取结构化和半结构化的信息,比现有的抽取方法通用性更强。
其他文献
《小学数学课程标准》指出:"数学教学,要紧密联系学生的生活实际,……激发对数学的兴趣,以及学好数学的愿望。"怎样贯彻这一理念,实现小学数学教学的生活化?笔者就此谈几点看法:
表皮干细胞不仅在组织稳态和皮肤损伤修复中发挥重要作用,而且对研究肿瘤发生机制和皮肤疾病的基因治疗具有重大意义,多年来,人们一直致力寻找干细胞特异性分子标坊物以及体内干
TCP/IP协议实现的一致性测试是保证Internet网络备之间互连与互操作的基础,该文基于协议集成测试环境进行了IP端系统和中继系统分别采用了分布式和远程横断式测试法,设计生成了IP一致性测试集。并
随着NOW(networks of workstations)在科学研究中的应用日益广泛,如何为NOW上的科学计算提供高性能的输入、输出成为人们所面临的一个新课题.根据NOW的特点,设计并实现了一个
目的 探讨利福喷丁联合左氧氟沙星治疗方案对初治菌阳肺结核的疗效.方法 将本院收治的96例初治菌阳肺结核患者随机分为对照组和治疗组各48例,分别给予2HRZE/4HRE和2HL2ZV/4HL
目的:检测基因在动物组织或细胞中的时空表达模式。方法:转录反义RNA探针.开4用RNA原位杂交技术检测人和小鼠牙原基中若干基因的表达。结果与结论:通过优化条件,转录出完整的反义R
时间管理是工作流管理软件系统的关键部分,也是工作技术实施复杂企业应用的严重局限,开展时间管理研究,对于增强工作流管理软件系统的柔性、确保工作流计划的高效执行和提高企业