Deep Web信息抽取研究

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:anewday4all
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Deep Web信息资源的利用问题,指出对其进行信息抽取的意义,分析对比在信息抽取过程中处理查询接口和抽取结构化数据这两个主要步骤所使用的技术,采用基于关键词查询和建立文档对象模型的方法对专利数据库进行抽取实验。通过分析实验结果,验证抽取方法的准确性,指出不足之处和解决的途径,以期达到充分利用Deep Web信息资源的目的。 In view of the utilization of Deep Web information resources, the significance of information extraction is pointed out, and the techniques used in the two main steps of processing query interface and extracting structured data in information extraction are analyzed and compared. Based on keyword query and establishment Document object model method of patent database extraction experiment. By analyzing the experimental results, we verify the accuracy of the extraction method and point out the shortcomings and solutions, in order to achieve the purpose of making full use of Deep Web information resources.
其他文献
目的 探讨丝裂原活化蛋白激酶(MAPK)在转化生长因子β1(TGF β1)诱导人肺成纤维细胞表型分化中的作用。方法 以人肺成纤维细胞HLF 0 2细胞系为研究对象,给予10ng/mlTGF β1
目的:探讨补体受体2型在实验性大鼠脑出血后继发性脑损伤及脑水肿中的作用。方法:实验于2003-07/2004-10在河北医科大学第二医院神经内科实验室进行。60只SD大鼠随机分为脑出
目的提高脊髓损伤(SCI)病人瘫痪膀胱充盈度感觉代偿功能和自主排尿功能.方法 2002年11月至2003年12月,对52例SCI病人于伤后1周开始进行卧位、半坐卧位或坐位的生物反馈训练,
目的 观察人核糖核酸酶抑制因子(RI)逆转录病毒真核表达载体(p L NCX- ri)对小鼠B16黑素瘤生长的抑制作用。方法 将转染细胞PA317- p L NCX和PA317- p L NCX- ri分别置于DM
目的研究银杏达莫对急性脑梗死患者脑循环动力学的影响。方法将60例首次颈动脉系统急性脑梗死患者随机分为银杏达莫治疗组(治疗组)与常规治疗组(常规组)。采用脑循环动力检测
患者,男,10岁。因突发性鼻内肿胀、疼痛伴鼻 塞5d,于2000年8月18日就诊。发病前无鼻外伤 史,无畏寒、发热。检查:一般情况佳,全身浅表淋 巴结未触及肿大,双侧视力均1.0,心、
目的探讨利用内镜、腹腔镜治疗高龄病人急性胆管炎的安全有效的治疗方法.方法自1998年5月至2003年6月,收治高龄(>75岁)胆管结石诱发急性化脓性胆管炎病人121例,首先经十二指
患者男 ,19岁。主诉左眼视物不清 2个月入院。眼科检查 :视力左眼 0 .1,右眼 1.5。左眼虹膜下方后部粘连 ,瞳孔圆形居中 ,直径 3mm ;晶状体脱位 ,前囊膜混浊 ;眼底窥不清 ;指
目的:观察外周血干细胞移植(PBSCT)治疗急性白血病和恶性实体瘤的临床疗效观察.方法:自1999年11月至2004年3月,用PBSCT治疗急性白血病和恶性实体瘤11例,其中:急性淋巴细胞白
 目的: 探讨中国HIV/AIDS患者HIV -1Gag、Tat、Rev和Nef蛋白特异性CTL应答的特征。方法: 应用覆盖HIV -1B、C亚型Gag、Tat、Rev和Nef蛋白的 220个肽段作为抗原, 通过ELISPOT