以本体为指导的Web网页信息抽取方法

来源 :北京化工大学学报(自然科学版) | 被引量 : 0次 | 上传用户:HUANGKAO2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对Web网页中事物描述信息的特点,提出了一种通过本体指导网页信息抽取的方法。首先建立抽取对象的本体模型,并为本体属性概念添加定位信息映射模型,通过映射模型定位和分离样本页中包含语义信息的数据块,结合路径分析算法生成抽取规则,之后利用抽取规则对同类网页中的事物描述信息进行抽取,最后以资源描述框架(RDF)数据格式储存信息。抽取性能测试实验表明,抽取结果具有较高的准确率,与无规则抽取方法相比,具有更高的抽取效率。
其他文献
以辛酸、癸酸和三羟甲基丙烷作为反应底物,利用Candida sp.99-125脂肪酶粉催化反应,研究了反应条件对酶法合成三羟甲基丙烷三辛癸酸酯的影响,并在实验中找到一种可以提高酶粉
甲醇为起始剂,与萘钾反应转化为醇钾,以醇钾为引发剂依次引发环氧乙烷(EO)、环氧丙烷(PO)阴离子开环聚合,合成环氧乙烷-环氧丙烷(PEO,PPO)两嵌段共聚物,然后用甲基丙烯酰氯(MAC)为封端剂对
以Na2O·nSiO2和Mg(NO3)2为原料,经沉淀法合成得到三硅酸镁。采用BET、吡啶吸附和亚甲基蓝吸附等表征手段,考察了不同加料顺序和不同活化方法对样品孔道结构、表面酸性及吸附
将聚丙烯腈(PAN)纤维在空气气氛中于180-240℃范围内进行预处理,利用差示扫描量热仪(DSC)和傅立叶变换红外光谱(FT-IR)测试手段考察了预处理过程中形成的初期结构及其含量对纤维后
以汉麻布为原料,采用磷酸活化法制备了汉麻布活性炭纤维,并利用低温氮气吸附和密度泛函理论(DFT)对样品的孔结构进行了分析。结果表明,随着活化温度的升高,磷酸活化的汉麻布活
首先利用异丙基硫杂蒽酮/N,N-二甲基氨基对苯甲酸乙酯(ITX/EDAB)光引发体系制备两种末端带有ITX残留基团的大分子引发剂聚甲基丙烯酸甲酯(PMMA—ITXH)和马来酸酐-醋酸乙烯酯共聚物(PM
采用SnCl2·2H2O乙醇溶液浸渍竹炭和NaBH。还原方法制备出一种锂二次电池负极用Sn/C复合材料。考察了复合材料中sn含量对产物收率、微观结构及电化学性能的影响。结果表明
针对超声波提取中草药活性成分含量检测困难的问题,通过采用可测量的辅助变量建立基于神经网络BP算法的软测量模型来估计不可测量变量的值,并利用单片机进行辅助变量的数据采集和软测量模型计算,实现了用软仪表对超声波中药提取率的在线测量。与目前采用紫外分光仪离线取样进行检测相比,该模型克服了离线测量工作量大、无法直接得到提取率的测量值等缺点,具有测量精度较高(测量相对误差控制在5%以内)、响应速度快和实时性
介电常数沿不同方向周期性变化的woodpile结构三维光子晶体存在完全带隙,可以实现立体空间中对光的控制传输。鉴于此,采用时域有限差分方法研究了椭圆截面和长方形截面介质柱形
用N2、H2S模拟含硫天然气,研究了常压下超重力反应器中,二乙醇胺(DEA)和N-甲基二乙醇胺(MDEA)溶剂的脱硫性能。分别考察了液量、气速、转速、H2S体积分数以及温度对2种溶剂脱硫性能