基于HTML树和模板的文献信息提取方法研究

来源 :计算机应用研究 | 被引量 : 18次 | 上传用户:bohaiyifan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
教师科研文献信息的自动搜集是科研成果有效管理的重要手段,将网页信息的提取方法用于网络数据库中文献信息的自动搜集有广大的应用前景。提出基于DOM树和模板的文献信息提取方法,利用HTML标记间的嵌套关系将Web网页表示成一棵DOM树,将DOM树结构用于网页相似度的度量和自动分类,相似度高的网页应用同一模板进行信息提取。实验结果表明该方法在提取网络数据库中文献信息的准确率在94%以上。
其他文献
SCSG2 0 0 2创建了智能操作的“克隆测绘法” ,介绍了该软件的特点、功能、实用技术。还详细叙述了SCS软件与GTS2 11D全站仪相结合在野外地形及地籍测量中的实际应用方法、操作技巧及应注意的事项。
介绍了苏南、浙江部分地区林业绿化工程、公路景观工程、公园绿化工程、大型行政中心、体育会展中的配套绿化景观工程等不同绿化工程的特点,投资主体、规模,工程发包形式及工程
市场机制与政府行政干预机制分别从微观和宏观两个层面对经济运行进行调控。而道德作为一种内在的经济远行控制机制,解决了市场机制和行政机制所不能解决的问题。文章分析了道
为了掌握拉市海湿地越冬水鸟的种类、数量、区系组成,在东部沿湖设置一条3.5km的观测样线,从2001~2003年进行了3年的观察,共记录到湿地水乌66种,隶属于9目16科.分析了水鸟的区
通过对贵州省贞丰、桐梓、锦屏等若干县市林业生态建设监理、检查、造林实绩核查等工作的实践和研究,认为退耕还林工程与农村经济发展相结合,目前应加强以下工作:选择林业主
云南省退耕还林工程在党中央、国务院和省委、省政府的高度重视和正确领导下,通过各地各有关部门和广大干部群众的共同努力,圆满完成国家下达的退耕还林任务1417.1万亩,工程覆盖1
从转化科技成果,发展优质种苗的目的出发,本着用途的广谱性、市场的需求性、开发潜力的深厚性原则,从赣南树木园内近1 200种树种中优选12个树种作为打造母树林的备选树种,并
对廊坊市河北工业大学等4所高校的校园绿化现状、绿化植物种类、种数、校园绿化树种应用频率和校园群落物种丰富度等进行了调查和统计分析。建议高校校园的绿化应注意提高绿
为了实现脑部多模医学图像配准,提出了一种基于混合优化算法的配准方法。该算法采用遗传算法中的杂交思想改进了混沌粒子群算法,并用最大互信息测度对脑部MRI及CT图像进行配准。该改进算法可有效地避免优化算子陷入局部极值,而且算法收敛快。实验结果证明了提出的基于遗传思想的改进混沌粒子群优化算法对多模医学图像配准具有有效性。
针对带有摄像机的直升机进行静止点目标跟踪的情况,提出了一种层级控制器。该控制器共有三个回路:内回路采用四个独立的PD控制器控制直升机的高度和姿态;中间回路利用两个Mamdani型模糊控制器控制直升机的位置;外回路利用视觉反馈获得直升机下一步的期望位置,其不需要已知摄像机的内参数和平移外参数以及目标点的坐标,只需已知粗略标定的旋转外参数。仿真结果表明了该控制器的可行性。