基于领域本体的WEB文档正文的抽取算法

来源 :南昌大学学报(工科版) | 被引量 : 0次 | 上传用户:icewangb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过分析当前Web文档抽取的主流方法以及存在的不足,提出了一种基于文本块的改进算法=BWTE(Block-base Web Text Extraction)。该算法首先采用过滤的方法去除广告、超链接等比较明显的噪音信息,然后通过自底向上的文本块分块算法抽取出Web文档的正文。
其他文献
引进集值映射的Set-Benson次梯度,通过一个具体例子说明了它与现有文献中的Benson次梯度的关系。利用集值映射的Hahn-Banach定理证明了Set-Benson次梯度的存在性定理。作为应
物体的惯性参数包括物体质心、惯性矩和惯性积,为了测量任意形状物体的惯性参数,设计和建立了一四簧倒立惯性参数测量试验台。通过测量物体在四簧倒立试验台上的摆动周期和平
引入了随机相容算子、随机序列可交换等一些新的概念,并利用实值比较函数的性质,在Polish空间中研究了满足一定条件下的两个随机相容算子的公共随机不动点,并证明其唯一性,获
<正> 全面建设小康社会,要搞好农村产业结构调整。其重点是要提高全体农民的素质。农民素质不提高,就谈不上农民增收、农村富裕,加快结构调整步伐、实现农村现代化就是一句空
采用固相反应法制备了A位无序掺杂锰氧化物La2/3-xYxCa1/3-ySryMnO3系列样品;利用Rigaku Dmax-rB 12 kW转靶X-ray衍射仪和振动样品磁强计Lakeshore7300对样品进行表征,并通过
针对异型材挤出成型流动过程的特点,基于流变学和流体动力学理论,经合理假设,建立了描述其成型过程的三维等温黏弹性理论模型,并通过DEVSS/SUPG,EVSS法,Mini—Element最小元法和罚函
对先进的气辅共注成型工艺进行了实验研究,系统研究了气体保压时间和气体注射延迟时间对气辅共注成型过程的影响规律,并基于理论分析揭示了其影响机理。研究结果表明:随着气体保
引出含参向量均衡问题的M-适定性和B-适定性,讨论了两种适定性之间的关系.并给出了含参向量均衡问题的M-适定性和B-适定性的充分性条件。
借助非扩张映射不动点的理论,受到Krasnoselskii—Mann迭代格式的启发,提出了从Jacobi迭代法到JOR迭代法一种简单明了的定义方式,并且得到了JOR迭代法收敛的充分条件,给出了相关
对于聚集数据的广义线性模型:Y=Xβ+u,Eu=0,Var(u)=σ2∑,提出了二种有偏估计:岭估计β(k)与改进岭估计β(k)。在均方误差意义下,研究了它们的优良性,并将岭估计与改进岭估计进行了比