网页信息块相关论文
本文对Web信息检索领域中的若干技术开展了研究,主要工作包括以下几个方面:文档聚类技术的研究。本文提出了一种平面-层次式的文档聚......
针对新闻网页文本处理问题,提出了一种基于决策树抽取新闻标题并利用单元距离识别正文的方法.该方法将文本相似度、网页标记和属性......