论文部分内容阅读
网络资源的急剧膨胀,使得网络资源的收集整理和分类成为目前数字图书馆领域一个新的课题。如何能够将新兴的跨库检索技术、文本分类技术以及XML技术整合到一起,为数字图书馆的资源收集整理开辟新的方法,是本论文研究的方向。论文主要从系统设计的高度,介绍了网络资源收集分类系统的框架设计,并部分地实现设计思路,论文的创新点在于:利用机器分类和人工审核相结合的方法,运用Lucene索引/检索技术、网页分析技术和SVM文本分类技术,解决目前数字图书馆遇到的信息资源过多、查找困难和分类困难的问题。论文涉及到很多相关理论和知识