面向主题的WWW信息的分类系统的设计与实现

来源 :中国科技信息 | 被引量 : 0次 | 上传用户:sunyulong378
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的不断发展,用户收集和分析与特定主题相关的网页显得越来越困难。谊文提出了面向主题的WWW信息的分类系统(WICS),该系统可以高效地收集网页,然后进行分类,最后将搜索结果呈现给用户。该文在分析典型的搜索引擎的基础上,介绍了Web文本挖掘,并将其应用到系统中。原型系统中使用了文本预处理、索引、倒排文件和向量空间距离测度等技术、算法。初始实验表明,用原型系统进行Web信息分类,为用户获取信息提供了很大的方便,提高了搜索结果的相关性和精确度。
其他文献
我国是一个水资源十分短缺的国家,水危机已成为制约社会经济可持续发展的“瓶颈”,而在我国农村中却存在着水资源短缺和水资源浪费并存现象,为缓解农村用水紧张的状况,在农村中开
以山东省会计从业资格考试会计电算化模块为例,介绍了电算化考试中业务核算部分的学习方法和应试技巧,着重阐述了模拟业务题考试环境进行练习的实现方法、科目初始余额不平衡的
本文主要是针对高压缩比、多级往复式压缩机试运行过程中出现的十字头严重烧结问题进行分析探讨,通过技术改进,使机组在非正常停机状况下,反向角在安全范围内,不致因局部受力过大
提出了一种基于蚁群和柱子群优化的混合算法用来求解TSP问题。利用柱子群优化对基本蚁群算法中启发式因子α及β进行改造和随机搜索,从而得到两个参数的最佳组合值,实现TSP问题