论文部分内容阅读
分析了文本学习技术在全文检索系统中的作用,指出文本学习机制的优劣从基础上决定了全文检索系统的性能;从训练文本集的标准化表示、特征子集的抽取、学习算法分析三个方面讨论了文本学习技术的内部机制,介绍了TFIDEF、Bayes、k-Nearest Neighbor和Decision tree等主要学习算法,还列出了一些较有影响的其它算法,并对这些算法进行了经验性比较;介绍了有关实际系统对学习技术的应用情况.