论文部分内容阅读
随着互联网技术的不断发展,网络日益成为人们工作和生活中获取信息的重要来源。但是,由于web的外放性和异构性,使得用户很难从纷繁复杂的海量信息中快速找到对自己有价值的信息。本文将中文分词特征提取思想与文本分类算法相结合,通过对概率模型的改进,提出了基于Web的信息检索模型,并将其应用到石油安全生产信息检索中。通过用已知样本进行训练,确定每类的阈值,实现了对石油安全生产相关文档的分类。