论文部分内容阅读
随着计算机技术的迅速发展和数据库存储数据的大量增长,在各类数据中挖掘信息、知识成为一项重要的研究课题。自动文本分类是一项重要的文本挖掘技术,中文文本的自动分类则是国内的一个研究热点。
军区信访工作是人民军队的一项重要政治工作,军队现代化建设需要提高军区信访工作的自动化程度、智能化水平和工作效率,建设一个高效的军区信访综合管理系统是实现这一目标的有效技术手段之一。
本文讨论了目前的文本挖掘、中文文本自动分类及相关技术,将中文文本自动分类技术应用于军区信访工作的群众来信处理流程中,研究、设计并实现了一套基于中文文本自动分类技术的军区信访信息综合管理系统。
我们通过对中文信息处理和文本挖掘技术的研究,实现了中文文本的分词。采用向量空间模型和TFIDF算法,实现了文本信息的结构化表示。通过采用人工生成的类模板,应用空间向量模型相似度计算空间向量的夹角,最终得到中文文本的分类结果。
本文对中文文本自动分类的各个环节进行了较为深入的研究和讨论,同时介绍了军队信访信息综合管理系统的各个功能模块。信访信息管理系统成功地实现了信访信息管理的自动化,填补了军队的信访信息化建设的空白。