论文部分内容阅读
文木数据挖掘是通过机器学习、自然语言处理和推理分析等方法。根据文本内容完成信息抽取、关系发现、热点预测、文本分类和自动摘要等具体任务的信息处理技术。随着互联网和移动通信技术的快速发展和普及应用,这项技术已在众多领域得到了广泛应用。本书旨在全面介绍与文本数据挖掘相关的基本概念、理论模型和实现算法,内容覆盖数据预处理、文本表示、文本分类、文本聚类、主题模型、情感分析与观点挖掘.话题检测与跟踪、信息抽取以及文本自动摘要等,以期帮助广大对文本数据挖掘感兴趣的科研技术人员快速掌握相关技术。