论文部分内容阅读
随着互联网的快速发展,并且具有传播速度快、受众面广、而且难以控制等特点,发布到互联网上的一些现实世界中的问题很容易引起舆论的强大压力。这就要求互联网组织者进行及时适当的回应和疏导。当前国内外对于引导内容生成方面主要使用传统的人工操作方式进行,这种方式不仅速度慢,而且成本也相对较高。为了解决这些问题,本文提出了基于语境与情感倾向的引导内容辅助生成系统,并综合规划了系统的总体架构,将系统分为三个模块:语料导入模块、辅助人工生成模块和自动生成模块。详细设计了每个模块的关键技术环节,形成了一个完整的引导内容辅助生成系统。本文所作的研究工作和成果如下:(1)以现有描述文本为基础,借鉴情感分类技术并分析句子上下文关系来挖掘其中蕴含的书写模式,通过基于机器翻译的句子改写技术实现辅助内容的生成。以此为基础,对系统进行了总体设计。(2)对支持向量机(SVM)分类算法进行了深入研究,针对实际文本分类中存在的由于文档在类别层次上的不均匀分布产生的过拟合问题,提出了基于类别层次自适应的分类算法,并将其应用于情感倾向分类中。(3)对常用的聚类算法做了较详细的比较分析,针对在系统中的实际聚类需求,适当简化与改进了DBScan聚类算法,并将其应用于句子和单词的聚类中。(4)提出了SPG改写模型,将句子改写方法细化为三步:句子预处理、改写计划、改写生成。并在此基础上实现了该方法。(5)设计实现了基于语境与情感倾向引导内容辅助生成系统,给用户提供了自动生成与辅助人工生成两种方式进行辅助决策。