论文部分内容阅读
当前针对中文倾向性分析多照搬英文倾向性分析中的方法;这些方法虽然也取得了一定的效果,但由于它们普遍没有考虑中文的特殊性所以效果提高有限。我们通过对中文句子语义结构进行深入分析提出了基于中文语义结构的中文句子直接态与间接态划分,并给出了一套完整的方法进行直接态和间接态子句抽取。并通过在多个领域中的实验验证直接态和间接态划分对倾向性分析有明显的改进效果。
本文的主要研究内容包括以下几点。首先通过对中文语义结构的研究得出中文句子语义结构的基本形式,并根据中文句子语义结构的基本形式以及这些基本形式与中文倾向性之间的关系提出了句子语义结构的直接态和间接态划分。并建立了各种语义结构形式与直接态和间接态的映射。然后我们给出了一套完整的系统进行中文直接态和间接态子句的抽取,从而把中文句子切分成子句并把其划分为直接态和间接态两类。最后我们把进行直接态和间接态划分应用到中文情感倾向性分析中去;并通过多组对比试验验证这种基于句子语义结构的划分对中文情感倾向性分析任务有很大改进作用。
本文的创新点为:1)把中文语义结构信息用于中文倾向性分析;2)提出了基于中文语义结构的直接态和间接态划分;3)使用标点,连接词,句长等把长句切分成多个有完整意义的子句。4)使用心理动词,起始词语,依存关系等建立一套完整的中文直接态和间接态子句抽取系统。