论文部分内容阅读
针对中文命名实体构成的复杂性,提出了一种基于模糊支持向量机的层叠模型。基于最长次长匹配一体化分词标注结果,在底层利用支持向量机基于单字特征进行人名、简单地名和机构名的识别;在高层回到词的层面,利用支持向量机基于词特征对复杂地名和机构名进行识别。通过基于单字和基于词的模糊支持向量机的结合,实现了对命名实体的一体化识别。模糊支持向量机的引入,降低了噪声样本和异常数据的影响,提高了系统识别精度。