论文部分内容阅读
提出了一种对专有名词字串进行自动切分的方法,该方法对大量通用形式的专有名词进行统计分析,根据专有名词用字的出现位置和出现次数来分析,并把出现概率转换为估价值。则根据中文专有名词的特点,将中文专有名词的切分问题转换为决策树求最优解问题。采用动态规划法选取最优路径,从而确保结果的整体估价值最优。以中文姓名为例,实验表明该方法具有很快的速度和很高的正确率,用10个名字的字符串进行测试正确率为99.66%以上。