论文部分内容阅读
未登录的人名、地名以及机构名的自动识别是中文信息处理中的一个难点,自动识别技术的突破对提高汉语自动切词和句法分析的准确性有很重要的作用。本文基于书面语的特点,在标点符号的启示下,提出一种新的形式化处理策略,即在现代汉语书面语中给人名、地名以及机构名加上专名号,以便于计算机识别,从而通过原始文本的书写改革从根本上彻底解决问题。如能实行,则能一举突破这一难点,召回率和准确率都将能达到100%,而且意义重大,影响深远。