论文部分内容阅读
文本挖掘是从非结构化的文本中发现潜在的概念以及概念间的相互关系。文本的特征是概念的表现形式,特征抽取是文本挖掘的必要基础。鉴于中文文本的特点,该文提出了基于结合性的中文姓名识别方法、数字特征的转换以及基于模糊语义的表示和检索。它们具有较强的适应性和良好的反映能力,不依赖于具体的领域知识。