论文部分内容阅读
用形式概念分析理论描述了案例库和待诊病人症状,系统由实际的案例库生成知识库,然后通过计算待诊病例到病历库各类病例间的距离来获得初步诊断。重点研究了病历文本的症状特征提取,通过对互信息和χ2统计的研究,根据其各自的缺陷,提出了一种新的病历文本特征提取算法。通过此算法可以提取出更具代表性的病历特征项。以及针对病历文本聚类所面临的维数高、稀疏向量等问题,提出了一种基于概念格的病历文本聚类算法,且该算法不需要评价函数。