论文部分内容阅读
针对近年来引起大众广泛关注的食品添加剂问题,以食品包装‘的配料表为数据依据,分析用来话题发现的聚类算法,选定Single-Pass聚类算法作为话题发现的基本算法.并在其基础上,针对Single-Pass算法精度上的不足,利用食品主成分和配料构建双向量来共同表示,提出“代”的概念进一步地提高聚类的精准程度.最后,通过实验证明,该算法在正确率和时间效率上都能满足话题发现的功能.