论文部分内容阅读
城市数据种类多、涉及领域广,但数据维度较高,且数据分类分级不具备成熟、明确的标准,高价值数据安全保护强化亟待推进.提出一种基于深度学习聚类算法的城市数据分类分级方法.采取先人工、后智能的路径,在早期的数据训练集中,对各数据资源的字段信息进行人工分词、标注,形成数据分类分级词库、语料库、规则库以及模型库;利用规则引擎实现初步的城市数据分类分级,再结合自然语言处理(NLP)等深度学习聚类算法,实施持续的迭代训练和学习,助力机器自动发现高价值或敏感数据,实现城市数据分类分级的自动化、智能化,对进一步促进城市数据开放共享起到了深远作用.