论文部分内容阅读
在数据分析行业,大致的统计是,世界上约80%的数据都是非结构化数据。此前,数据分析对象绝大部分是结构化数据,比如姓名、性别、年龄这些信息,可以以Word,Excel等形式呈现的数据。而非结构化数据是更加"莫可名状"的:它们通常藏在我们的聊天记录、邮件、发布的图片、语音以及视频中。在中美两国科技界对未来技术的甄选中,大数据分析通常位列其中,而非结构化数据又被认为是大数据产