论文部分内容阅读
非结构化数据的海量增多,为数据的挖掘提供了最好的原料,也给予了充分的挑战。目前,高校数据库里的内容不仅多,而且结构也发生了极大改变,大量的数据是非结构化数据。据统计,全球结构化数据增长速度约为32%,而非结构化数据增速高达63%。这个趋势在高校亦然。对于传统的结构化的数据,由于已经达到一定数量,以关注其应用为主,而对于正在生长的海量非结构化数据,则要关注怎么收集、用什么方式有效管理。“学校正在掌握着越来越多活的数据,这为我们提供了新的方向一一寻找某个规律背后的原因。”相关人士说。