论文部分内容阅读
大数据问题纷繁芜杂,相对应的计算模型和架构万万千千,无法以数据密集型计算一言概之:有的注重体量和水平扩展性(从RDBMS/EDW到MPP到Hadoop),有的偏爱实时或低延迟(从分布式缓存到内存数据库到NoSQL到流式计算),有的强调精确性和一致性(从低活性到高活性,从ACID、CAP~JBASE),有的要求非结构化(schemaless)。那么,是否存在一些有普遍性的计算范式、抽象或模式能分而治之呢?本文试图枚举一些常用的计算范式,讨论它们的分野和交融。