Data Lake是一个集中式存储库。它是一个以原生格式存储各种大型原始数据集的数据库。它允许以任何规模存储所有结构化和非结构化数据。“数据湖”的概念最早是由大数据厂商提出的。从表面上看,所有数据都承载在基于HDFS的廉价存储硬件上,该硬件可以向外扩展。
什么是数据湖?
数据湖的价值一部分是将不同种类的数据聚集在一起,另一部分是在没有预定义模型的情况下分析数据。
今天,商业智能和数据仓库并没有被淘汰,大数据分析和大数据湖正在向更多类型的实时智能服务发展,这些服务可以支持实时决策。
使用数据湖可以在更短的时间内利用更多来源的更多数据,并使用户能够以不同的方式处理和分析数据,从而更好、更快地做出决策。