Hive技术原理
Hive概述数据仓库的概念:数据仓库(Data Warehouse)是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。
传统数据仓库面临的挑战:
无法满足快速增长的海量数据存储需求。
无法有效处理不同类型的数据。
计算和处理能力不足。
Hive简介:
Hive是一个构建于Hadoop顶层的数据仓库工具,可以查询和管理PB级别的分布式数据。
支持大规模
...