大數據開發核心技術 - 大數據倉庫Hive精講
hive是基于Hadoop的一個數據倉庫工具,可以將結構化的數據文件映射為一張數據庫表,并提供簡單的sql查詢功能,可以將sql語句轉換為MapReduce任務進行
運行。其優點是學習成本低,可以通類SQL語句快速實現簡單的MapReduce統計,不必開發專門的MapReduce應用,十分適合數據倉庫的統計分析。
一、Hive 初識入門 1)Hive功能、體系結構、使用場景 | 二、Hive深入使用 1)Hive中的內部表、外部表、分區表 |
三、Hive高級進階 1)Hive數據的存儲和壓縮 | 四、實際案例分析 1)依據業務設計表 |