大數(shù)據(jù)開發(fā)核心技術(shù) - 大數(shù)據(jù)倉庫Hive精講
hive是基于Hadoop的一個數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供簡單的sql查詢功能,可以將sql語句轉(zhuǎn)換為MapReduce任務(wù)進行
運行。其優(yōu)點是學(xué)習(xí)成本低,可以通類SQL語句快速實現(xiàn)簡單的MapReduce統(tǒng)計,不必開發(fā)專門的MapReduce應(yīng)用,十分適合數(shù)據(jù)倉庫的統(tǒng)計分析。
一、Hive 初識入門 1)Hive功能、體系結(jié)構(gòu)、使用場景 | 二、Hive深入使用 1)Hive中的內(nèi)部表、外部表、分區(qū)表 |
三、Hive高級進階 1)Hive數(shù)據(jù)的存儲和壓縮 | 四、實際案例分析 1)依據(jù)業(yè)務(wù)設(shè)計表 |