HCatalog教程

HCatalog Tutorial

HCatalog是Hadoop的表存储管理工具,它将Hive Metastore的表格数据公开给其他Hadoop应用程序.它使具有不同数据处理工具(Pig,MapReduce)的用户能够轻松地将数据写入网格. HCatalog确保用户不必担心其数据的存储位置或格式.这是一个小教程,仅解释了HCatalog的基础知识以及如何使用它.

Audience

本教程适用于有志制作的专业人士使用Hadoop Framework开展大数据分析.一般进入分析的ETL开发人员和专业人员也可以使用本教程取得良好效果.

先决条件

在继续本教程之前,您需要具备核心Java,SQL数据库概念,Hadoop文件系统以及任何Linux操作系统风格的基本知识.