Hive教程

Hive教程

Hive是一种数据仓库基础架构工具,用于处理Hadoop中的结构化数据.它位于Hadoop之上,用于汇总大数据,并使查询和分析变得简单.

这是一个简短的教程,介绍如何将Apache Hive HiveQL与Hadoop分布式文件系统配合使用.本教程可能是您成为Hiveop成功Hadoop开发人员的第一步.

受众

本教程是为有志于创业的专业人士准备的在使用Hadoop Framework的大数据分析中.一般进入分析的ETL开发人员和专业人员也可以使用本教程取得良好效果.

先决条件

在继续本教程之前,您需要具备核心Java,SQL数据库概念,Hadoop文件系统以及任何Linux操作系统风格的基本知识.