Apache Spark教程

Apache Spark教程

Apache Spark是一种闪电般快速的集群计算,专为快速计算而设计.它建立在Hadoop MapReduce之上,它扩展了MapReduce模型,以有效地使用更多类型的计算,包括交互式查询和流处理.这是一个简短的教程,解释了Spark Core编程的基础知识.

Audience

本教程是为渴望学习基础知识的专业人士准备的.使用Spark Framework进行大数据分析并成为Spark Developer.此外,它对分析专业人员和ETL开发人员也很有用.

先决条件

在开始继续本教程之前,我们假设您之前已接触过Scala编程,数据库概念以及任何Linux操作系统风格.