Spark介绍和集群模式搭建

Spark介绍和集群模式搭建

Spark简介 什么是Spark? Apache Spark是由加州伯克利分校AMP实验室开发的通用大数据处理框架。Spark提供了大数据处理的一站式解决方案,以Spark Core为基础推出了Sp...
Hive的内部表和外部表

Hive的内部表和外部表

Hive是Hadoop生态圈中实现数据仓库的一项技术。虽然Hadoop和HDFS的设计局限了Hive所能胜任的工作,但是Hive仍然是目前互联网中最适合数据仓库的应用技术。 不论从“品...