内容提要

本书在介绍大数据发展背景、特点及主要技术的基础上,对大数据的数据采集、数据存储、常见计算模式进行了分析介绍。本书同时对各种典型系统工具进行了讲解,包括大数据查询分析计算典型工具(HBase、Hive)、批处理计算典型工具(MapReduce、Spark)、流式计算典型工具(Storm、Apex、Flink)、事件流典型工具(Druid)等。

本书提供了大量的实例和源代码供读者参考,指导读者快速、无障碍地了解和掌握常见大数据分析工具。本书适合作为计算机及相关专业的教学用书,也可以作为大数据初学者的自学教材和参考手册。