《Spark快速大数据分析》高清中文 英文PDF下载附代码

《Spark快速大数据分析》高清中文 英文PDF下载附代码
Learning Spark: Lightning-Fast Big Data Analysis

本书介绍了Apache Spark,这是一种开源集群计算系统,可以快速编写数据分析并快速运行。使用Spark,您可以通过Python,Java和Scala中的简单API快速处理大型数据集。此版本包含有关Spark SQL,Spark Streaming,设置和Maven坐标的新信息。

这本书由Spark的开发人员撰写,将使数据科学家和工程师立即启动并运行。您将学习如何使用几行代码表达并行作业,并涵盖从简单批处理作业到流处理和机器学习的应用程序。

快速深入了解Spark功能,例如分布式数据集,内存缓存和交互式shell
利用Spark强大的内置库,包括Spark SQL,Spark Streaming和MLlib
使用一种编程范例,而不是混合和匹配Hive,Hadoop,Mahout和Storm等工具

下载地址


提取码: