《Spark高级数据分析》高清中文PDF +英文PDF +源代码下载
《Spark高级数据分析》高清中文PDF +英文PDF +源代码下载
在这本实用书的第二版中,四位Cloudera数据科学家提出了一套独立的模式,用于使用Spark进行大规模数据分析。作者将Spark,统计方法和实际数据集结合在一起,教您如何通过示例处理分析问题。针对Spark 2.1进行了更新,此版本作为Spark编程中这些技术和其他最佳实践的介绍。
您将首先介绍Spark及其生态系统,然后深入探讨将常用技术(包括分类,聚类,协同过滤和异常检测)应用于基因组学,安全性和财务等领域的模式。
如果您对机器学习和统计有入门级的了解,并且使用Java,Python或Scala编程,那么您将发现本书的模式对于处理您自己的数据应用程序非常有用。
通过本书,您将:
熟悉Spark编程模型
在Spark生态系统中变得舒适
学习数据科学的一般方法
检查分析大型公共数据集的完整实现
了解哪些机器学习工具对特定问题有意义
获取可以适应多种用途的代码
下载地址
下载地址: