R数据科学 中英文pdf 下载
《R数据科学》高清中文版PDF 下载
R for Data Science: Visualize, Model, Transform, Tidy, and Import Data 高清英文版PDF 下载
《R数据科学》源代码 下载
Wickham和Grolemund编写了一本优秀的书,可以帮助初级R用户在解释性分析中变得非常有效。不出所料,他们阐述的方法利用了“hadleyverse”包的集合(用于可视化的ggplot2,用于重塑的tidyr,用于选择和过滤的dplyr,用于函数编程的purrr,用于线性模型的扫描等),这大大加快了大多数常见步骤参与分析。威克姆参与这些方案的一个好处就是它背后的连贯哲学。学习这一理念可能有点棘手,但长期效益是巨大的。
本书分为若干部分,有效地建立了摄取,转换,可视化和建模数据集的能力。本书的很大一部分都有在线版本,可以让您体验它的编写方式。许多人一直在关注它。我把这本书的副本传给了刚刚开始的一些同事,而且反应一直是积极的。在我自己的情况下,我熟悉一些这些包; ggplot2,dplyr,tidyr,但发现这本书告诉我purrr以及如何更好地使用这些包。
可能我对读者的两个最大的警告是,有些情况下可能需要来自“hadleyverse”之外的包裹。作者非常好地指出了这一点,但是根据我的经验,我确实需要知道data.table和lattice。两者都是因为它们偶尔可以更好地解决问题,但也因为你不可避免地会遇到使用这些软件包的其他人的代码。另一个警告是,建模有点简陋。大多数例子只是拟合独立的回归模型,而在我看来,分层模型更适合。这些都是小事情,期望一本书涵盖所有这些领域是愚蠢的。
简而言之,这是我给那些热衷于学习如何使用R进行数据科学的人的书。如果您只需要提醒某个特定的软件包(那里的元数据和数据框之间有什么区别?),它会很好地构建不同的组件,同时仍然是一个有价值的参考。虽然本书的很大一部分都可以在网上找到,但是在书架上(数字或其他方面)放置完整的东西是非常值得的。与Max Kuhn(与Kjell Johnson一起出色的“应用预测模型”的作者)加入Wickham和Grolemund在RStudio的广泛关注,这是开始你的R之旅的好时机。
下载地址
下载地址: