10本书让你成为数据分析大佬


推荐下数据分析的10本书,从入门到高级进阶,读完你就是数据分析大佬了?

一、入门部分

(1)《深入浅出数据分析》(Head First Data Analysis) 这是无数人推荐的基础入门书,我觉得认字就能读懂。读懂就能理解上手。这是你开始数据分析的基础,是你开始数据分析思维的开始,他将会知道你走进数据、理解数据。对于将来更好运用数据思维有超大帮助。基础必读。 (2)《资料之美:优雅资料解决方案的幕后秘籍》(Beautiful Data: The Stories Behind Elegant Data Solutions) 这本书还是很艺术的,绝对不会让你感到这是很难啃的一本书,同样的这本书的知识结构依然很浅显,不过也已经脱离了基本的概念叙述,有了一定的代码编写需要,大概就是“Hello world”这种开始,不会感到吃力。这本书的站位已经是一个数据工程师,思维角度已经脱离最基本的入门理解。相信读完此书会在入门的基础上有进一步提升。 (3)《赤裸裸的统计学》(Naked Statistics: Stripping the Dread from the Data) 这本书的副标题:是除去大数据的枯燥外衣,呈现真实的数字之美,一般一本书加上xx学都是十分恢弘与学术枯燥的。但是当xx学前面再加一个无厘头的赤裸裸时,你就知道这本书绝不是真正的学术用书,不过这并不代表此书不具备学术价值,因为本书所要表达的就是将枯燥的学术统计进行简单的概述,将其变为更为平易近人的语言让你理解,从这里就可以看出这是一般站在巨人肩膀上的书,而此书却并不是那么不容易攀登。反而浅显易读。是为数据分析打下坚实基础的必备知识。 (4)《深入浅出统计学》(Head First Statistics) 实际上这本书依然很入门,但是与上一本有部分重叠,并且由于这本是更厚一些,内容更丰富以下,因此放在《赤裸裸的统计学》的后面。这本书简直是百科全书,科普巨作,甚至你都觉得作者啰嗦,明明你所一句我就读懂了,但是作者就是好像怕你不懂。也正因为此,读起来一点不吃力。

二、中极部分

(1)《R语言实战》(R in Action) 上面几本书理解了数据、理解了数据结构分析,站位角度有了全新认知,但距离一个基本合格的数据分析大佬依然不够,最少最少也要掌握了《R语言实战》这本书才算真正入门了。从这本书开始才叫进入了真正的数据,也就是大数据。但在大数据以及R语言中此书依然是入门浅显易懂的。如果可以也行事先补充下R语言的基础知识,然后再读此书,本本书较为全面的介绍了R语言的基本原理与运行构造。具有较高的可操作性,是你进入大数据海洋遨游所必须的游泳技能。 (2)《利用Python进行数据分析》(Python for Data Analysis) 如果你是按照上面书单一点点学过来,这本书似乎很突兀,如果一点python语言不懂,这就尴尬了。好像突然没法进行了。我擦什么是python、为什么要用python来做数据处理。 Python库又是什么鬼,不过我觉得你既然要想成为数据分析大佬了,不能只嘴上说说而不动真格的吧。现在就拿起这本书吧,他不会令你失望。实际上你只要翻一番python的手册这本书就容易啃了,而且是一不小心就吃个小胖子,因为稍有基础你就能完全理解作者所讲,并且此书配备了超多实例,非常容易上手,按着敲敲代码,瞬间自信心爆棚,我擦,我马上就是牛x的数据分析大佬了。 (3)《MySQL必知必会》(MySQL Crash Course) 数据没有存储是没有灵魂的。毫无疑问MySQL不是最好的数据库也是最好的之一,这本书学会了再加上上面的积累,可以说能开始做项目了,是不是有点激动,当然做一个完备的项目这些还是远远不够的。只能说这本书带给你更多个可能,即便是之前你对MySQL并没有什么概念,也很容易拿起来。掌握起来也不是特别难,因为书中内容介绍还是很通俗的并且基础性介绍很全面。在未来的数据使用中数据库是一个必备选项,因此必须做好扎实的基本功,相信这本书能为你做到。

三、高级部分

(1)《精益数据分析》(Lean Analytics:Use Data to Build a Better Startup Faster) 这本书已经基本上不在浅显的介绍概念性的东西,都是直接上手了,而且书中几乎全是案例,大量的实例性代码,让你在各种环境各种配置各种条件中训练更高级的水平。这本书是需要仔细读的,是需要慢慢读的,因为很多东西你读过去一遍好像学到了一点东西,但实际上你并没有全部掌握,再来一遍,再读一遍收获会比前一遍更多。本书的前一部分真的十分推荐太棒了,至于商业模式部分(第2、3部分)比较难读,假设你无所畏惧,或者你认为能跟着思路走你就深入去学,可以学到不少东西。实在学不进去也不必强求。 (2)《ggplot2:数据分析与图形艺术》(Ggplot2. elegant graphics for data analysis) 从R语言角度讲,这还并不是一本多么高级的书,但是应用在数据分析上已经足够。书中例子很多,代码也很实用,这边主要说这本书的数据分析部分,ggplot2是一个十分强大的可视化R包,做数据分析不能仅仅停留在数字上,要让人易懂,让人看的更舒服,之前都是真正的数据,要让数据可视化,让数据真正看起来能提供出有价值的信息。这本书会交给你怎么做。 (3)《数据科学实战》(Doing Data Science) 实战!实战!实战!学会了知识怎么才算会了,当然是实战!从目录中就能看出这本书太贴合实际了,第三章垃圾邮件过滤、朴素贝叶斯和数据清理。哈哈哈。还能在贴合实际吗,书中还有数据可视化、社交、数据工程、MapReduce、Pregel和Hadoop等。这里面很多东西都不是说一看就知道的,你必须又一定的相关基础知识。首先数理基础得有,统计学要懂,单单一个 data science就够一般人啃一阵的。算法干货巨多,另外,建议直接读英文原本。 综上,看完上面这一堆书,你果然有了很牛x的知识储备,不过,不过,醒一醒,别相信本文标题,你离数据分析大佬还有很远的距离。。。很远。。。