《数据科学入门》高清中文、英文PDF电子版+源代码
《数据科学入门》(高清中文PDF+高清英文PDF+源代码)下载
Data Science from Scratch: First Principles with Python
原书价格69元,价格适中。
《《数据科学入门》高清中文、英文PDF电子版+源代码》
略微需要些python基础,前面讲的比较简单,越讲越有深度。
这是一本很好的书——写得好,容易消化,内容丰富。许多在数据挖掘和统计分析领域工作了多年的都在推荐这本数据科学入门书;这本书可能是我在Python简介中见过的最好的开始和运行
此书内容覆盖面很全,作者也很有幽默感(确实是数据科学家的幽默感)能引起观众的共鸣。
这本书主要涵盖了三方面,覆盖了数据科学家的基本低级工具(“从头开始”部分),为Python新手提供了有用的Python编程示例的大概介绍,并且给出了数据科学。
起初,我很担心这本书的前几章,原因之一是作者在整个课文中都开玩笑,我想如果它跟上书的其余部分,我会非常难过。但这并没有发生,而且事实证明,这是一个非常合理的方法来轻松地进入这个复杂的主题。
作者逐章通过数据科学家的工具箱,给出每个主题的有用、有见地、清晰的代码片段和文本解释。因此,对于那些刚刚接触数据科学的人来说,它刚好足以从代码和数学解释的角度获得概念的基本概念,然后继续下一个主题。
人们常说,在写作中,越少越好,这本书把事情归结为它们的本质。这是本书最棒的一点之一——每章的长度大约是20页(超过25章)。所以每个章节都可以阅读,代码甚至在一个小时内就可以运行。此外,每章末尾的参考资料邀请读者在一本或多本完整的教科书或参考文献的层次上扩展信息。因此,这本书可以看作是将25卷高技术性的主题内容浓缩成大约300页。
被探讨得最好的主题似乎是关于概率、处理数据、回归、集群和数据库(SQL)的主题。一些小而密集的代码样本很难遵循,但是这是基于它们的算法复杂性——比如逻辑回归和MapReduce。偶尔作者会使用未定义或索引中的术语(比如数据mung——我仍然没有查找过它的含义)。只有少量的拼写错误,显示出良好的编辑效果。虽然Python速成课程非常好,但是Python是一门庞大的语言,本节可能还有更多内容。
我从头到尾地读了这本书,并且从逻辑上完成了所有的代码(但是实际上没有运行任何代码),并且我衷心地推荐这本书给任何想在数据科学领域或相关领域(如大型数据工程或数据分析)工作的人。
另外读完这本书可以再试试读如Brian D.Ripley的《模式识别和神经网络》
下载地址
下载地址: