Python数据科学手册
如何使用这本书
-
使用此存储库的笔记本目录中的Jupyter笔记本运行代码。
-
使用Google Colab启动这些笔记本的可执行版本:
-
使用活页夹使用这些笔记本启动实时笔记本服务器:
关于
该书是使用Python 3.5编写和测试的,尽管其他Python版本(包括Python 2.7)几乎可以在所有情况下使用。
本书介绍了使用Python处理数据必不可少的核心库:特别是IPython,NumPy,Pandas,Matplotlib,Scikit-Learn和相关软件包。
假定熟悉Python语言。如果您需要对语言本身的快速介绍,请参阅免费的伴随项目
“旋风Python之旅”:这是针对研究人员和科学家的Python语言的快速入门。
软件
本书中的代码已经过Python 3.5的测试,尽管大多数(但不是全部)也可以在Python 2.7和其他旧版本的Python上正常工作。
我用来运行本书中代码的软件包列在requirements.txt中(请注意,其中某些确切的版本号可能在您的平台上不可用:您可能需要对其进行调整才能自己使用)。
要使用conda安装要求,请在命令行中运行以下命令:
$ conda install --file requirements.txt
要创建PDSH
以Python 3.5和所有必需的软件包版本命名的独立环境,请运行以下命令:
$ conda create -n PDSH python=3.5 --file requirements.txt
您可以在conda文档的“ 管理环境”部分中阅读有关使用conda环境的更多信息。