我们一直想提高生产率-在相同的时间量内,我们可以完成更多的工作。数据科学研究人员也是如此。设置好硬件之后,就该考虑如何选择启动数据科学项目所需的软件了。问题在于市场上有太多选择,并且出于学习目的,您可能已经尝试过其他工具。换句话说,您的购物清单太长,您可能迷路了,不应该上手。
在本文中,我想分享我认为适合我的数据科学项目需求的组合。当然,对于所有人来说,这都不是一种千篇一律的解决方案。但是,如果您对配置没有任何想法,可能可以先尝试一下。
具体来说,我们将使用三种工具:PyCharm,Anaconda和JupyterLab。我将首先介绍安装过程,然后讨论每个工具的作用。我会尽量简明扼要,因为如果我输入过多的信息,对于初学者来说将是压倒性的。
PyCharm
要安装PyCharm,您可以访问PyCharm网站:https://www.jetbrains.com/pycharm/download/#section=windows。根据您的操作系统,您需要下载正确的版本。我在一家非营利性教育机构工作,因此可以使用专业版。如果您遇到类似情况,则可以利用此好处。但是,如果您主要从事Python开发,则Community版本应该可以正常工作。下载完成后,只需按照提示进行操作即可。
Anaconda
要安装Anaconda,您可以访问Anaconda网站:https://www.anaconda.com/products/individual。对于我们许多人来说,我们只能使用单独的版本。但是团队和企业还有其他版本。这是不同计划比较的链接。 同样,您需要为自己的操作系统选择版本。下载完成后,只需按照提示进行操作即可。
JupyterLab
您实际上并不需要下载JupyterLab的任何东西,因为一旦运行了Anaconda,您就可以在Anaconda中非常方便地访问它,它将为您处理所有安装和其他设置。
PyCharm
Anaconda
JupyterLab
这是一个对我来说一直有效的数据科学项目的典型工作流程。当然,它是我到目前为止讨论的这三种工具的组合。
·END·