python中常用的科学计算库

  • NumPy:是Python下科学计算工具包
  • SciPy library:包含一些信号处理、最优化和统计学等方面的工具箱
  • Matplotlib:是用于画图的python库,注意在安装Matplotlib时,要先安装NumPy。在安装完Matplotlib之后,还要再安装dateutil 和 pyparsing
  • Pandas:是python下数据结构分析工具
  • scikit-learn:是python下用于机器学习的工具,里面有svm,神经网络,各种聚类等方法,它要使用NumPy,SciPy和matplotlib,官网上有安装说明。重点关注主页中DocumentUser Guide几乎是machine learning的索引,各种方法如何使用都有,Reference是各个类的用法索引。

对于numpy,scipy,matplotlib,pandas下面是官网上提供的方法,对于不需要的包名,可以删除。

(1)Ubuntu

sudo apt-get install python-numpy python-scipy python-matplotlib ipython ipython-notebook python-pandas python-sympy python-nose

(2)CentOS

sudo yum install numpy scipy python-matplotlib ipython python-pandas sympy python-nose

下面是scikit-learn官网提供的方法,对于已经安装过的依赖项,可以删除。

(1)Ubuntu

先安装依赖项

sudo apt-get install build-essential python-dev python-setuptools \
python-numpy python-scipy \
libatlas-dev libatlas3gf-base

再使用pip安装

pip install scikit-learn

(2)CentOS

先安装依赖项

sudo yum -y install gcc gcc-c++ numpy python-devel scipy

再使用pip安装

pip install scikit-learn
  • scikit-image:里面有常用的图像算法(为SciPy提供的一些图像处理算法)
  • pycv:它是一个由C++和python模块组成的宏包,提供了CV领域一些常用算法,可以看做是OpenCV的增强版,它要安装OpenCV,numpy,scipy等宏包,在网站的安装说明中有介绍。

上面这些库如果每个都使用pip安装,显然要麻烦,幸好网上有将这些库打包发行的科学计算版本,比如Anaconda

Anaconda是一个和Canopy(Enthought Canopy)类似的科学计算环境,但用起来更加方便。自带的包管理器conda也很强大。

Anaconda提供了Python2.7和Python3.4两个版本,同时如果需要其他版本,还可以通过conda来创建。安装完成后可以看到,Anaconda提供了Spyder,IPython和一个命令行。下面来看一下conda。

注意:从网站上下载的Windows版本,可能后缀名是.sh,需要将它改成.exe,就可以双击进行安装,在安装之前要退出360软件,否则该软件在修改注册表信息时会被阻止。

输入conda list来看一下所有安装时自带的Python扩展。如果里面缺少我们需要的包,还可以使用conda install来安装,比如想安装用于爬虫的scrapy,可以使用conda install scrapy,中间会有一步提示,是否继续,输入y,回车,然后会自动进行安装。