Python3 de 統計解析 on windows7
はじめに
windows7において、python3を用いた統計解析を行いたい。
mustなパッケージは以下に挙げるもの。
- numpy
- scipy
- pandas
- matplotlib
- scikit-learn
- IPython notebook
mustなパッケージを最もエネルギー使わずに導入を行うための手順をかんたんに記すことにする。
前提
導入するPython3について
numpyをpipコマンドで導入しようとすると、以下のerrorが出力される。
error: Microsoft Visual C++ 10.0 is required (Unable to find vcvarsall.bat).
このerrorを回避しようとすると大変なこと。
32bit版のpythonに対してはnumpyのバイナリが配布されているため、インストールが容易になること。
以上の2点より、32bit版を使うこととする。
また、バージョンに関してはバイナリが配布されている3.4系であれば特に制約がないため、Python3.4の最新版であるPython3.4.3を用いる。
導入
Pythonのインストール
以下のURLよりWindows x86 MSI installer
を選択し、バイナリをダウンロードする。
https://www.python.org/downloads/release/python-343/
ダウンロードしたバイナリを用いて、インストールを行う。
numpy/scipyのインストール
以下のサイトより、バイナリをダウンロードする。
なお、本日時点でのバイナリの最新版は、numpy(1.10.2)/scipy(0.16.0)である。
- numpy(1.10.2) http://sourceforge.net/projects/numpy/files/NumPy/1.10.2/numpy-1.10.2-win32-superpack-python3.4.exe/download
- scipy(0.16.0) http://sourceforge.net/projects/scipy/files/scipy/0.16.0/scipy-0.16.0-win32-superpack-python3.4.exe/download
pandas/matplotlibのインストール
numpyさえ入っていれば、pandas/matplotlibはインストール可能。
> pip install pandas
> pip install matplotlib
scikit-learnのインストール
普通にpip
でインストール可能。
> pip install scikit-learn
IPython notebookのインストール
普通にpip
でインストール可能。
> pip install ipython
> pip install ipython[noteboook]