どこかに向かうらしい話

迷走エンジニアの放浪記

Python3 de 統計解析 on windows7

はじめに

windows7において、python3を用いた統計解析を行いたい。

mustなパッケージは以下に挙げるもの。

  • numpy
  • scipy
  • pandas
  • matplotlib
  • scikit-learn
  • IPython notebook

mustなパッケージを最もエネルギー使わずに導入を行うための手順をかんたんに記すことにする。

前提

導入するPython3について

numpyをpipコマンドで導入しようとすると、以下のerrorが出力される。

error: Microsoft Visual C++ 10.0 is required (Unable to find vcvarsall.bat).

このerrorを回避しようとすると大変なこと。
32bit版のpythonに対してはnumpyのバイナリが配布されているため、インストールが容易になること。

以上の2点より、32bit版を使うこととする。

また、バージョンに関してはバイナリが配布されている3.4系であれば特に制約がないため、Python3.4の最新版であるPython3.4.3を用いる。

導入

Pythonのインストール

以下のURLよりWindows x86 MSI installerを選択し、バイナリをダウンロードする。 https://www.python.org/downloads/release/python-343/

ダウンロードしたバイナリを用いて、インストールを行う。

numpy/scipyのインストール

以下のサイトより、バイナリをダウンロードする。

なお、本日時点でのバイナリの最新版は、numpy(1.10.2)/scipy(0.16.0)である。

pandas/matplotlibのインストール

numpyさえ入っていれば、pandas/matplotlibはインストール可能。

> pip install pandas
> pip install matplotlib

scikit-learnのインストール

普通にpipでインストール可能。

> pip install scikit-learn

IPython notebookのインストール

普通にpipでインストール可能。

> pip install ipython
> pip install ipython[noteboook]