Python/scikit-learn のバックアップ(No.1)


scikit-learn のメモ

インストール

pipを使う場合、コンソールもしくはコマンドプロンプトで

pip install -U scikit-learn

condaを使える場合

conda install scikit-learn

version

Scikit-learn 0.162015 04/15
Scikit-learn 0.172015 11/05
Scikit-learn 0.18.22017 06/28
Scikit-learn 0.19.22018 07/27
Scikit-learn 0.20.02018 09/27

基本的な書き方

from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix

estimator : 分類器を代入
train_data = 訓練のためのデータ
train_label = 訓練データと同じ順番の正解ラベル
test_data = テストのためのデータ
test_label = テストのための正解ラベル

estimator.fit(train_data, train_label)
pred_list = estimator.predict(test_data)
rate = accuracy_score(test_label, pred_list)
conf_matrix = confusion_matrix(test_label, pred_list)

このとき、pred_listが分類結果、rateが正答率、conf_matが混同行列になる。

importを認識しない

scikit-learnは

import sklearn

と書いても認識しない仕様となっております。よって、

from sklearn.ensemble import RandomForestClassifier

のように、使いたい機能を指定してimportしましょう。

ランダムフォレスト

from sklearn.ensemble import RandomForestClassifier