モデルの評価モジュールのsklearn.metrics

scikit-learnには、作成したモデルの評価を行うモジュールとしてsklearn.metricsが搭載されています。 今回はsklearn.metricsをまとめた話をしていきます。

https://scikit-learn.org/stable/modules/classes.html

目次

1. sklearn.metricsモジュール
2. モデル選択インターフェース
3. 分類のメトリック
4. 回帰のメトリック
5. マルチラベルランキングのメトリック
6. クラスタリングのメトリック
7. バイクラスタリングのメトリック
8. ペアワイズのメトリック

 

1. sklearn.metricsモジュール

sklearn.metricsモジュールには、スコア関数、パフォーマンスメトリック、ペアワイズメトリック、および距離計算が含まれます。

2. モデル選択インターフェース

metrics.check_scoring(estimator [、scoring、…])ユーザーオプションからスコアラーを決定します。
metrics.get_scorer(スコアリング)文字列からスコアラーを取得します。
metrics.make_scorer(score_func [、…])パフォーマンスメトリックまたは損失関数からスコアラーを作成します。

3. 分類のメトリック

クラス分類 (Classification) を行った際の識別結果 (予測結果) の精度を評価するモジュールを実装します。

metrics.accuracy_score(y_true、y_pred [、…])精度分類スコアです。
metrics.auc(x、y [、reorder])trapezoidal ruleを使用したArea Under the Curve(AUC)。
metrics.average_precision_score(y_true、y_score)予測スコアから平均精度(AP)
metrics.balanced_accuracy_score(y_true、y_pred)バランスの精度
metrics.brier_score_loss(y_true、y_prob [、…])ブライアースコア
metrics.classification_report(y_true、y_pred)主な分類指標を示すテキストレポートを作成します。
metrics.cohen_kappa_score(y1、y2 [、labels、…])Cohen’s kappa:アノテーター間の合意を測定する統計指標です。
metrics.confusion_matrix(y_true、y_pred [、…])分類の精度を評価するために混同行列
metrics.f1_score(y_true、y_pred [、labels、…])F1スコアを計算します。バランスFスコアまたはFメジャー
metrics.fbeta_score(y_true、y_pred、beta [、…])F-betaスコアを計算します。
metrics.hamming_loss(y_true、y_pred [、…])平均ハミング損失を計算します。
metrics.hinge_loss(y_true、pred_decision [、…])平均ヒンジ損失(非正規化)
metrics.jaccard_score(y_true、y_pred [、…])Jaccard類似度係数スコア
metrics.log_loss(y_true、y_pred [、eps、…])ログロス、別名ロジスティックロスまたはクロスエントロピーロス
metrics.matthews_corrcoef(y_true、y_pred [、…])マシューズ相関係数(MCC)を計算します。
metrics.multilabel_confusion_matrix(y_true、…)各クラスまたはサンプルの混同行列を計算します。
metrics.precision_recall_curve(y_true、…)さまざまな確率しきい値の精度とリコールのペアを計算します。
metrics.precision_recall_fscore_support(…)各クラスの精度、リコール、Fメジャー、サポートを計算します。
metrics.precision_score(y_true、y_pred [、…])精度を計算します。
metrics.recall_score(y_true、y_pred [、…])リコールを計算します。
metrics.roc_auc_score(y_true、y_score [、…])予測スコアから受信者動作特性曲線下面積(ROC AUC)を計算します。
metrics.roc_curve(y_true、y_score [、…])レシーバー動作特性(ROC)の計算します。
metrics.zero_one_loss(y_true、y_pred [、…])ゼロ1分類損

4. 回帰のメトリック

回帰モデル (Regression model) の予測精度を評価するモジュールを実装します。

metrics.explained_variance_score(y_true、y_pred)説明された分散回帰スコア関数
metrics.max_error(y_true、y_pred)max_errorメトリックは最大残留誤差を計算します。
metrics.mean_absolute_error(y_true、y_pred)平均絶対誤差回帰損失
metrics.mean_squared_error(y_true、y_pred [、…])平均二乗誤差回帰損失
metrics.mean_squared_log_error(y_true、y_pred)平均二乗誤差回帰損失
metrics.median_absolute_error(y_true、y_pred)絶対誤差の中央値回帰損失
metrics.r2_score(y_true、y_pred [、…])R2(決定係数)回帰スコア関数。

5. マルチラベルランキングのメトリック

metrics.coverage_error(y_true、y_score [、…])カバレッジエラー測定
metrics.label_ranking_average_precision_score(…)ランキングベースの平均精度
metrics.label_ranking_loss(y_true、y_score)ランキング損失測定

6. クラスタリングのメトリック

クラス分類 (Classification) を行った際の識別結果 (予測結果) の精度を評価するモジュールを実装します。

metrics.adjusted_mutual_info_score(…[、…])2つのクラスタリング間の相互情報を調整しました。
metrics.adjusted_rand_score(labels_true、…)偶発的に調整されたランドインデックス。
metrics.calinski_harabasz_score(X、labels)CalinskiおよびHarabaszスコアを計算します。
metrics.davies_bouldin_score(X、labels)デービス・ボールディンのスコアを計算します。
metrics.completeness_score(labels_true、…)グラウンドトゥルースが与えられたクラスターラベルの完全性メトリック。
metrics.cluster.contingency_matrix(…[、…])ラベル間の関係を記述するコンティンジェンシーマトリックスを作成します。
metrics.fowlkes_mallows_score(labels_true、…)ポイントのセットの2つのクラスタリングの類似性を測定します。
metrics.homogeneity_completeness_v_measure(…)均一性と完全性、V-Measureスコアを一度に計算します。
metrics.homogeneity_score(labels_true、…)グラウンドトゥルースが与えられたクラスターラベリングの均一性メトリック。
metrics.mutual_info_score(labels_true、…)2つのクラスタリング間の相互情報。
metrics.normalized_mutual_info_score(…[、…])2つのクラスタリング間の正規化相互情報。
metrics.silhouette_score(X、labels [、…])すべてのサンプルの平均シルエット係数を計算します。
metrics.silhouette_samples(X、labels [、metric])各サンプルのシルエット係数を計算します。
metrics.v_measure_score(labels_true、labels_pred)グラウンドトゥルースが与えられたVメジャークラスターのラベル付け。

7. バイクラスタリングのメトリック

metrics.consensus_score(a、b [、類似性])2データセットのバイクラスタリングの類似性。

8. ペアワイズのメトリック

サンプルセットのペアワイズ距離または親和性を評価するためのユーティリティを実装します。

metrics.pairwise.additive_chi2_kernel(X [、Y])XとYの観測値間の加法カイ2乗カーネルを計算します。
metrics.pairwise.chi2_kernel(X [、Y、gamma])指数カイ二乗カーネルXおよびYを計算します。
metrics.pairwise.cosine_similarity(X [、Y、…])XとYのサンプル間のコサイン類似度を計算します。
metrics.pairwise.cosine_distances(X [、Y])XとYのサンプル間のコサイン距離を計算します。
metrics.pairwise.distance_metrics()pairwise_distancesの有効なメトリック。
metrics.pairwise.euclidean_distances(X [、Y、…])X(およびY = X)の行をベクトルと見なし、ベクトルの各ペア間の距離行列を計算します。
metrics.pairwise.haversine_distances(X [、Y])XとYのサンプル間のHaversine距離を計算します。
metrics.pairwise.kernel_metrics()pairwise_kernelsの有効なメトリック。
metrics.pairwise.laplacian_kernel(X [、Y、gamma])XとYの間のラプラシアンカーネルを計算します。
metrics.pairwise.linear_kernel(X [、Y、…])XとYの間の線形カーネルを計算します。
metrics.pairwise.manhattan_distances(X [、Y、…])XとYのベクトル間のL1距離を計算します。
metrics.pairwise.pairwise_kernels(X [、Y、…])X配列とオプションの配列Yの間のカーネルを計算します。
metrics.pairwise.polynomial_kernel(X [、Y、…])XとYの間の多項式カーネルを計算します。
metrics.pairwise.rbf_kernel(X [、Y、gamma])XとYの間でrbf(ガウス)カーネルを計算します。
metrics.pairwise.sigmoid_kernel(X [、Y、…])XとYの間のシグモイドカーネルを計算します。
metrics.pairwise.paired_euclidean_distances(X、Y)XとYの間のペアのユークリッド距離を計算します。
metrics.pairwise.paired_manhattan_distances(X、Y)XとYのベクトル間のL1距離を計算します。
metrics.pairwise.paired_cosine_distances(X、Y)XとYの間のペアのコサイン距離を計算します。
metrics.pairwise.paired_distances(X、Y [、metric])XとYの間のペアの距離を計算します。
metrics.pairwise_distances(X [、Y、metric、…])ベクトル配列XとオプションのYから距離行列を計算します。
metrics.pairwise_distances_argmin(X、Y [、…])1点と一連の点の間の最小距離を計算します。
metrics.pairwise_distances_argmin_min(X、Y)1点と一連の点の間の最小距離を計算します。
metrics.pairwise_distances_chunked(X [、Y、…])オプションの縮小を使用して、チャンクごとに距離行列を生成します。