2クラス分類における基準

2クラス分類

陽性(Positive)・・・ターゲットとなるクラス

陰性(Negative)

 

混合行列

2クラス分類の評価結果を表現する方法で以下の4つに分類される

真陽性(True positive)・・・・正しい陽性の判断 TPとも呼ばれる

偽陽性(False positive)・・・間違った陽性の判断 FPやタイプⅠエラーとも呼ばれる

真陰性(True negative)・・・正しい陰性の判断 FNとも呼ばれる

偽陰性(False negative)・・・間違った陰性の判断 FNやタイプⅡエラーとも呼ばれる

 

評価結果の表現方法

精度(Accuracy)

テストセットに対して正しいクラス分類を行ったかの割合を表現している。

偏ったデータセットに対しては、誤った認識を行う可能性がある。

精度=(TP+TN)/ (TP + TN + FP + FN)

 

適合率(Precision)

陽性と判断されたものがどのくらい実際に陽性であったかを表現している

偽陽性の数を制限したい場合の性能基準

適合率 = TP / (TP + FP)

PPV(positive predictive value:陽性的中率)とも呼ばれる。

 

再現率(Recall)

実際に陽性であったものがどれらく陽性と判断されたかを表現している

偽陰性の数を制限したい場合の性能基準

再現率= TP / (TP + FN)

感度(Sensitivity)、ヒット率(hit rate)、真陽性率(True positive rate : TPR)とも呼ばれる。

 

F-値(f-measure)

適合率と再現率をまとめて表現している

F = 2 * (適合率 * 再現率) / (適合率 + 再現率)

 

適合率-再現率カーブ

すべての可能なスレッショルドを変動させて、適合率と再現率の軸でプロットしたもの

 

平均適合率(average precision)・・・適合率-再現率カーブの下の領域を積分した値

 

ROCカーブ(receiver operating characteristics curve)

すべての可能なスレッショルドを変動させて、偽陽性率と真陽性率の軸でプロットしたもの

AUC(area under the curve)・・・ROCカーブの下の領域を積分した値、ランダムに予測するクラス分類機で常に0.5、偏ったクラス分類問題を評価するときに良い

 

 

 

グリッドサーチ(grid search)

パラメータをチューニングしてモデルの汎化性能を向上させる方法の一つ

 

パラメータのすべての組み合わせに対して試してみる方法

 

単純なグリッドサーチ

すべてのパラメータに対して単にループしてチューニングする方法

データセットを訓練セット、検証セット、テストセットに3分割し、チューニングには訓練セットと検証セットのみを用いる。

 

交差検証を用いたグリッドサーチ

すべてのパラメータに対して交差検証を行ってチューニングする方法

非常に時間がかかる

k分割交差検証 (k-fold cross-validation)

汎化性能を評価する統計的手法

 

データセットをk分割して、それぞれの分割されたデータセットをテストセットして使い、残りのデータセットを訓練セットとして利用する。

それぞれの精度を計算する。

 

層化k分割交差検証(stratified k-fold cross-validation)・・・分割された各データ内のクラスの比率が全体の比率と同じになるように分割する

 

1つ抜き交差検証(leave-one-out)・・・k分割交差検証の個々の分割が1サンプルしかないもの

 

利点

すべてのデータが1度だけテストに用いられる。

データをより効率的に使える

 

欠点

計算コストが高い

反復 選択(iterative selection)

異なる特徴量を用いた一連のモデルを作る

 

反復する方法は主に以下の2種類

  • まったく特徴量を使わないところから、ある基準が満たされるところまで1つずつ特徴量を加えていく方法
  • すべての特徴量を使う状態から一つずつ特徴量を取り除いて行く方法

モデルベース選択(model-based selection)

教師あり学習モデルを用いて個々の特徴量の重要性を判断し、重要なものだけを残す手法

 

線形モデルの場合・・・係数の絶対値を取り、大きいものを抽出

決定木モデルの場合・・・特徴量の重要性の属性を用いて抽出

 

利点

すべての特徴量を同時に考慮する