シャッフル分割交差検証（shuffle-split cross-validation）

毎回指定したデータポイント数の訓練セットと、テストセットをデータセットから抜き出し、これを複数回繰り返す。利点訓練セットとテストセットのサイズとは独立して繰り返し回数を制御できる。

k分割交差検証（k-fold cross-validation）

汎化性能を評価する統計的手法データセットをk分割して、それぞれの分割されたデータセットをテストセットして使い、残りのデータセットを訓練セットとして利用する。それぞれの精度を計算する。層化k分割交差検証（stratified k-fold cross-validation）…

訓練セットを用いてモデルを構築し、テストセットを用いて評価する

異なる特徴量を用いた一連のモデルを作る反復する方法は主に以下の2種類まったく特徴量を使わないところから、ある基準が満たされるところまで１つずつ特徴量を加えていく方法すべての特徴量を使う状態から一つずつ特徴量を取り除いて行く方法

教師あり学習モデルを用いて個々の特徴量の重要性を判断し、重要なものだけを残す手法線形モデルの場合・・・係数の絶対値を取り、大きいものを抽出決定木モデルの場合・・・特徴量の重要性の属性を用いて抽出利点すべての特徴量を同時に考慮する

個々の特徴量とターゲットとの間に統計的に顕著な関係があるかどうかを計算する特徴量が多すぎてモデルを作ることができないような場合や多くの特徴量が全く関係ないと思われる場合に有用利点計算が高速モデルを構築する必要がない欠点個々の特徴量を…