ランダムフォレスト
少しづつ異なる決定木をたくさん集めたもの
過剰適合の度合いを減らすことができる。
利点
非常に強力である
多くの場合、パラメータチューニングが不要
データのスケール変換も不要
欠点
線形モデルよりも多くのメモリを消費し、訓練も予測も遅い
乱数のシードを変更すると構築されるモデルが大きく変わる可能性がある
パラメータ
構築する決定木の数
利用する特徴量の最大数
最大の枝の深さ
少しづつ異なる決定木をたくさん集めたもの
過剰適合の度合いを減らすことができる。
非常に強力である
多くの場合、パラメータチューニングが不要
データのスケール変換も不要
線形モデルよりも多くのメモリを消費し、訓練も予測も遅い
乱数のシードを変更すると構築されるモデルが大きく変わる可能性がある
構築する決定木の数
利用する特徴量の最大数
最大の枝の深さ