Etsukunの日記

ランダムフォレスト

少しづつ異なる決定木をたくさん集めたもの

過剰適合の度合いを減らすことができる。

利点

非常に強力である

多くの場合、パラメータチューニングが不要

データのスケール変換も不要

欠点

線形モデルよりも多くのメモリを消費し、訓練も予測も遅い

乱数のシードを変更すると構築されるモデルが大きく変わる可能性がある

パラメータ

構築する決定木の数

利用する特徴量の最大数

最大の枝の深さ