キカベン
機械学習でより便利な世の中へ
G検定対策
お問い合わせ
   

モデル選択とは

thumb image

ちょっと、ざっくばらんに機械学習におけるモデル選択についてお話しします。

ビジネスで解決すべき問題が設定され、機械学習を使うことで解決できそうだなとなったときに、データを集める作業とモデルの選択が必要になります。

たとえば、決定木(Decision Tree)を使って何らかの分類を行うとしましょう。さて、ここで質問です。

決定木を使うと決めたので「モデルの選択」は完了でしょうか?

実は、決定木といっても、さまざまなハイパーパラメータの値を設定する必要があります。たとえば、木の深さの最大値などを決めます。

木の深さが異なる決定技はモデルとして異なると考えます。なぜなら、モデルの複雑さが異なるからです。

なので、モデルの選択とは、ハイパーパラメーターの選定まで含めて考えます。

また、他の例で言うと、ディープラーニングなどでも層の数でその複雑さが変わってきます。ResNetなどは層の数によってResNet18やResNet50などとモデルを分けて呼んでいます。

そしてハイパーパラメーターの選定はトレーニングセットとバリデーションセットのデータを使うことで最適化していきます。

トレーニングセットとバリデーションセットをどのように分けて組み合わせるのかはいろいろと方法がありますが、この辺の話はまた今度。



コメントを残す

メールアドレスは公開されません。