La forêt aléatoire va-t-elle s'adapter ?

Table des matières:

La forêt aléatoire va-t-elle s'adapter ?
La forêt aléatoire va-t-elle s'adapter ?

Vidéo: La forêt aléatoire va-t-elle s'adapter ?

Vidéo: La forêt aléatoire va-t-elle s'adapter ?
Vidéo: Construisons la forêt de demain face au changement climatique | Mathieu Penet | TEDxAgroParisTech 2024, Mars
Anonim

Sur-ajustement . Les forêts aléatoires ne sur-adaptent pas. Les performances de test des forêts aléatoires ne diminuent pas (en raison du surajustement) à mesure que le nombre d'arbres augmente. Par conséquent, après un certain nombre d'arbres, les performances ont tendance à rester dans une certaine valeur.

Qu'est-ce qui cause le surajustement aléatoire de la forêt ?

Nous pouvons clairement voir que le modèle de forêt aléatoire est en surajustement lorsque la valeur du paramètre est très faible (lorsque la valeur du paramètre < 100), mais les performances du modèle augmentent rapidement et se corrigent le problème du surajustement (100 < valeur du paramètre < 400).

Comment puis-je corriger le surajustement de la forêt aléatoire ?

1 Réponse

  1. n_estimators: plus il y a d'arbres, moins l'algorithme est susceptible de sur-ajuster. …
  2. max_features: vous devriez essayer de réduire ce nombre. …
  3. max_depth: ce paramètre réduira la complexité des modèles appris, réduisant ainsi le risque de surajustement.
  4. min_samples_leaf: Essayez de définir ces valeurs supérieures à un.

Est-ce que l'arbre de décision sur-adapte toujours ?

Dans les arbres de décision, l'élagage est un processus appliqué pour contrôler ou limiter la profondeur (taille) des arbres. Par défaut, les hyperparamètres du modèle d'arbre de décision ont été créés pour développer l'arbre dans toute sa profondeur. Ces arbres sont appelés arbres adultes qui sont toujours surdimensionnés.

La forêt aléatoire est-elle meilleure que l'arbre de décision ?

Mais la forêt aléatoire choisit des fonctionnalités au hasard pendant le processus de formation. Par conséquent, il ne dépend pas fortement d'un ensemble spécifique de fonctionnalités. … Par conséquent, la forêt aléatoire peut mieux généraliser les données. Cette sélection aléatoire de fonctionnalités rend la forêt aléatoire beaucoup plus précise qu'un arbre de décision.

Conseillé: