Étant donné que la validation croisée multiplie les temps d'entraînement par le nombre de segments, l'architecture distribuée de SAS Viya prend tout son sens. Le paramètre parallelFolds, activé par défaut, permet d'évaluer les différents segments simultanément plutôt que séquentiellement. Pour un contrôle granulaire de l'infrastructure, vous pouvez ajuster le paramètre nSubsessionWorkers afin de définir le nombre exact de nœuds de calcul alloués à chaque sous-sessionInstance de connexion active entre un client et le serveur CAS (Cloud Analytic Services), isolant les ressources, les bibliothèques et les traitements d'un utilisateur au sein de SAS Viya.. Cette approche massivement parallèle permet de réduire drastiquement les fenêtres de traitement analytique sur les très gros volumes de données.
Les temps de calcul explosent souvent lors d une validation croisee, comment SAS Viya optimise-t-il cette charge de travail ?
Optimisation Parallèle sur CAS
Exemples pour l'action crossValidate
Validation croisée basique d'un Arbre de Décision
Cet exemple évalue la robustesse d'un arbre de décision via $k$-fold validation. Il automatise le partitionnement, l'entraînement et l'agrégation des métriques pour mesurer l'erreur de généralisation.
Validation croisée robuste d'une Forêt Aléatoire
Cet exemple optimise l'action crossValidate en parallélisant 10 plis (K-folds) sur un modèle FOREST. Il assure la reproductibilité via seed et cible l'événement binaire pour évaluer la stabilité.