Le calcul exact des fonctions de répartition empiriques peut s'avérer très coûteux sur des big data. Pour pallier cela, copulaFit propose le paramètre avancé margApproxOpts qui déploie une méthode d'approximation adaptative sur les nœuds de calcul.
- Algorithme de regroupement : Vous pouvez paramétrer l'algorithme sur BIN (binning adaptatif) ou SORT (tri des données par thread).
- Interpolation intelligente : Le paramètre interpolation offre des méthodes analytiques comme MONOCUBIC (splines cubiques monotones), LINEAR ou STEP pour lisser la courbe de distribution.
Pour affiner la précision et maîtriser le temps d'exécution, les experts utilisent souvent margApproxOpts={algorithm="BIN", interpolation="MONOCUBIC"} afin d'équilibrer parfaitement la charge CPU et la fidélité statistique du modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting)..