Le défi majeur des processus gaussiens traditionnels est leur complexité algorithmique cubique par rapport au nombre d'observations. L'action gpReg résout ce problème de passage à l'échelle en utilisant des points d'induction (inducing points). En paramétrant nInducingPoints, l'action utilise une approximation variationnelle creuse qui réduit la complexité, permettant ainsi de traiter des jeux de données massifs sur l'architecture distribuée de CAS Cloud Analytic ServicesMoteur d'exécution in-memory de SAS Viya. Il assure le traitement massivement parallèle (MPP) et distribué des données pour optimiser les performances analytiques et le passage à l'échelle. tout en conservant une précision mathématique rigoureuse.
Comment gpReg parvient-elle à traiter des millions de lignes sans saturer la mémoire de CAS ?
Exemples pour l'action gpReg
Entraînement basique d'un modèle de régression par processus gaussien
Un exemple minimaliste pour entraîner un modèle sur nos données générées en utilisant le noyau RBF par défaut. Simple et efficace.
Régression GP avec ARD, sauvegarde du modèle et optimisation avancée
Ici, on sort l'artillerie lourde. On utilise la détermination automatique de pertinence (ARD), on modifie le noyau, on fixe le nombre de points d'induction, et on sauvegarde l'état du modèle analytique pour le réutiliser plus tard. Le tout en une seule ligne compacte pour tester vos réflexes visuels.