Retour aux sources : Quand Python rencontre la puissance de SAS Viya (Webinaire)

Cet article en deux mots :

Fini les silos entre l'open source et les logiciels d'entreprise ! Découvrez comment la librairie SWAT permet d'utiliser Python tout en déléguant les calculs lourds au moteur SAS Viya. Plongée dans une démo concrète alliant Machine Learning de pointe et gestion de données performante.

Ce mardi 14 avril 2026, je me suis connecté par curiosité au webinaire "Boostez vos analyses Python avec la puissance de SAS Viya". N'étant pas développeur moi-même, ma motivation première était surtout le plaisir de revoir mes anciens collègues de chez SAS.

Animée par Xavier Bizoux (Advisory Technical Architect chez SAS France et membre de l'équipe Global Enablement and Learning), cette sessionInstance de connexion active entre un client et le serveur CAS (Cloud Analytic Services), isolant les ressources, les bibliothèques et les traitements d'un utilisateur au sein de SAS Viya. de 40 minutes tombait à pic pour moi.

En tant que référent technique, mon quotidien consiste notamment à déployer SAS Viya 4SAS Viya 4 est une plateforme d'IA, de data management et d'analytics de pointe, nativement conçue pour le Cloud (Cloud-Native). Contrairement aux versions précédentes, elle repose sur une architecture de microservices orchestrée par Kubernetes.

Elle permet de gérer l'intégralité du cycle de vie de la donnée — de l'ingestion à la mise en production des modèles (ModelOps) — en offrant une élasticité totale, une intégration transparente avec l'open-source (Python, R) et une interface unifiée pour les data scientists et les décideurs métiers.
dans un environnement où nos utilisateurs jonglent entre SAS StudioInterface de développement Web intégrée à SAS Viya, SAS Studio permet d'écrire du code, de construire des flux visuels et d'analyser des données via un simple navigateur, sans installation locale. (pour coder en langage SAS classique) et JupyterHubJupyterHub est une plateforme multi-utilisateurs permettant d'héberger et gérer des notebooks Jupyter. Sous SAS Viya, il offre un accès partagé et sécurisé au moteur CAS pour coder en Python ou R. (pour coder en Python avec la librairie SWAT). Seulement voilà : ayant plutôt la tête dans l'infrastructure, j'ai très rarement l'occasion d'observer la réalité d'une mise en application concrète de ces outils.

Ça fait un bien fou de voir enfin de vrais cas d'usage à travers une démo de bout en bout ! Cela m'a offert un excellent aperçu de la manière dont les data scientistsExperts extrayant des connaissances via des méthodes statistiques, algorithmes et IA. Ils transforment les données brutes en insights stratégiques pour résoudre des problèmes métier complexes. d'aujourd'hui parviennent, sur le terrain, à marier la flexibilité de l'open source avec la puissance de calcul brute du moteur SAS

Même sans avoir les mains dans le code au quotidien, voici ce que j'ai retenu de cette plongée sous le capot !

Le pont entre deux mondes : la librairie SWAT

Le cœur de la démonstration reposait sur une librairie Python au nom plutôt percutant : SWAT (pour SAS Scripting Wrapper for Analytics TransferLe SAS SWAT est l'interface de programmation (API) Python, R, Lua ou Java qui permet de connecter directement vos langages open-source favoris au moteur de calcul ultra-rapide de SAS Viya 4.

Il agit comme un pont transparent : vous écrivez du code dans votre environnement habituel (ex: Jupyter Notebook, VS Code) et les calculs lourds sont exécutés "In-Memory" sur le moteur CAS (Cloud Analytic Services) de Viya. C'est l'outil ultime pour combiner la flexibilité de l'open-source et la puissance industrielle de SAS.
).

Historiquement, on pouvait penser que le monde de l'open source (comme Python) et celui des logiciels d'entreprise (comme SAS) fonctionnaient en silos. Ce webinaire a prouvé tout le contraire. SWAT agit comme une passerelle transparente. Il permet à un utilisateur de rester dans son environnement Python favori (comme Visual Studio Code ou Jupyter), d'utiliser des structures de données qu'il connaît par cœur (comme les DataFramesStructure de données tabulaire (lignes/colonnes) en mémoire, optimisée pour le traitement distribué via les moteurs CAS ou Python, permettant une manipulation fluide et performante des données. de la librairie PandasBibliothèque Python incontournable pour la manipulation et l'analyse de données structurées via des DataFrames. Elle offre des performances optimales pour le nettoyage et l'exploration de données.), tout en déléguant les calculs lourds au serveur CASMoteur analytique "in-memory" de SAS Viya. Il traite les données en parallèle (MPP) sur plusieurs nœuds pour offrir une puissance de calcul massive et une exécution ultra-rapide des actions. (Cloud Analytic ServicesMoteur d'exécution in-memory de SAS Viya. Il assure le traitement massivement parallèle (MPP) et distribué des données pour optimiser les performances analytiques et le passage à l'échelle.), le moteur ultra-performant de SAS Viya.

En résumé : on écrit du Python, mais c'est le moteur SAS qui fait le gros du travail en tâche de fond.

De la préparation des données à la modélisationProcessus de création de structures mathématiques ou statistiques sur SAS Viya pour prédire des comportements, classifier des données ou identifier des tendances à partir de jeux de données CAS.

Xavier a illustré ses propos avec deux démonstrations très concrètes, en utilisant des jeux de données classiques (les caractéristiques de voitures et le célèbre dataset des passagers du Titanic).

1. La gestion et la persistance des données

Une notion intéressante abordée est la gestion de la mémoireGemini said
Espace de stockage temporaire (RAM) utilisé par le moteur CAS pour charger et traiter les données à haute vitesse, minimisant les accès disque pour optimiser les performances de SAS Viya.
. Le serveur CASMoteur analytique "in-memory" de SAS Viya. Il traite les données en parallèle (MPP) sur plusieurs nœuds pour offrir une puissance de calcul massive et une exécution ultra-rapide des actions. traite les données en mémoireGemini said
Espace de stockage temporaire (RAM) utilisé par le moteur CAS pour charger et traiter les données à haute vitesse, minimisant les accès disque pour optimiser les performances de SAS Viya.
vive (in-memoryTechnique stockant les données directement dans la RAM pour un accès ultra-rapide, permettant des analyses massives et calculs complexes en temps réel sans les latences liées aux disques durs.) pour une rapidité fulgurante. Cependant, pour éviter de recharger des fichiers massifs de plusieurs gigaoctets à chaque nouvelle sessionInstance de connexion active entre un client et le serveur CAS (Cloud Analytic Services), isolant les ressources, les bibliothèques et les traitements d'un utilisateur au sein de SAS Viya., Xavier a montré comment :

2. Le Machine LearningBranche de l'IA utilisant des algorithmes pour apprendre des modèles à partir de données. Il permet d'automatiser des prédictions ou des décisions sans programmation explicite de chaque règle. en action

La deuxième partie était orientée "Analytics". Toujours depuis Python, Xavier a utilisé des bibliothèquesPointeurs logiques (Libref) reliant SAS Viya à des sources de données physiques (dossiers, bases de données, CAS) pour lire, écrire et organiser les tables de manière structurée. visuelles comme SeabornBibliothèque Python de visualisation de données basée sur Matplotlib. Elle offre une interface de haut niveau pour créer des graphiques statistiques attrayants et informatifs, intégrés à SAS Viya. et MatplotlibBibliothèque Python incontournable pour la data science, permettant de générer des visualisations statiques, animées et interactives de haute qualité (graphiques, histogrammes, nuages de points). pour explorer les données du Titanic (qui a survécu ? selon quelle classe ? à quel âge ?). Après avoir nettoyé les données (notamment en imputant les âges manquants grâce au moteur SAS), il a lancé l'entraînement de trois modèles d'intelligence artificielle en parallèle :

  • Decision TreeModèle de machine learning supervisé qui segmente les données via des règles logiques successives (nœuds) pour prédire une cible catégorielle ou numérique, optimisant ainsi la prise de décision. (Arbre de décision)
  • Random ForestAlgorithme d'apprentissage supervisé combinant plusieurs arbres de décision indépendants pour améliorer la précision et réduire le surapprentissage via le bagging et la sélection aléatoire. (Forêt aléatoireAlgorithme d'apprentissage supervisé combinant plusieurs arbres de décision indépendants pour améliorer la précision et réduire le surapprentissage par agrégation de leurs prédictions.)
  • Gradient BoostingMéthode d'apprentissage itérative créant une suite d'arbres de décision. Chaque nouvel arbre corrige les erreurs de prédiction des précédents pour minimiser globalement la fonction de perte.

Le serveur CASMoteur analytique "in-memory" de SAS Viya. Il traite les données en parallèle (MPP) sur plusieurs nœuds pour offrir une puissance de calcul massive et une exécution ultra-rapide des actions. a absorbé ces calculs complexes pour ensuite renvoyer les scores et évaluer le modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). le plus performant (via des analyses ROCLa courbe ROC (Receiver Operating Characteristic) mesure la performance d'un modèle de classification en traçant le taux de vrais positifs face au taux de faux positifs pour chaque seuil. et AUCL'AUC (Area Under the Curve) mesure la capacité d'un modèle à distinguer les classes. Comprise entre 0,5 et 1, plus elle est élevée, plus la performance de classification est robuste.) afin de prédire au mieux la survie des passagers.

SAS Innovate & Hackathon : Les prochains rendez-vous

Au-delà de la technique pure, Xavier a profité de ce moment pour annoncer les prochains événements incontournables de l'écosystème SAS, et cela promet d'être passionnant :

En conclusion

Même pour un profil non-developpeur Python comme le mien, voir ces outils en action est fascinant. L'ouverture de SAS vers l'open source n'est plus une promesse, c'est une réalité opérationnelle très fluide.

Pour les Data ScientistsExperts extrayant des connaissances via des méthodes statistiques, algorithmes et IA. Ils transforment les données brutes en insights stratégiques pour résoudre des problèmes métier complexes., ingénieurs IA ou architectes data qui chercheraient à industrialiser leurs workflows, c'est définitivement une technologie à creuser.

Nicolas Housset

Passionné d'informatique, je suis Consultant et expert technique SAS VIYA, également co-fondateur de la société Flexcelite. Spécialisé dans les technologies SAS (Viya, 9.4) et les infrastructures associées (Linux, Hadoop, Azure), ce blog est mon espace pour partager mes mémos techniques et retours d'expérience.