SAS Viya + SingleStore : Le Duo de Choc pour vos Données et Analyses ?
Après notre exploration des topologies Viya, aujourd'hui, on décortique une autre vidéo passionnante que vous trouverez ici : SAS Viya With SingleStore: Maximize the Value of Your Data
Cette fois, on se penche sur l'intégration entre SAS Viya et une base de données qui sort un peu de l'ordinaire : SingleStore. C'est Bill Denker, chef produit chez SAS, qui nous présente tout ça. L'objectif ? Marier la puissance d'une base de données relationnelle moderne et compatible SQL (mais avec quelques super-pouvoirs, on va voir ça) avec les outils analytiques pointus de SAS Viya. Alors, est-ce que ce duo tient ses promesses ? C'est ce qu'on va voir !

SingleStore : C'est quoi cette bête ?
Avant de parler mariage, faisons les présentations. Qu'est-ce que SingleStore a de spécial ? La vidéo nous explique que :
- C'est une base compatible ANSI SQL, donc pas besoin de tout réapprendre.
- Elle intègre nativement la compression et le chiffrement.
- Sa botte secrète : Elle peut gérer dans une seule et même table des données stockées de différentes manières :
- Par lignes (row store) : Idéal pour les opérations transactionnelles rapides (genre INSERT, UPDATE rapides).
- Par colonnes (column store) : Parfait pour les requêtes analytiques complexes qui ne lisent que certaines colonnes sur beaucoup de lignes.
- Stockage Objet : Pour les données moins structurées. Le tout, dans la même table ! Assez unique.
- Elle utilise une architecture avec des "leaf nodes" (nœuds feuilles) pour les opérations de base et des "aggregators" pour orchestrer les requêtes plus complexes.
Comment SAS Viya et SingleStore Jouent Ensemble ?
Maintenant, comment SAS Viya s'intègre là-dedans ? L'architecture présentée dans la vidéo est plutôt maline :
- On combine le moteur analytique en mémoire de Viya (CAS) avec les capacités de traitement "in-database" (directement dans la base).
- Souvent, Viya (CAS) et SingleStore tournent dans le même espace Kubernetes (le fameux
namespace
dont on parlait la dernière fois), ce qui simplifie les choses. - La pièce maîtresse : le SAS Embedded Process (EP). C'est un petit agent SAS qui tourne directement dans les nœuds "feuilles" de SingleStore. Son job ? Intercepter les requêtes SAS et "pousser" un maximum de travail (comme les filtres
WHERE
ou les calculs de nouvelles colonnes) au plus près de la donnée, dans SingleStore. - Résultat : On ne remonte vers CAS que les données vraiment nécessaires, déjà pré-filtrées et pré-calculées. Ça limite énormément le trafic réseau et la charge sur CAS.
- Scalabilité indépendante : Point très important, le cluster de calcul (les workers CAS) est physiquement séparé du cluster de données (les nœuds SingleStore). On peut donc les faire grossir ou réduire indépendamment l'un de l'autre. Besoin de plus de puissance de calcul ? On ajoute des workers CAS. Besoin de stocker plus de données ou d'accélérer les requêtes SQL ? On ajoute des nœuds SingleStore. Malin !


SAS Viya With SingleStore: Maximize the Value of Your Data (c) SAS
Les Démos : Du Concret !
La théorie, c'est bien beau, mais la vidéo nous montre aussi des exemples concrets assez bluffants :
- Import Express de Données Taxi : Ils montrent l'import d'un fichier Parquet (données de taxis new-yorkais, stocké sur AWS S3) dans une base SingleStore hébergée sur Azure, via une "pipeline" SingleStore. Le chiffre à retenir : environ 1,4 million de lignes importées en 4 secondes et demie ! Ça dépote.
- Analyse de Données Météo NASA : On passe côté SAS Viya. Un job de préparation de données (SAS Data Studio ou Studio Flow) prend un jeu de données publiques de la NASA. La démo montre comment :
- Créer un identifiant unique.
- Calculer une nouvelle colonne (des unités de chaleur).
- Ajouter une date et une variable géographique (GIS).
- Visualisation Dynamique (SAS Visual Analytics) : On visualise ensuite ces données :
- Une carte affichant les données GIS (précipitations).
- Un graphique combiné (barres + ligne) montrant l'évolution des unités de chaleur et des précipitations.
- Le truc sympa : on peut filtrer dynamiquement (ex: choisir l'année 2018). La carte et les graphiques se mettent à jour instantanément, car Viya renvoie des requêtes SQL optimisées directement à SingleStore.
- Modélisation sans Copie (SAS Model Manager) : La démo va jusqu'à construire et comparer des modèles prédictifs (régression linéaire vs gradient boosting dans l'exemple) directement sur la table SingleStore, sans avoir à créer une copie des données dans CAS. La régression linéaire gagne ce round dans la démo.
Le Gros Avantage : Performance et Moins de Mouvements de Données
Le message clé qui ressort de tout ça, c'est l'optimisation des performances en réduisant les mouvements de données :
- Grâce à l'Embedded Process, beaucoup de travail est fait directement dans SingleStore.
- Quand CAS a besoin des données, elles sont streamées en parallèle depuis les nœuds SingleStore, plutôt que de devoir charger une copie complète en mémoire dans CAS (ce qui est souvent le cas avec d'autres bases).
- Le découplage calcul/stockage offre une grande flexibilité pour adapter l'infrastructure aux besoins réels, sans surdimensionner l'un ou l'autre.
Mon Avis
Franchement, cette intégration SAS Viya + SingleStore a l'air sacrément bien pensée. Combiner la flexibilité unique de SingleStore (row, column, object dans la même table) avec la puissance analytique de Viya, tout en optimisant les flux de données grâce à l'Embedded Process, c'est une approche très séduisante. Les démos montrent que ça peut être très performant, surtout sur de gros volumes.
Si vous êtes confrontés à des défis où vous avez besoin à la fois de transactions rapides et d'analyses complexes sur les mêmes données, sans vouloir multiplier les copies et les ETL complexes, ce duo mérite vraiment qu'on s'y intéresse de près.
Pour finir quelques mots sur Singlestore

SingleStore est une plateforme SQL conçue pour une performance extrême, surpassant radicalement Hadoop. Grâce à son architecture unique (Stockage Universel breveté) et sa capacité à traiter en temps réel des flux massifs de données, SingleStore livre des analyses complexes en millisecondes, là où Hadoop prend des heures. Migrez vers SingleStore pour simplifier votre infrastructure et obtenir des informations exploitables quasi instantanément.
Generate Audio Overview