Découvrez les secrets des pros et devenez un expert SAS incontournable !
Plongez dans l'univers fascinant de l'architecture SAS et découvrez les secrets pour éviter les écueils les plus courants !
Nous sommes d'accord, le titre de cet article pourrait être le titre du dernier best-seller sur le développement personnel comme "Miracle Morning, offrez-vous un supplément de vie " ou encore "Comme par magie, vivre sa créativité sans la craindre".
Cela m'a permis d'attirer votre attention.
Il était nécessaire de le faire car je vous propose aujourd'hui de vous plonger dans cet article, avec l'espoir qu'il captivera votre intérêt et révélera quelques secrets essentiels pour atteindre un bon niveau d'expertise dans le domaine de SAS.
Si vous me connaissez, vous savez que je suis un fervent défenseur du partage des connaissances et de l'expérience entre pairs. C'est pourquoi je suis enchanté de vous présenter cet article qui vous permettra d'approfondir votre compréhension des écueils possibles liés à l'architecture SAS et des meilleures pratiques pour les surmonter.
Cependant, vous l'avez compris, et malgré un titre un peu trop racoleur qui aurait pu laisser penser le contraire, cet article ne vise pas à vous enseigner les astuces pour devenir un expert en programmation SAS ou un expert solutions, ni à vous expliquer comment lire la documentation SAS (une pratique que je recommande vivement, car elle contient souvent les réponses aux questions, il suffit de prendre le temps de chercher). Au lieu de cela, l'objectif de cet article est de vous guider dans la prise de bonnes décisions lors de la conception d'une infrastructure pour l'installation de SAS VIYA. Je peux vous assurer que faire les bons choix permet d'éviter de nombreux problèmes.
Mon objectif est de vous fournir des informations concrètes, pratiques et directement applicables pour renforcer votre expertise en architecture SAS.
Nous explorerons en détail les pièges qui pourraient compromettre la réussite de votre architecture SAS. De la conception des serveurs aux problèmes de performance en passant par les erreurs de configuration, nous aborderons plusieurs sujets clés. Vous apprendrez également des techniques et des astuces essentielles pour éviter ces écueils et optimiser votre environnement SAS.
Une bonne compréhension des exigences de charge de travail SAS et de l'infrastructure matérielle nécessaire pour atteindre vos objectifs de service (SLA) est cruciale. Pour les clients SAS existants, je vous guiderai à travers des questions clés qui vous permettront d'évaluer votre environnement actuel et d'optimiser votre architecture SAS pour des performances optimales.
Dépassez les limites avec votre infrastructure SAS : maximisez l'efficacité et la sécurité !
Vous avez des tâches SAS qui doivent être exécutées dans des délais précis ? Vous souhaitez que vos tâches SAS s'exécutent plus rapidement que jamais, même dans votre centre de données actuel ? Alors, il est temps de déterminer le débit d'E/S nécessaire pour chaque système de fichiers utilisé.
Et si vous migrez vers le cloud public ? Vous vous demandez si vous pourrez atteindre le même débit d'E/S dans l'infrastructure cloud choisie. Ne vous inquiétez pas, nous avons les réponses.
Mais ce n'est pas tout. Vous devez également tenir compte de la contention au niveau de l'infrastructure. Imaginez les tâches SAS et non-SAS concurrentes aux heures de pointe… Cela peut avoir un impact majeur sur vos SLA. Nous vous aiderons à prévoir et à éviter les problèmes.
Et où se trouvent vos données sources pour les tâches SAS ? Si vous migrez vers le cloud public, sont-elles déjà dans le cloud de votre choix ? Sinon, nous vous aiderons à déterminer le temps nécessaire pour déplacer les données vers l'espace cloud où SAS s'exécute. Chaque minute compte pour vos SLA.
Avant de plonger tête baissée dans la mise en place de votre infrastructure SAS, répondez à ces questions clés. Une compréhension approfondie de vos besoins et contraintes vous permettra de prendre des décisions éclairées et d'optimiser vos performances.
PIÈGES PRINCIPAUX DE L'ARCHITECTURE
Est-ce important de savoir où les différents composants de votre infrastructure SAS sont installés ?
Avec l'accent mis aujourd'hui sur la disponibilité des applications SAS pour les utilisateurs finaux 24 heures sur 24, les clients et les administrateurs informatiques se demandent si SAS peut utiliser différents emplacements physiques pour les serveurs SAS, les clients SAS et les données utilisées pour les applications SAS.
On m'a souvent demandé si les différents serveurs d'un cluster de métadonnées SAS ou les nœuds du SAS Grid peuvent être situés à des endroits physiques différents. La réponse à ces questions est la suivante : cela peut fonctionner techniquement ; cependant, la distribution géographique des composants aura un impact considérable sur les performances. Cet impact sur les performances est le plus souvent observé lorsque les serveurs de calcul et les données sont situés dans des endroits différents, surtout si les applications SAS traitent séquentiellement de grandes quantités de données (des centaines de gigaoctets ou plus).
LA FOURNITURE DU MATÉRIEL SOUS-JACENT
Il est très important, lors de la création de vos systèmes virtuels pour SAS, de comprendre quel est le matériel sous-jacent. Vous devez vous assurer que chaque composant du réseau sous-jacent et de l'infrastructure matérielle peut répondre aux exigences en matière d'E/S qui auront lieu entre les composants SAS, leur stockage associé et toute autre communication réseau (sauvegardes vers le stockage) qui se produira.
Un autre aspect important que vous devez comprendre est de savoir si les processeurs sous-jacents sont logés dans plusieurs sockets (nœuds NUMA). Une bonne pratique consiste à regrouper tous les cœurs de votre système virtuel sur un seul socket dans le matériel sous-jacent. Avec les sockets d'aujourd'hui contenant 8, 10, 14, 20, etc. cœurs par socket, vous devez comprendre leur emplacement de socket avant d'attribuer des cœurs de processeur à vos systèmes virtuels pour SAS.
Libérez tout le potentiel de vos composants SAS grâce à une bande passante réseau optimale !
Au fil des années, nous avons constaté que la communication entre les composants SAS 9.4 (serveurs SAS Compute, serveur SAS Metadata, serveurs SAS mid-tier) peut être assez bavarde. C'est pourquoi nous recommandons vivement que chaque système SAS 9.4 dispose d'une carte réseau dédiée de 10 Gigabits (NIC) et d'une infrastructure/commutateurs sous-jacents, au minimum, pour cette communication entre les systèmes SAS 9.4. Des cartes réseau de plus grande capacité peuvent être nécessaires en fonction des modèles d'utilisation et des tailles de données.
Nous constatons également un besoin très similaire de communications réseau entre les systèmes SAS Viya (contrôleur CAS, travailleurs CAS, nœud SAS Programming Runtime, nœud CAS Microservices, nœud RabbitMQ/Postgres). Étant donné qu'il y a beaucoup de communication entre ces systèmes, nous encourageons également fortement l'utilisation d'un canal de 10 Gigabits minimum pour la communication entre les systèmes SAS Viya.
Ne laissez pas un goulot d'étranglement réseau ralentir vos composants SAS ! Assurez-vous d'avoir une bande passante réseau suffisante en optant pour des cartes réseau dédiées de 10 Gigabits et en mettant en place une infrastructure sous-jacente robuste. Vous garantirez ainsi des performances optimales et une communication fluide entre vos systèmes SAS. Ne lésinez pas sur la puissance de votre réseau, car chaque octet compte dans l'univers SAS !
Maximisez l'efficacité et l'accessibilité de vos données en évaluant votre infrastructure réseau.
Pour SAS 9.4, nous recommandons un minimum de 100 Mo/s/core physique pour les différents systèmes de fichiers SAS. Pour SAS WORK, nous augmentons cette suggestion de débit E/S à un minimum de 150 Mo/s/core. Ces recommandations sont générales et vos applications SAS peuvent nécessiter des vitesses supérieures ou inférieures à celles indiquées.
Pour SAS Viya, il existe des systèmes de fichiers qui peuvent nécessiter des vitesses de débit E/S similaires. Ces recommandations de vitesse seront déterminées par le temps nécessaire pour charger les données d'entrée des actions CAS depuis le disque vers la mémoire.
Dans les deux scénarios, pour le stockage connecté en réseau, vous voudrez peut-être que la carte NIC utilisée pour les transferts vers/depuis le stockage externe soit distincte de la carte NIC utilisée pour la communication entre les serveurs SAS.
Assurez-vous d'avoir suffisamment de capacité matérielle pour prendre en charge votre système de fichiers partagé de manière optimale.
Si vous envisagez d'utiliser un système de fichiers partagé (SFS), il est essentiel de collaborer avec le fournisseur de SFS pour comprendre les ressources de calcul, de mémoire et de bande passante IO (bien plus que la simple capacité de stockage) nécessaires pour soutenir le SFS. Dans certains cas, le SFS gère son propre espace de mise en cache des pages pour améliorer les transferts IO. Cette mise en cache utilise à la fois la mémoire et les cycles CPU, vous devez donc vous assurer que ces exigences matérielles font partie des exigences matérielles pour SAS.
Assurez-vous d'optimiser les performances de votre système de fichiers partagé (SFS) en collaborant étroitement avec notre fournisseur de SFS. Nous évaluons non seulement les capacités de stockage, mais également les ressources de calcul, de mémoire et de bande passante IO nécessaires pour garantir un soutien optimal du SFS. De plus, nous mettons en place une mise en cache intelligente des pages, utilisant à la fois la mémoire et les cycles CPU, afin d'améliorer les transferts IO. Nous veillons à ce que toutes ces exigences matérielles soient prises en compte dans les spécifications de notre solution SAS, garantissant ainsi des performances exceptionnelles.
Explorez les rouages de la virtualisation pour optimiser votre utilisation de SAS
Il est essentiel de comprendre la configuration de vos systèmes virtualisés et de stockage. Sont-ils configurés avec une provision mince (où les ressources matérielles sous-jacentes sont surutilisées) ou une provision épaisse ? Si votre ferme de machines virtuelles est configurée avec une provision mince, une application SAS qui accède à de gros volumes de données (plus de 100 Go) de manière séquentielle en bloc peut connaître des performances médiocres sur cette ferme.
Si vous n'êtes pas encore familier avec le fonctionnement des machines virtuelles, je vous recommande vivement de plonger dans deux documents SAS spécifiquement dédiés à ce sujet captivant.
- “Moving SAS applications from physical to virtual VMware environment” http://support.sas.com/resources/papers/MovingVirtualVMware.pdf
- “Deploying SAS Grid Systems on VMware ESXi Virtually Provisioned Storage” https://www.sas.com/content/dam/SAS/support/en/sas-global-forum-proceedings/2018/1931- 2018.pdf
Ces ressources vous offriront une compréhension approfondie et vous permettront de tirer pleinement parti de la puissance de la virtualisation pour propulser vos performances avec SAS. Ne manquez pas cette occasion de renforcer vos connaissances et d'explorer de nouvelles possibilités passionnantes.
Garantir la Configuration Correcte de Votre Stockage
L'accès aux données sur des baies de stockage externes est nécessaire pour toutes les applications SAS. La rapidité de cet accès dépend de la durée nécessaire pour accomplir la tâche SAS. Il est important de comprendre si le stockage sera partagé avec d'autres applications.
Veuillez consulter les meilleures pratiques pour la configuration du stockage avec SAS. Vous pouvez les trouver ici : http://support.sas.com/kb/53/874.html
Le mot de la fin
Comme le montre clairement cet article, il est extrêmement important de comprendre la charge de travail SAS pour laquelle vous concevez une architecture matérielle, le matériel proposé ainsi que l'emplacement des composants de l'architecture matérielle et des sources de données. Le choix des ressources matérielles, des magasins de données et de l'emplacement de l'architecture de l'application est essentiel pour obtenir les meilleures performances pour vos utilisateurs SAS. Il est également crucial de suivre toutes les meilleures pratiques de configuration de l'architecture matérielle, du stockage et des sources de données, que vous prévoyiez d'utiliser du matériel dédié, un système de machines virtuelles ou une technologie de conteneur. Ces pratiques s'appliquent aussi bien lors du déploiement de SAS sur site que dans le cloud public.
Il peut arriver que vous deviez utiliser des systèmes ou des espaces de stockage plus lents en raison de contraintes budgétaires. Vous devez alors examiner attentivement les conséquences sur les performances de différentes décisions relatives à l'architecture matérielle, en tenant compte de votre budget.
Pour aller plus loin
Voici quelques ressources concernant les lignes directrices pour l'optimisation du sous-système E/S et du stockage :
- Meilleures pratiques pour la configuration de votre sous-système E/S pour les applications SAS®9 (mise à jour d'avril 2016)
- Foire aux questions sur les configurations de stockage
- Déploiement de SAS® sur des systèmes de stockage virtualisés et définis par logiciel
- Avis concernant SAS® Grid Manager avec EMC Isilon (mise à jour de mars 2018)
- Considérations de performance et d'optimisation pour SAS® sur Dell EMC® VxFLEX™
- Accélérer les analyses avec SAS 9.4 déployé sur IBM Power9 et IBM FlashSystem 9150
- Accélérer les analyses avec SAS 9.4 déployé sur IBM Power10 et IBM FlashSystem 9200
- Considérations de performance et d'optimisation pour SAS® en utilisant IBM® Spectrum Scale™ sur IBM® FlashSystem® A9000R
- SAS 9 sur le stockage IBM ESS, IBM Spectrum Scale (GPFS), IBM POWER8 (AIX) et Mellanox
- Lignes directrices générales pour l'optimisation d'IBM Spectrum Scale (anciennement GPFS) pour le déploiement de SAS sur des serveurs IBM Power avec AIX
- Architecture de référence HPE pour SAS® 9.4 sur HPE Synergy et HPE 3PAR 8400
Voici maintenant quelque SAS Note présentant les lignes directrices d'optimisation et les bonnes/meilleures pratiques pour votre infrastructure matérielle (systèmes, stockage, virtualisation, systèmes de fichiers et systèmes d'exploitation) :
- SAS Note 62241 : Informations générales sur l'optimisation de votre infrastructure matérielle pour le logiciel
- SAS®" SAS Note 53873 : optimisation du système d'exploitation
- SAS Note 53875 : optimisation des systèmes de fichiers partagés/clusterisés
- SAS Note 53874 : optimisation du sous-système E/S et du stockage
- SAS Note 53878 : optimisation de SAS® Grid
- SAS Note 62239 : optimisation de SAS® sur le cloud public
- SAS Note 62240 : optimisation et meilleures pratiques pour SAS sur une infrastructure virtualisée
- SAS Note 62238 : haute disponibilité et reprise après sinistre
- SAS Note 53877 : Surveillance des performances et dépannage