Quels sont les paramètres essentiels pour démarrer une agrégation de données?

L'Art de l'Agrégation sous CAS

Le paramètre le plus crucial est table, qui spécifie la table CAS (Cloud Analytic ServicesMoteur d'exécution in-memory de SAS Viya. Il assure le traitement massivement parallèle (MPP) et distribué des données pour optimiser les performances analytiques et le passage à l'échelle.) sur laquelle l'opération d'agrégation sera effectuée. En plus de cela, vous devrez souvent définir les variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. d'analyse via le paramètre inputs ou le paramètre plus détaillé varSpecs pour indiquer quelles agrégations vous souhaitez appliquer (par exemple, moyenne, somme, nombre distinct).

Schéma : Quels sont les paramètres essentiels pour démarrer une agrégation de données?

Exemple de Code Additionnel

1<pre>PROC CAS;
2/* Appel de l'action d'agrégation */
3aggregation.aggregate /
4/* Paramètre essentiel : table (avec optimisation mémoire) */
5TABLE={
6name="VENTES_DETAIL",
7caslib="public",
8/* On ne charge en mémoire que les colonnes utiles */
9vars={"Region", "Chiffre_Affaires", "Quantite_Vendue"}
10},
11/* On définit l'axe d'analyse */
12groupBy={"Region"},
13/* Paramètre détaillé : varSpecs (une stat différente par variable en un seul passage) */
14varSpecs={
15{name="Chiffre_Affaires", subset={"SUM", "MEAN"}},
16{name="Quantite_Vendue", subset={"SUM", "MAX"}}
17};
18QUIT;</pre>

Exemples pour l'action aggregate

Agrégation globale des ventes
Schéma conceptuel de l'exemple : Agrégation globale des ventes

Cet exemple montre la réduction massive de données via varSpecs. Il parallélise le calcul de statistiques descriptives (SUM, MEAN) pour générer un snapshot analytique optimisé en mémoire CAS.

Agrégation temporelle par mois
Schéma conceptuel de l'exemple : Agrégation temporelle par mois

Cet exemple exploite le moteur temporel de CAS via id et interval. Il segmente les flux transactionnels en fenêtres mensuelles, optimisant le calcul parallèle de SUM/MAX par produit et période.