Puis-je inclure ou exclure les valeurs manquantes dans mes calculs d'agrégation?

Gestion des Valeurs Manquantes dans CAS

Oui, le paramètre includeMissing (par défaut TRUE) détermine si les observations avec des valeurs manquantes sont incluses dans l'analyse. Si vous le définissez à FALSE, ces observations seront exclues, ce qui peut affecter les résultats de vos statistiques agrégées.

Schéma : Puis-je inclure ou exclure les valeurs manquantes dans mes calculs d'agrégation?

Exemple de Code Additionnel

1<pre>PROC CAS;
2/* Agrégation avec exclusion explicite des valeurs manquantes */
3aggregation.aggregate /
4TABLE={name="ventes_detail", caslib="Public"},
5varSpecs={
6{name="montant_transaction", summarySubset={"SUM", "MEAN", "NMISS"}}
7},
8/* includeMissing = FALSE :
9Exclut les observations où la variable d'analyse est manquante
10*/
11includeMissing=FALSE,
12casOut={name="rapport_ventes_propres", replace=true},
13groupBy={"region", "categorie"};
14QUIT;</pre>

Exemples pour l'action aggregate

Agrégation globale des ventes
Schéma conceptuel de l'exemple : Agrégation globale des ventes

Cet exemple montre la réduction massive de données via varSpecs. Il parallélise le calcul de statistiques descriptives (SUM, MEAN) pour générer un snapshot analytique optimisé en mémoire CAS.

Agrégation temporelle par mois
Schéma conceptuel de l'exemple : Agrégation temporelle par mois

Cet exemple exploite le moteur temporel de CAS via id et interval. Il segmente les flux transactionnels en fenêtres mensuelles, optimisant le calcul parallèle de SUM/MAX par produit et période.