Pour spécifier votre table d'entrée, vous devez utiliser le paramètre table. Ce paramètre est obligatoire et peut être fourni sous sa forme longue avec des sous-paramètres détaillés ou sous une forme abrégée.
Forme longue : Vous spécifiez un dictionnaire (ou list en R/Python) contenant le nom de la table (obligatoire) et, optionnellement, la caslib (bibliothèque CAS) où se trouve la table. Par exemple : table={name="ma_table", caslib="MaCaslib"}.
Forme abrégée : Vous pouvez simplement fournir le nom de la table comme une chaîne de caractères, par exemple : table="ma_table".
Il est également possible de filtrer les données d'entrée via les sous-paramètres where pour des expressions de filtrage directes ou whereTable pour filtrer via une table externe.
Exemple de Code Additionnel
<pre>proc cas;
/* 1. Forme longue avec spécification de Caslib et filtrage */
dataPreprocess.analyzeMissingPatterns /
table={
name="orders_data",
caslib="public",
where="order_date > '01JAN2024'd"
},
vars={"customer_id", "order_value", "shipping_delay"};
run;
/* 2. Forme abrégée (utile pour le prototypage rapide) */
dataPreprocess.analyzeMissingPatterns /
table="orders_data",
vars={"customer_id", "order_value", "shipping_delay"};
run;
quit;</pre>
1
<pre>PROC CAS;
2
/* 1. Forme longue avec spécification de Caslib et filtrage */
Cette fois, on cible un sous-ensemble de variables (inputs), en forçant le format de 'Type', en ajoutant la variable 'MSRP' comme cible et en activant le filet de sécurité algorithmique Misra-Gries.
Conseil de l'Expert
Ne chargez pas ou ne dupliquez pas une table entière si vous n'avez besoin d'analyser les patterns manquants que sur un segment spécifique. Le paramètre table accepte le sous-paramètre where. En filtrant directement dans l'appel de l'action, vous économisez des ressources processeur et de la mémoire, car l'action ne traitera que les lignes pertinentes sans créer de table physique intermédiaire.
Cette réponse vous a-t-elle aidé ?
Vos votes aident à améliorer notre base de connaissances.