Pour une analyse exhaustive de la qualité des données, il est souvent nécessaire de savoir si les données absentes constituent une part importante des modalités. En utilisant le paramètre includeMissingGroup et en le réglant sur True, les valeurs manquantes sont autorisées et traitées comme une modalité de groupe valide. Cela garantit que votre estimation de cardinalitéLa cardinalité représente le nombre de valeurs distinctes contenues dans une colonne. Une cardinalité élevée indique une grande diversité de données, influençant le choix des modèles dans CAS. reflète la réalité totale de votre table, y compris les lacunes de saisie ou d'intégration.
Comment gérer efficacement les valeurs manquantes lors de vos audits de qualité de données ?
Exemples pour l'action highCardinality
Estimation basique de la cardinalité
Un appel minimaliste de l'action pour estimer rapidement le nombre de clients uniques et de catégories dans notre grande table d'achats.
Haute précision et affichage forcé des résultats
Nous augmentons ici la précision de l'algorithme avec `nRegisterBits=16` (la limite maximale), incluons les valeurs manquantes, et nous forçons l'affichage du résultat dans le journal via `outputTableOptions`.