Comment gérer efficacement les valeurs manquantes lors de vos audits de qualité de données ?

Pour une analyse exhaustive de la qualité des données, il est souvent nécessaire de savoir si les données absentes constituent une part importante des modalités. En utilisant le paramètre includeMissingGroup et en le réglant sur True, les valeurs manquantes sont autorisées et traitées comme une modalité de groupe valide. Cela garantit que votre estimation de cardinalitéLa cardinalité représente le nombre de valeurs distinctes contenues dans une colonne. Une cardinalité élevée indique une grande diversité de données, influençant le choix des modèles dans CAS. reflète la réalité totale de votre table, y compris les lacunes de saisie ou d'intégration.

Exemples pour l'action highCardinality

Estimation basique de la cardinalité

Un appel minimaliste de l'action pour estimer rapidement le nombre de clients uniques et de catégories dans notre grande table d'achats.

Haute précision et affichage forcé des résultats

Nous augmentons ici la précision de l'algorithme avec `nRegisterBits=16` (la limite maximale), incluons les valeurs manquantes, et nous forçons l'affichage du résultat dans le journal via `outputTableOptions`.