Comment configurer la complexité du réseau causal et le volume d'observations à générer ?

Maîtrise de la Topologie et Volumétrie CAS

La structure de votre graphe et l'échelle de vos données sont contrôlées par trois paramètres principaux. Tout d'abord, le paramètre obligatoire vars définit la liste exhaustive des variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. qui composeront les nœuds de votre réseau. Ensuite, le paramètre nEdges vous permet de spécifier le nombre exact d'arêtes (les relations de cause à effet directes), ce qui détermine le niveau de densité ou de parcimonie de votre graphe causal. Enfin, le paramètre nObs définit la taille de l'échantillon, avec une valeur par défaut très généreuse fixée à 10000 observations. Pour des tests de stress sur votre architecture de plans de données, ce volume peut être revu massivement à la hausse.

Exemples pour l'action dagsimulate

Génération basique d'un DAG

Créons un simple graphe acyclique dirigé avec 4 variables, 3 arêtes et 5000 observations. Les tables de sortie contiendront la matrice d'adjacence et les données générées.

Simulation avancée avec contrôle complet

Poussons la simulation plus loin en ajustant la distribution du bruit gaussien (moyenne et écart-type) et la distribution uniforme des paramètres pour générer un jeu de données robuste, parfait pour tester un modèle complexe.