La structure de votre graphe et l'échelle de vos données sont contrôlées par trois paramètres principaux. Tout d'abord, le paramètre obligatoire vars définit la liste exhaustive des variablesColonnes d'une table SAS contenant des données spécifiques (numériques ou caractères). Elles possèdent des attributs comme le nom, le type, la longueur, l'étiquette et le format d'affichage. qui composeront les nœuds de votre réseau. Ensuite, le paramètre nEdges vous permet de spécifier le nombre exact d'arêtes (les relations de cause à effet directes), ce qui détermine le niveau de densité ou de parcimonie de votre graphe causal. Enfin, le paramètre nObs définit la taille de l'échantillon, avec une valeur par défaut très généreuse fixée à 10000 observations. Pour des tests de stress sur votre architecture de plans de données, ce volume peut être revu massivement à la hausse.
Comment configurer la complexité du réseau causal et le volume d'observations à générer ?
Maîtrise de la Topologie et Volumétrie CAS
Exemples pour l'action dagsimulate
Génération basique d'un DAG
Créons un simple graphe acyclique dirigé avec 4 variables, 3 arêtes et 5000 observations. Les tables de sortie contiendront la matrice d'adjacence et les données générées.
Simulation avancée avec contrôle complet
Poussons la simulation plus loin en ajustant la distribution du bruit gaussien (moyenne et écart-type) et la distribution uniforme des paramètres pour générer un jeu de données robuste, parfait pour tester un modèle complexe.