genmod
Description
L'action genmod est le véritable couteau suisse de la modélisationProcessus de création de structures mathématiques ou statistiques sur SAS Viya pour prédire des comportements, classifier des données ou identifier des tendances à partir de jeux de données CAS. statistique dans SAS Viya. Elle permet d'ajuster des modèles linéaires généralisés (GLM) , ce qui signifie qu'elle ne se laisse pas intimider par des données qui ne suivent pas une loi normale. Que vous travailliez sur des taux de pannes (Gamma), des comptages d'accidents (PoissonLoi de probabilité discrète modélisant le nombre d'événements indépendants survenant dans un intervalle fixe (temps/espace), définie par un paramètre de moyenne égal à la variance.) ou des probabilités de clic (Logistique), genmod orchestre vos analyses avec une précision chirurgicale. Elle gère même les mesures répétées via les équations d'estimation généralisées (GEE), parfait pour suivre l'évolution de vos données dans le temps sans perdre le nord.
Paramètres Clés
Préparation des données
Création de données de réclamations d'assurance
Ce code génère un jeu de données fictif simulant des réclamations d'assurance pour tester une régression de Poisson.
| 1 | DATA casuser.insurance_data; |
| 2 | INPUT AgeGroup $ Region $ Exposure Claims; |
| 3 | DATALINES; |
| 4 | Jeune Nord 100 12 |
| 5 | Jeune Sud 150 18 |
| 6 | Adulte Nord 200 10 |
| 7 | Adulte Sud 250 15 |
| 8 | Senior Nord 180 5 |
| 9 | Senior Sud 210 8 |
| 10 | ; |
| 11 | RUN; |
Exemples d'utilisation
Régression de Poisson simple
Ajuste un modèle de base pour prédire le nombre de réclamations en fonction du groupe d'âge.
| 1 | PROC CAS; regression.genmod / TABLE={name="insurance_data"} model={depVars={{name="Claims"}}, effects={{vars={"AgeGroup"}}}, dist="POISSON", link="LOG"}; RUN; |
Résultat Attendu :
Modèle logistique avec sélection de variables et sauvegarde
Un exemple complet incluant la déclaration des classes, une sélection 'Forward' et l'exportation du modèle pour le futur.
| 1 | PROC CAS; regression.genmod / TABLE={name="insurance_data"} class={"AgeGroup", "Region"} model={depVars={{name="Claims"}}, effects={{vars={"AgeGroup", "Region"}}}, dist="POISSON", link="LOG"} selection={method="FORWARD", details="SUMMARY"} OUTPUT={casOut={name="scored_data", replace=true}, pred="P_Claims"} store={name="my_genmod_model", replace=true}; RUN; |
Résultat Attendu :
Analyse de mesures répétées (GEE)
Utilisation du paramètre 'repeated' pour gérer les corrélations au sein d'un groupe (ex: par Région).
| 1 | PROC CAS; regression.genmod / TABLE={name="insurance_data"} class={"AgeGroup", "Region"} model={depVars={{name="Claims"}}, effects={{vars={"AgeGroup"}}}, dist="POISSON", link="LOG"} repeated={subject={{vars={"Region"}}}, corrType="EXCH"}; RUN; |