Quels sont les paramètres cruciaux pour l'application d'un modèle de catégorisation ?

Paramétrage et Exécution d'un Modèle de Catégorisation

Les paramètres clés incluent :

  • model : Spécifie la table CAS d'entrée contenant le modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). de catégorisation. C'est un paramètre obligatoire.
  • table : Indique la table de données d'entrée contenant le texte à catégoriser.
  • docId : Le nom de la variable d'ID unique dans la table d'entrée pour référencer chaque ligne.
  • text : Le nom de la variable de texte dans la table d'entrée sur laquelle le modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). est appliqué.
Schéma : Quels sont les paramètres cruciaux pour l'application d'un modèle de catégorisation ?

Exemple de Code Additionnel

1<pre>/* CASL Script : SCORING DE CATEGORISATION TEXTUELLE
2(c) Nicolas Housset 2026 - Code SAS pour VIYA 4 */
3PROC CAS;
4/* 1. Chargement de l'action set dédié au traitement du langage naturel */
5LOADACTIONSET "textCategorization";
6/* 2. Application du modèle sur les nouvelles données textuelles */
7textCategorization.score /
8/* Paramètres d'entrée détaillés dans la question */
9TABLE = {name="documents_a_categoriser", caslib="Public"}
10model = {name="mon_modele_categorisation_fr", caslib="Models"}
11docId = "identifiant_unique_doc"
12text = "contenu_verbatim"
13 /* Paramètre de sortie (Best Practice) */
14 casOut = {
15 name="resultats_categories",
16 caslib="Public",
17 replace=true,
18 replication=0 /* Optimisation : pas de réplication en phase de test */
19 };
20RUN;
21/* 3. Vérification des premières lignes pour valider l'application du modèle */
22TABLE.fetch /
23TABLE={name="resultats_categories", caslib="Public"}
24to=5;
25RUN;
26QUIT;</pre>

Exemples pour l'action applyCategory

Catégorisation basique de documents
Schéma conceptuel de l'exemple : Catégorisation basique de documents

Gemini said
Cet exemple automatise l'extraction de concepts via l'action applyCategory. Il projette un modèle de règles linguistiques sur un corpus CAS pour mapper chaque docId à ses thématiques cibles.

Catégorisation détaillée avec extraction des correspondances (matches)
Schéma conceptuel de l'exemple : Catégorisation détaillée avec extraction des correspondances (matches)

Cet exemple déploie un scoring pondéré pour isoler les déclencheurs textuels. Il génère une traçabilité granulaire via matchOut et groupedMatchOut afin d'auditer les preuves de classification.