Paramétrage Linguistique en Text Analytics

Comment spécifier la langue des documents analysés ? - applyConcept

Le paramètre language définit la langue utilisée dans la table d'entrée. La valeur par défaut est "ENGLISH".

Schéma : Comment spécifier la langue des documents analysés ?

Exemple de Code Additionnel

1	<pre>/* CASL Script : Configuration Linguistique pour l'Analyse Textuelle
2	(c) Nicolas Housset 2026 - Code SAS pour VIYA 4 - testé et validé en version 2024.09 */
3	/* 1. Chargement de l'action set nécessaire */
4	ACTION BUILTINS.LOADACTIONSET / actionSet="textParse";
5	/* 2. Exécution du parsing en spécifiant explicitement la langue française */
6	ACTION textParse.tpParse RESULT=r STATUS=rc /
7	TABLE={name="AVIS_CLIENTS", caslib="Public"}
8	docId="ID_AVIS"
9	text="VERBATIM"
10	language="FRENCH" /* Déclaration explicite indispensable */
11	nounGroups=true
12	offset={name="OUT_PARSED", caslib="Public", replace=true};
13	/* 3. Gestion experte du retour de l'action */
14	IF rc.statusCode == 0 THEN
15	PRINT "Succès : L'analyse grammaticale a été appliquée avec les règles de la langue française.";
16	else
17	print "Erreur lors de l'analyse : " \|\| rc.reason;
18	END;</pre>

Exemples pour l'action applyConcept

Application du modèle de concept de base

Cet exemple illustre l'extraction d'entités via l'action applyConcept. Sans paramètre model, le moteur NLP déploie son modèle LISI natif pour isoler types d'entités et faits structurés.

Extraction avancée avec filtrage de concepts et optimisation mémoire

Cet exemple optimise l'action applyConcept : segmentation par chunks de 16 Ko, filtrage sélectif via dropConcepts et traçabilité des règles avec ruleMatchOut pour un scoring haute précision.

Conseil de l'Expert

Ne vous reposez jamais sur la valeur par défaut ("ENGLISH") lorsque vous travaillez dans un contexte international ou francophone. Déclarez toujours explicitement votre paramètre language="FRENCH".

De plus, si votre table d'entrée contient des données multilingues (par exemple, des avis clients européens), ne traitez pas tout en un seul bloc. La bonne pratique sur SAS Viya 4 consiste à utiliser d'abord l'action textManagement.identifyLanguage pour détecter la langue de chaque ligne, puis à partitionner votre table (via un filtre ou un GroupBy) pour envoyer chaque sous-ensemble vers l'action de parsing ou d'analyse de sentiment avec le paramètre language approprié. Cela garantit l'utilisation des bons dictionnaires (stop-lists, stemming) pour chaque document.

Cette réponse vous a-t-elle aidé ?