Comment spécifier la langue des documents analysés ?

Paramétrage Linguistique en Text Analytics

Le paramètre language définit la langue utilisée dans la table d'entrée. La valeur par défaut est "ENGLISH".

Schéma : Comment spécifier la langue des documents analysés ?

Exemple de Code Additionnel

1<pre>/* CASL Script : Configuration Linguistique pour l'Analyse Textuelle
2(c) Nicolas Housset 2026 - Code SAS pour VIYA 4 - testé et validé en version 2024.09 */
3/* 1. Chargement de l'action set nécessaire */
4ACTION BUILTINS.LOADACTIONSET / actionSet="textParse";
5/* 2. Exécution du parsing en spécifiant explicitement la langue française */
6ACTION textParse.tpParse RESULT=r STATUS=rc /
7TABLE={name="AVIS_CLIENTS", caslib="Public"}
8docId="ID_AVIS"
9text="VERBATIM"
10language="FRENCH" /* Déclaration explicite indispensable */
11nounGroups=true
12offset={name="OUT_PARSED", caslib="Public", replace=true};
13/* 3. Gestion experte du retour de l'action */
14IF rc.statusCode == 0 THEN
15PRINT "Succès : L'analyse grammaticale a été appliquée avec les règles de la langue française.";
16else
17print "Erreur lors de l'analyse : " || rc.reason;
18END;</pre>

Exemples pour l'action applyConcept

Application du modèle de concept de base
Schéma conceptuel de l'exemple : Application du modèle de concept de base

Cet exemple illustre l'extraction d'entités via l'action applyConcept. Sans paramètre model, le moteur NLP déploie son modèle LISI natif pour isoler types d'entités et faits structurés.

Extraction avancée avec filtrage de concepts et optimisation mémoire
Schéma conceptuel de l'exemple : Extraction avancée avec filtrage de concepts et optimisation mémoire

Cet exemple optimise l'action applyConcept : segmentation par chunks de 16 Ko, filtrage sélectif via dropConcepts et traçabilité des règles avec ruleMatchOut pour un scoring haute précision.