Comment exploiter des documents pré-analysés pour une performance accrue ?

Optimisation NLP : Réutilisation du Parsing LITI

Le paramètre parseTableIn indique le nom de la table CAS précédemment créée avec le paramètre parseTableOut d'une action applyConcept antérieure. Cette table contient des documents pré-analysés. Le paramètre parseTableIn ne remplace pas la table spécifiée par le paramètre table (qui contient le texte brut). Son utilisation, en combinaison avec parseTableOut, améliore l'efficacité de l'action applyConcept, notamment lorsque l'opérateur CLAUS_n est employé dans le modèleReprésentation mathématique entraînée sur des données pour capturer des tendances, prédire des résultats ou classifier des observations via des algorithmes (Régression, Forêt aléatoire, Gradient Boosting). LITI. Il est important de ne pas spécifier les paramètres parseTableIn et parseTableOut dans le même appel de l'action applyConcept. Pour plus de précisions, consultez le paramètre commun castable (Form 1).

Schéma : Comment exploiter des documents pré-analysés pour une performance accrue ?

Exemples pour l'action applyConcept

Application du modèle de concept de base
Schéma conceptuel de l'exemple : Application du modèle de concept de base

Cet exemple illustre l'extraction d'entités via l'action applyConcept. Sans paramètre model, le moteur NLP déploie son modèle LISI natif pour isoler types d'entités et faits structurés.

Extraction avancée avec filtrage de concepts et optimisation mémoire
Schéma conceptuel de l'exemple : Extraction avancée avec filtrage de concepts et optimisation mémoire

Cet exemple optimise l'action applyConcept : segmentation par chunks de 16 Ko, filtrage sélectif via dropConcepts et traçabilité des règles avec ruleMatchOut pour un scoring haute précision.