Extraction de fragments syntaxiques en français à partir d'une mesure d'autonomie basée sur l'entropie - Conférences TALN RECITAL Accéder directement au contenu
Communication Dans Un Congrès Année : 2021

Extraction de fragments syntaxiques en français à partir d'une mesure d'autonomie basée sur l'entropie

Résumé

Dans cet article nous nous intéressons à la prédiction du caractère syntaxique ou non d’une séquence de tokens dans des corpus du français. En particulier, nous comparons une méthode d’extraction de fragments syntaxiques identifiés au moyen d’une mesure d’autonomie basée sur l’entropie à une méthode de référence qui extrait des fragments aléatoires. Les résultats semblent indiquer que les fragments ainsi extraits sont bien plus souvent des unités syntaxiques que les fragments aléatoires. Une telle méthode pourrait être utilisée dans des travaux ultérieurs afin de proposer une induction non-supervisée de structures de dépendances syntaxiques.
Fichier principal
Vignette du fichier
58.pdf (500.42 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte

Dates et versions

hal-03265907 , version 1 (23-06-2021)

Identifiants

  • HAL Id : hal-03265907 , version 1

Citer

Marine Courtin. Extraction de fragments syntaxiques en français à partir d'une mesure d'autonomie basée sur l'entropie. Traitement Automatique des Langues Naturelles, 2021, Lille, France. pp.15-27. ⟨hal-03265907⟩
79 Consultations
40 Téléchargements

Partager

Gmail Facebook X LinkedIn More