|
|
Titre :
Analyse syntaxique Robuste de la langue Arabe non voyellée utilisant l’approche multi-agents.
Problématique :
Les applications associées aux traitement automatique du langage naturel (T.A.L.N) sont très variées (communication Homme-Machine, recherche d’informations, vérification et correction grammaticales, etc.,) mais elles portent toutes une exigence commune : La nécessité d’une analyse linguistique, qui peut aller du simple découpage du texte en phrases jusqu'à la reconnaissance des rapports fonctionnels entre syntagmes voir même l’interprétation des structures sémantiques par rapport au contexte de l’énoncé.
Ces opérations relèvent de niveaux d’analyse distincts, à savoir l’analyse morphologique qui permet de reconnaître les diverses formes que peut prendre le mot dans les phrases, l’analyse syntaxique qui permet de traiter la distribution et l’agencement des mots, l’analyse sémantique permettant de déterminer le sens littéral de la phrase à partir du sens de ses éléments constitutifs, et l’analyse pragmatique permettant de reconnaître le sens particulier de l’énoncé en fonction des données contextuelles.
Dans ce travail nous nous intéressons à l’analyse syntaxique qui représente une étape fondamentale dans le processus de d'analyse automatique du langage, puisque c’est à elle qu’incombe la tache cruciale de déterminer les structures syntaxiques des phrases d’un texte. Ce sont ces structures, en effet qui vont permettre ensuite de calculer les diverses interprétations sémantiques et pragmatiques. Une erreur au niveau du découpage des syntagmes ou un mauvais choix des catégories grammaticales de la part de l’analyseur syntaxique sera propagée aux autres niveaux d’analyse (Sabah 1989).
Un analyseur syntaxique peut être considéré donc comme un mécanisme qui assigne à un texte d’entrée un ensemble de représentations formelles comportant toutes les informations grammaticales et lexicales relatives à la phrase d’entrée. Il comporte: une composante déclarative qui correspond aux connaissances linguistiques et une composante procedurale qui incarne la stratégie d’analyse. Les connaissances linguistiques comprennent la grammaire et le vocabulaire, alors que la stratégie d’analyse est la démarche utilisée par l’analyseur pour exploiter et traiter les informations à sa disposition et déterminer par la suite la structure qui peut être assignée à la phrase analysée.
Par ailleurs, l’analyse syntaxique doit être robuste car les textes appréhendés ne sont pas toujours bien formés. Ils peuvent contenir des erreurs de tout genre et renfermer des ambiguïtés de tout genre.
Le problème de l’analyse syntaxique automatique a fait l’objet d’un nombre relativement important de travaux de recherche. Utilisant des approches différentes d’analyse et de représentation des connaissances linguistiques. Toutefois, les résultats obtenus ne sont pas encore à la hauteur des ambitions notamment en ce qui concerne le degrés de robustesse des analyseurs et leur capacité à appréhender des corpus de large couverture. C’est les raisons pour lesquelles de nouvelles stratégies d’analyse sont proposées ces dernières années, basées notamment sur la distribution des traitements (i.e., IAD). Ce type d’approche permet de résoudre les problèmes de manque d’interactions entre les niveaux de représentation, l’absence de distribution du contrôle et des connaissances et la difficulté d’évolution du système. (Stefanini 1992).
L’IAD pose, pour l’analyse syntaxique, plusieurs problèmes dont notamment l’identification des taches élémentaires à faire coopérer, la mise en œuvre des moyens de communication et de coordination et la gestion des conflits entre agents (Warren 1998).