Titre : | Indexation Automatique et recherche d'information en langue arabe | Type de document : | projet fin études | Auteurs : | RHEMIMET Oumayma, Auteur | Année de publication : | 2018 | Langues : | Français (fre) | Catégories : | Internet des Objets et Services Mobiles ( IOSM )
| Mots-clés : | Fouille de textes, langue arabe, méthode d’indexation, lemmatisation, recherche
d'information. | Index. dĂ©cimale : | mast 32/18 | RĂ©sumĂ© : | L'indexation est le processus de représentation de l'information ou d'un document par un
indice ou mot clé, et l'indexation des documents est une phase très importante dans la fouille
de textes. Nous se basons sur des descripteurs les plus applicables vis à vis de leurs contenus.
Pour ce fait, plusieurs approches sont proposées dans la littérature, notamment pour le
français, l'anglais, mais elles sont inexploitables par les documents en langue arabe en raison
de ses particularités spécifiques, de sa richesse morphologique et grammaticale et lexicale.
La recherche d'information a pour but de faciliter à l'utilisateur l'accès à l'information qu'il
veut. Cette information étant située dans une masse de documents textuels, pour atteindre ce
but un système de recherche d'information doit stocker, représenter et organiser l'information,
puis apporter à l'utilisateur les éléments correspondant au besoin d'information exprimé par sa
requête.
Dans ce travail, nous avons proposé une méthode hybride qui incorpore trois techniques
différentes pour que la lemmatisation arabe résolve les problèmes liés à chaque technique.
Ces trois techniques sont : dictionnaire, analyse morphologique et suppression d'affixe, afin
d'améliorer le processus de recherche d’information et de récolter des résultats plus
performants.
|
Indexation Automatique et recherche d'information en langue arabe [projet fin études] / RHEMIMET Oumayma, Auteur . - 2018. Langues : Français ( fre) Catégories : | Internet des Objets et Services Mobiles ( IOSM )
| Mots-clés : | Fouille de textes, langue arabe, méthode d’indexation, lemmatisation, recherche
d'information. | Index. dĂ©cimale : | mast 32/18 | RĂ©sumĂ© : | L'indexation est le processus de représentation de l'information ou d'un document par un
indice ou mot clé, et l'indexation des documents est une phase très importante dans la fouille
de textes. Nous se basons sur des descripteurs les plus applicables vis à vis de leurs contenus.
Pour ce fait, plusieurs approches sont proposées dans la littérature, notamment pour le
français, l'anglais, mais elles sont inexploitables par les documents en langue arabe en raison
de ses particularités spécifiques, de sa richesse morphologique et grammaticale et lexicale.
La recherche d'information a pour but de faciliter à l'utilisateur l'accès à l'information qu'il
veut. Cette information étant située dans une masse de documents textuels, pour atteindre ce
but un système de recherche d'information doit stocker, représenter et organiser l'information,
puis apporter à l'utilisateur les éléments correspondant au besoin d'information exprimé par sa
requête.
Dans ce travail, nous avons proposé une méthode hybride qui incorpore trois techniques
différentes pour que la lemmatisation arabe résolve les problèmes liés à chaque technique.
Ces trois techniques sont : dictionnaire, analyse morphologique et suppression d'affixe, afin
d'améliorer le processus de recherche d’information et de récolter des résultats plus
performants.
|
|