Titre : | Analyse des sentiments en langue Arabe | Type de document : | projet fin études | Auteurs : | Amina SGHIRI, Auteur | Langues : | Français (fre) | Catégories : | BIG DATA
| Mots-clĂ©s : | Analyse de sentiments, classification, lexique, approche linguistique, approche d’apprentissage automatique | Index. dĂ©cimale : | mast 282/19 | RĂ©sumĂ© : | Ce mémoire présente l’étude que nous avons réalisée pour la classification des sentiments en arabe. Nous utilisons un corpus arabe ASTD. Nous utilisons l’approche linguistique en créant un lexique en se traduisant le dictionnaire anglais AFINN pour déterminer la polarité des twittes, et pour l’approche d’apprentissage automatique, nous avons fait appel à deux classificateurs communs connus pour leur efficacité, à savoir Naïve Bayes, Machines à vecteurs de support. Nous étudions certains paramètres pour identifier ceux qui permettent d’obtenir les meilleurs résultats. Ces paramètres concernent le seuillage de la fréquence des termes, la pondération des termes et les mots n-grammes. Nous montrons que Naïve Bayes et les machines à vecteurs de support sont compétitifs. Nos résultats montrent que les performances de la classification nécessitent le prétraitement de données.
|
Analyse des sentiments en langue Arabe [projet fin études] / Amina SGHIRI, Auteur . - [s.d.]. Langues : Français ( fre) Catégories : | BIG DATA
| Mots-clĂ©s : | Analyse de sentiments, classification, lexique, approche linguistique, approche d’apprentissage automatique | Index. dĂ©cimale : | mast 282/19 | RĂ©sumĂ© : | Ce mémoire présente l’étude que nous avons réalisée pour la classification des sentiments en arabe. Nous utilisons un corpus arabe ASTD. Nous utilisons l’approche linguistique en créant un lexique en se traduisant le dictionnaire anglais AFINN pour déterminer la polarité des twittes, et pour l’approche d’apprentissage automatique, nous avons fait appel à deux classificateurs communs connus pour leur efficacité, à savoir Naïve Bayes, Machines à vecteurs de support. Nous étudions certains paramètres pour identifier ceux qui permettent d’obtenir les meilleurs résultats. Ces paramètres concernent le seuillage de la fréquence des termes, la pondération des termes et les mots n-grammes. Nous montrons que Naïve Bayes et les machines à vecteurs de support sont compétitifs. Nos résultats montrent que les performances de la classification nécessitent le prétraitement de données.
|
|