بسم الله الرحمان الرحيم........
من فضلكم من يستطيع مساعدتى في حل هدا tp او على الاقل مساعدتي بافكار
Segmenttattiion d’’un documentt ttextte
La première phase dans le processus d’un système de recherche d’information
est la phase d’indexation. La première étape dans cette phase (indexation) est
l’étape segmentation.
Le but de ce TP est de développer une application qui fait l’extraction des unités
lexicales contenues dans un fichier texte.
Pour réaliser ce projet nous allons utiliser l’environnement de développement
Visual C++.
Les étapes à suivre pour la réalisation sont les suivantes :
1. Lecture du texte à partir d’un fichier
Dans cette partie nous allons charger le contenu du fichier en mémoire et
l’afficher.
2. Recherche des délimiteurs et définition des unités lexicales
Cette partie représente le noyau de notre travail. Dans cette phase nous allons
préparer une liste de délimiteurs de texte (exp. blanc, virgule, point, tiret …etc) puis
nous recherchons ces délimiteurs dans le texte original pour séparer les unités
lexicales, les afficher et les stocker dans un autre fichier.
Ce TP doit être réalisé en utilisant l’environnement de développement Visual
C++
La remise du TP se fait sur la plate forme Moodle sous forme d’un seul fichier
avec le nom de « prenom_nom.zip ».
Ce fichier compressé doit contenir :
- Le projet C++ généré par Visual C++ compressé dans un seul fichier ;
- Le rapport : c’est un document Word contenant la description de votre
travail.