(Retour à la liste)

M-5. Nuage de mots


Les nuages de mots sont apparus récemment pour représenter les mots-clés les plus importants sur une page ou un ensemble de pages web.

Nuage de mots

L'objectif de ce projet est d'écrire un programme pouvant déterminer, à partir d'un fichier texte, les mots à afficher dans le nuage de mots et leur taille.

Vous pourrez tester votre programme avec, par exemple, des fichiers textes issus du projet Gutemberg, et en particulier le livre « Cinq semaines en ballon » de Jules Verne.

Cahier des charges

Votre programme demande à l'utilisateur d'entrer un nom de fichier. Il transforme alors le contenu du fichier en une liste de tous les mots (en faisant bien attention à les transformer de manière à traiter de la même manière les majuscules et minuscules et à retirer la ponctuation).

La fréquence des mots est ensuite déterminée en utilisant un dictionnaire, puis les 50 mots les plus fréquents sont extraits.

Enfin, le programme écrit un fichier au format HTML contenant les 50 mots, en utilisant la taille de la police pour indiquer leur fréquence. L'utilisateur peut alors visualiser le résultat en ouvrant le fichier produit dans un navigateur web.

Aucun exemple d'interface n'est donné car la réalisation d'une interface adaptée fait partie des objectifs du projet.

Pour aller plus loin (palier 4)

Une fois que vous avez atteint le palier 3 des fonctionnalités, voici quelques idées pour aller plus loin et atteindre le palier 4 :