Detecteur de Spam (Spam detector)

Vous trouverez ci-dessous les instructions et détails sur l’application de détecteur de Spam (version 2). Le but de cette application étant de determiner si un texte donné, venant typiquement d’un email est catégorisé comme spam ou non.

L’application présenté ici utilise et compare un certain nombre d’algorithmes de détection du spam (Bayes, MLP, Random Forest, …)

Installation

Pour installer l’application, commencez par copier le dépot du livre (AI-book sur github), soit en recupérant l’archive zip depuis github, soit à l’aide de l’outil git:

git clone https://github.com/iridia-ulb/AI-book

Puis, accedez au dossier:

cd SpamDetector2

Après avoir installé python et poetry, rendez vous dans ce dossier et installez les dépendances du projet:

poetry install

Utilisation

Vous pouvez ensuite lancer l’application dans l’un des modes: show, train, test, classify ou compare.

Par exemple

poetry run python main.py show

En résumé:

usage: main.py [-h] {show,train,test,classify,compare} ...

Spam detector

positional arguments:
  {show,train,test,classify,compare}
                        Operation to run
    show                Show the most common spam words as a word cloud
    train               Train an extractor/classifier pair and save it
    test                Test an extractor/classifier pair and show metrics
    classify            Classify the given text as ham/spam using a specified extractor/classifier pair
    compare             Compare metrics of different extractor/classifier pairs

options:
  -h, --help            show this help message and exit