Skip to content

Machine Learning : Déterminer si un champignon est comestible ou non

Notifications You must be signed in to change notification settings

CDucloux/To-eat-mushroom-or-not-to-eat

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

18 Commits
 
 
 
 
 
 
 
 

Repository files navigation

To eat mushroom or not to eat ? 🍄

Projet réalisé par Guillaume DEVANT et Corentin DUCLOUX

Préambule

Dans Hamlet, William Shakespeare écrivait :

To be or not to be, that is the question.

La question To eat mushroom, or not to eat suscite elle aussi de nombreuses interrogations...

Nous allons tenter de classer avec précision les champignons comestibles et les champignons toxiques recensés dans la base UCI Mushroom.

Note : La présentation sous forme de diapositives interactives est disponible ici : Présentation Reveal.js

⚠️ Quelques précautions

Si les résultats de certains algorithmes semblent extraordinaires, il est fortement recommandé de suivre les précautions de l'Anses et d'éviter d'utiliser des applications de reconaissance de champignons !

Statistiques descriptives

Nous avons découvert plusieurs phénomènes intéressants :

  • Les champignons toxiques sont en moyenne plus petits (de manière statistiquement significative) que les champignons comestibles
  • Certains types d'habitats ont une proportion de champignons comestibles plus importante que d'autres
  • Certaines couleurs de champignons peuvent être des indicateurs de la comestibilité de ceux-ci
n = marron b = beige g = gris r = vert
p = rose u = violet e = rouge w = blanc
y = jaune l = bleu o = orange k = noir

⚙️ Quel modèle choisir ?

L'ensemble du travail a été réalisé avec les librairies tidymodels et doParallel.

Nous avons utilisé les 8 modèles suivants :

  • Linear Discriminant Analysis
  • Quadratic Discriminant Analysis
  • Linear Support Vector Machine
  • Logit
  • K-Nearest Neighbors
  • Decision Tree
  • Random Forest
  • XGboost

Parmi ces modèles, les méthodes d'ensemble et de boosting semblent être les plus performantes avec des erreurs globales de classement inférieures à 2% sur l'ensemble de test.

  • Pour plus de détail, voir le fichier pdf avec l'ensemble des résultats disponible ici : Mushroom Results

About

Machine Learning : Déterminer si un champignon est comestible ou non

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published