forked from jetpackdata/jpdforcaster
-
Notifications
You must be signed in to change notification settings - Fork 0
Home
Simon edited this page Nov 25, 2017
·
4 revisions
Ce rapport contient un compte rendu détaillé des travaux qui ont été effectués suite au volet présentiel du Data Science Starter Programme de l’école Polytechniques Executive Education. Afin d’appliquer les concepts acquis durant cette première phase de certification, j’ai décidé de réaliser un projet en entreprise pour une mise en œuvre concrète de mon étude. Ainsi, j’ai eu l’opportunité de collaborer avec la startup JetPack Data afin de définir et implémenter un module de prédiction de séries temporelles pour les utilisateurs de la plateforme.
Table des matières
- 1 Introduction
- 1.1 Enjeu
- 1.2 Contextualisation
- 1.3 Structure de ce mémoire
- 2 Vue d’ensemble sur la plateforme JetPack Data
- 2.1 Présentation de la plateforme
- 2.2 Technologies utilisées et architecture simplifiée de la plateforme
- 2.3 Description des jeux de données utilisés
- 2.3.1 Jeu de données correspondant à un revenu économique
- 2.3.2 Jeu de données correspondant à un volume de vente (lien)
- 2.3.3 Jeu de données correspondant à un stock financier
- 2.3.4 Commentaire sur les jeux de données utilisées dans ce mémoire
- 2.4 Contour du « produit minimum viable » à livrer
- 3 Modèles statistiques pour la prédiction des time series
- 3.1 Introduction à la statistique des series temporelle et exploration des séries temporelles
- 3.1.1 Notion de stationnarité
- 3.1.2 Décomposition d’une série non-stationnaire
- 3.2 Expérimentation et sélection de modèles de prédiction
- 3.2.1 Expérimentation avec le modèle ARIMA [6] [7]
- 3.2.2 Expérimentation avec le module Prophet de Facebook
- 3.2.3 Description du produit livré
- 4 Machine Learning, Deep Learning et time series
- 4.1 Fonctionnement des RNN LSTM
- 4.1.1 Aperçu général d’un RNN
- 4.1.2 Détail d’un neurone LSTM
- 4.2 Réseau de neurones dans un contexte de time series
- 4.3 Expérimentation autour des LSTM et des time series
- 4.3.1 Préparation des données pour de l’apprentissage supervisé
- 4.3.2 Préparation des données pour de l’apprentissage d’un réseau LSTM
- 4.4 Résultat des différents tests effectués
- 4.4.1 Variation du volume d’entrainement pour les ventes de champagne
- 4.4.2 Réseau LSTM sur un stock financier
- 4.4.3 Récapitulatif sur les réseaux LSTM
- 5 Conclusion et élargissement
- 6 Annexes