Projet d'analyse des ventes d'une entreprise de retail dans les produits culturels.
Pour ce projet, les données ont été manipulées en Python. Pratique des bases de la statistique descriptive (moyenne, médiane, variance, représentations graphiques, tests de corrélation, analyse bivariée, etc.).
Un accès à la base de données de l’entreprise vers les fichiers CSV. Voici les fichiers à votre disposition :
- les ventes (appelées “Transactions”);
- la liste des clients;
- la liste des produits.
- Décrire un jeu de données par la statistique descriptive
- Maîtriser les concepts statistiques fondamentaux
- Nettoyer un jeu de données
Si vous n'avez jamais installé Python, alors autant installer directement la distribution Anaconda. Anaconda est donc une distribution Python, faite pour la Data Science.
De cette manière on peut installer Python et ses librairies de Data Science Pandas, Matplotlib, Seaborn, Scipy, Numpy etc… Mais aussi le notebook Jupyter, qui reste incontournable et vivement recommandé! C'est par ici : Anaconda
Si vous souhaitez lancer le projet, il sera nécessaire d'installer Jupyter Notebook sur votre mahcine. La doc. Jupyter est accessible via : Jupyter Documentation
python -m pip install --upgrade pip
python -m pip install jupyter
Pour tester l'installation, vous pouvez taper dans votre console la commande suivante :
jupyter notebook
Pour installer python ainsi que les librairies de Data Science, il est fortement recommandé d'installer la distribution Anaconda.
pip install pandas
pip install matplotlib
pip install numpy
pip install scipy