Collecter des données SQL et requêtes. Agrégations, automatiser le web scraping et les requêtes à une API REST, et utiliser des outils de geocodage. Contrôler la collecte et l'utilisation des données tout en évaluant les enjeux du RGPD.
Automatisation du traitement des données Analyser les besoins de traitement de données et structurer des outils. Fiabiliser les outils et organiser le code. Utiliser Google Colab ou JupyterLab pour exécuter des scripts en Python, manipuler des données avec NumPy et Pandas, et traiter les valeurs aberrantes. Appliquer des expressions régulières pour le texte, clean code.
Modélisation des données structurées Machine Learning en modélisant des régressions et classifications supervisées. Clustering non-supervisé, appliquer des méthodes de réduction dimensionnelle, et traiter automatiquement le langage naturel (NLP) pour extraire des informations pertinentes. Scikit-learn.
Visualisation des données Visualisations : nuages de points, boîtes à moustache et histogrammes.
Manipuler la dataviz interactive : Plotly, cartographies avec Folium. Power BI Tableau