Préparation des données & Machine Learning
La préparation des données consiste à rendre un jeu de données fiable et exploitable avant son analyse ou son utilisation dans un modèle. Dans mes projets, je travaille sur le nettoyage, la transformation des variables, la gestion des valeurs manquantes et la préparation des données d'entraînement. Cette compétence se prolonge avec le machine learning, qui permet de tester plusieurs approches, d'évaluer leurs performances et d'interpréter les résultats obtenus.
- Nettoyage des données : valeurs manquantes, doublons, formats et incohérences
- Transformation des variables pour préparer l'analyse et l'entraînement des modèles
- Entraînement et comparaison de plusieurs algorithmes de classification
- Évaluation des performances avec validation croisée, AUC et taux d'erreur

Visa Premier — Prédiction de détention bancaire
Ce projet porte sur la prédiction de la détention d'une carte Visa Premier à partir de données clients. Le travail a consisté à préparer le jeu de données, entraîner plusieurs modèles de classification et comparer leurs performances afin d'identifier l'approche la plus adaptée au problème étudié.
- Préparation du jeu de données avant modélisation : nettoyage, transformation et sélection des variables utiles
- Entraînement et comparaison de plusieurs modèles, dont arbre de décision, modèle bayésien naïf et réseau de neurones
- Évaluation des performances à partir de la validation croisée, de l'AUC et du taux d'erreur