Terminé2025Conception, développement web, analyse de données et modélisation
Projet dépression
Application web d'analyse combinant machine learning, statistiques avancées et visualisation pour identifier des facteurs de risque liés à la dépression.

Résumé du projet
Projet d'analyse de données et de machine learning centré sur l'étude de variables sociodémographiques et comportementales liées à la dépression. L'application combine gestion de données CRUD, modélisation, visualisation analytique et recherche sémantique.
État actuel
- Application web développée avec gestion de données et interface d'analyse.
- Modèles de classification, régression et clustering implémentés.
- Visualisations analytiques et exploration statistique intégrées.
- Recherche sémantique basée sur embeddings ajoutée.
Stack technique
PythonFlaskPandasScikit-learnMongoDBHTML/CSS
Tags & Code
Data ScienceMachine LearningFlaskMongoDB
Code privé (projet académique)
Vision
- Créer une plateforme unifiée pour explorer et analyser des données liées à la dépression.
- Mettre en évidence des relations entre variables comportementales, sociodémographiques et indicateurs de risque.
- Combiner exploration statistique, modèles de machine learning et visualisation dans une interface web.
Architecture
- Application web Flask avec gestion de données sociodémographiques en mode CRUD.
- Pipelines de traitement et de stockage des données avec MongoDB Atlas.
- Modules analytiques : classification, régression, clustering et réduction de dimension (PCA).
- Visualisation des résultats : graphiques analytiques, matrices de confusion, exploration statistique.
- Recherche sémantique basée sur embeddings pour enrichir l'exploration des données.
Roadmap
- Phase 1 : gestion et structuration des données sociodémographiques.
- Phase 2 : analyses statistiques, corrélations et exploration PCA.
- Phase 3 : implémentation des modèles de machine learning et visualisation.
- Phase 4 : enrichissement par recherche sémantique et amélioration de l'interface.
Décisions techniques
- Flask pour une architecture légère et adaptée à un projet analytique web.
- MongoDB Atlas pour la flexibilité de stockage et l'intégration simple avec les pipelines.
- Séparation claire entre gestion des données, analyse statistique, modélisation et visualisation.
- Recherche sémantique pour aller au-delà d'une simple interface de consultation.
Améliorations possibles
- Améliorer l'interface pour rendre l'exploration plus intuitive.
- Renforcer la comparaison entre modèles de machine learning.
- Documenter davantage les pipelines et hypothèses analytiques.
Lessons learned
- Un projet data pertinent demande autant de rigueur en gestion des données qu'en modélisation.
- La visualisation joue un rôle clé pour rendre les résultats interprétables.
- Une interface web analytique rend un projet scientifique beaucoup plus exploitable.
Captures d'écran

Aperçu du projet dépression