Projet dépression

Application web d'analyse combinant machine learning, statistiques avancées et visualisation pour identifier des facteurs de risque liés à la dépression.

Résumé du projet

Projet d'analyse de données et de machine learning centré sur l'étude de variables sociodémographiques et comportementales liées à la dépression. L'application combine gestion de données CRUD, modélisation, visualisation analytique et recherche sémantique.

État actuel

Application web développée avec gestion de données et interface d'analyse.
Modèles de classification, régression et clustering implémentés.
Visualisations analytiques et exploration statistique intégrées.
Recherche sémantique basée sur embeddings ajoutée.

Stack technique

PythonFlaskPandasScikit-learnMongoDBHTML/CSS

Tags & Code

Data ScienceMachine LearningFlaskMongoDB

Code privé (projet académique)

Vision

Créer une plateforme unifiée pour explorer et analyser des données liées à la dépression.
Mettre en évidence des relations entre variables comportementales, sociodémographiques et indicateurs de risque.
Combiner exploration statistique, modèles de machine learning et visualisation dans une interface web.

Architecture

Application web Flask avec gestion de données sociodémographiques en mode CRUD.
Pipelines de traitement et de stockage des données avec MongoDB Atlas.
Modules analytiques : classification, régression, clustering et réduction de dimension (PCA).
Visualisation des résultats : graphiques analytiques, matrices de confusion, exploration statistique.
Recherche sémantique basée sur embeddings pour enrichir l'exploration des données.

Roadmap

Phase 1 : gestion et structuration des données sociodémographiques.
Phase 2 : analyses statistiques, corrélations et exploration PCA.
Phase 3 : implémentation des modèles de machine learning et visualisation.
Phase 4 : enrichissement par recherche sémantique et amélioration de l'interface.

Décisions techniques

Flask pour une architecture légère et adaptée à un projet analytique web.
MongoDB Atlas pour la flexibilité de stockage et l'intégration simple avec les pipelines.
Séparation claire entre gestion des données, analyse statistique, modélisation et visualisation.
Recherche sémantique pour aller au-delà d'une simple interface de consultation.

Améliorations possibles

Améliorer l'interface pour rendre l'exploration plus intuitive.
Renforcer la comparaison entre modèles de machine learning.
Documenter davantage les pipelines et hypothèses analytiques.

Lessons learned

Un projet data pertinent demande autant de rigueur en gestion des données qu'en modélisation.
La visualisation joue un rôle clé pour rendre les résultats interprétables.
Une interface web analytique rend un projet scientifique beaucoup plus exploitable.

Captures d'écran

Aperçu du projet dépression

← Tous les projets Me contacter