Études statistiques

Ce projet regroupe deux initiatives d’analyse statistique visant à révéler des insights sur des problématiques sociétales clés. La première analyse se concentre sur les taux de décrochage scolaire, en examinant l’influence de facteurs tels que le genre, la région et le type d’établissement. La seconde étude explore les déterminants du statut de principale pourvoyeuse de ressources dans les ménages féminins, à l’aide de la régression logistique. Ces deux analyses s’appuient sur des techniques statistiques avancées, des visualisations de données détaillées et une réflexion approfondie, afin de fournir des recommandations exploitables sur les dynamiques éducatives et sociales.

STATISTICSDATA VIZUALISATIONSTATSMODELS

7/7/20241 min lire

Fonctionnalités principales

  • Analyse du décrochage scolaire : Identifie les facteurs clés influençant les taux de décrochage scolaire en analysant des variables telles que la région, le genre et le secteur scolaire, à l’aide de méthodes statistiques et de visualisations.

  • Statut de principale pourvoyeuse de ressources : Utilise la régression logistique binaire pour déterminer les facteurs prédictifs des femmes en tant que principales sources de revenus dans les ménages, en tenant compte de la taille du foyer, du revenu et du nombre de travailleurs actifs.

  • Techniques statistiques avancées : Inclut des tests non paramétriques comme le test de Kruskal-Wallis, le test de Dunn, le test U de Mann-Whitney, ainsi que l’analyse de corrélation, en plus de la régression logistique pour les modèles prédictifs.

  • Visualisations riches : Produit des graphiques détaillés, tels que des boîtes à moustaches et des diagrammes de dispersion, pour une présentation claire et pertinente des données.

Stack Technologique

  • Gestion des données : pandas, numpy

  • Analyse statistique : scipy, statsmodels, sklearn

  • Visualisation des données : matplotlib, seaborn

  • Formats de données : Fichiers CSV et .sas7bdat pour les ensembles de données en entrée

  • Apprentissage automatique : Régression logistique pour les modèles prédictifs