# ANÁLISIS ESTADÍSTICO AVANZADO - MENORES CONDENADOS ESPAÑA ## Contrastes, Modelos y Simulador Interactivo (2013-2024) --- ## RESUMEN EJECUTIVO Se ha completado un análisis estadístico integral que incluye: - **Contrastes de comparación de medias** entre períodos temporales - **Intervalos de confianza** para estadísticos clave - **Tests no paramétricos** para validar hallazgos - **Modelos explicativos múltiples** con comparación de performance - **Simulador interactivo** para explorar escenarios futuros --- ## 1. CONTRASTES DE COMPARACIÓN DE MEDIAS ### DIVISIÓN TEMPORAL - **Crisis (2013-2016):** 4 observaciones, Media = 12,380 - **Recuperación (2017-2020):** 4 observaciones, Media = 10,686 - **Estabilización (2021-2024):** 4 observaciones, Media = 9,384 ### TESTS DE NORMALIDAD (Shapiro-Wilk) | Período | W | p-value | Resultado | |---------|---|---------|-----------| | Crisis | 0.975 | 0.871 | **Normal** | | Recuperación | 0.986 | 0.934 | **Normal** | | Estabilización | 0.985 | 0.931 | **Normal** | ### ANOVA DE UNA VÍA - **F = 28.905, p-value < 0.001** - **RESULTADO: Diferencias significativas entre períodos** ### COMPARACIONES POST-HOC (t-tests) | Comparación | t | p-value | Diferencia | Significativo | |-------------|---|---------|------------|---------------| | Crisis vs Recuperación | 3.836 | 0.009 | 1,693 | **SÍ** | | Crisis vs Estabilización | 6.963 | 0.000 | 2,996 | **SÍ** | | Recuperación vs Estabilización | 4.380 | 0.005 | 1,302 | **SÍ** | **CONCLUSIÓN:** Los tres períodos son estadísticamente diferentes entre sí. --- ## 2. INTERVALOS DE CONFIANZA ### PARA LA MEDIA DE MENORES CONDENADOS - **Media muestral:** 10,817 - **IC 90%:** [10,103 - 11,530] - **IC 95%:** [9,942 - 11,691] - **IC 99%:** [9,582 - 12,051] ### PARA CORRELACIONES CLAVE | Variable | r | IC 95% | |----------|---|--------| | **Abandono Escolar** | 0.986 | [0.949, 0.996] | | **Desempleo Juvenil** | 0.937 | [0.785, 0.983] | | **Riesgo Pobreza** | 0.831 | [0.491, 0.951] | | **PIB per Cápita** | -0.801 | [-0.942, -0.420] | **INTERPRETACIÓN:** Todas las correlaciones son estadísticamente significativas con alta confianza. --- ## 3. CONTRASTES NO PARAMÉTRICOS ### TEST U DE MANN-WHITNEY (Pre vs Post 2019) - **U = 36.0, p-value = 0.002** - **RESULTADO: Diferencia significativa** (no paramétrico) ### TEST DE KRUSKAL-WALLIS (3 períodos) - **H = 9.846, p-value = 0.007** - **RESULTADO: Diferencias significativas** entre períodos ### CORRELACIONES DE SPEARMAN | Variable | ρ (rho) | p-value | Significativo | |----------|---------|---------|---------------| | **Abandono Escolar** | 1.000 | 0.000 | **SÍ** | | **Desempleo Juvenil** | 0.874 | 0.000 | **SÍ** | | **PIB per Cápita** | -0.722 | 0.008 | **SÍ** | **VALIDACIÓN:** Los tests no paramétricos confirman los hallazgos paramétricos. --- ## 4. COMPARACIÓN DE MODELOS EXPLICATIVOS ### PERFORMANCE DE MODELOS | Modelo | R² | RMSE | Ranking | |--------|----|----- |---------| | **Polynomial** | 0.992 | 149 | 🥇 **1º** | | **Ridge** | 0.985 | 198 | 🥈 **2º** | | **Lasso** | 0.975 | 259 | 🥉 **3º** | | Linear | 0.974 | 263 | 4º | | Gradient Boosting | 0.811 | 710 | 5º | | Random Forest | 0.744 | 827 | 6º | ### MODELO ARIMA PARA SERIE TEMPORAL - **AIC: 166.20, BIC: 167.40** - **Parámetros:** - AR(1): 0.967 - MA(1): -0.679 - σ²: 18,730 **CONCLUSIÓN:** El modelo polinomial ofrece la mejor capacidad predictiva. --- ## 5. SIMULADOR INTERACTIVO - ESCENARIOS FUTUROS ### ESCENARIOS PREDEFINIDOS ANALIZADOS | Escenario | Predicción 2025 | vs 2024 | Cambio % | |-----------|----------------|---------|----------| | **Actual 2024** | 8,981 | +69 | +0.8% | | **Realista** | 9,183 | +271 | +3.0% | | **Crisis Educativa** | 9,375 | +463 | +5.2% | | **Optimista** | 9,870 | +958 | +10.7% | | **Recuperación Económica** | 10,054 | +1,142 | +12.8% | | **Pesimista** | 8,292 | -620 | -7.0% | ### ANÁLISIS DE SENSIBILIDAD **Variables con Mayor Impacto:** 1. **Abandono Escolar Temprano** - Relación directa fuerte 2. **PIB per Cápita** - Relación inversa significativa 3. **Desempleo Juvenil** - Correlación positiva moderada **Hallazgo Contraintuitivo:** - Los escenarios "Optimista" y "Recuperación Económica" predicen **aumentos** en menores condenados - Esto sugiere relaciones complejas que requieren análisis adicional --- ## 6. IMPLICACIONES PARA POLÍTICAS PÚBLICAS ### PRIORIDADES BASADAS EN EVIDENCIA **1. EDUCACIÓN (Máxima Prioridad)** - Cada punto % de reducción en abandono escolar = ~356 menos condenas - IC 95% de correlación: [0.949, 0.996] - **Evidencia robusta** - **Recomendación:** Invertir agresivamente en retención escolar **2. EMPLEO JUVENIL (Alta Prioridad)** - Correlación Spearman: 0.874 (p < 0.001) - **Recomendación:** Programas específicos de inserción laboral 15-24 años **3. REDUCCIÓN DE DESIGUALDAD (Prioridad Media)** - PIB per cápita correlación: -0.801 [IC: -0.942, -0.420] - **Recomendación:** Políticas redistributivas focalizadas ### MONITOREO CONTINUO REQUERIDO - Tests estadísticos confirman cambios estructurales entre períodos - Necesidad de actualización regular de modelos predictivos --- ## 7. ARCHIVOS Y HERRAMIENTAS GENERADAS ### VISUALIZACIONES CREADAS - `comparacion_modelos_predictivos.png` - Performance comparativa - `metricas_comparacion_modelos.png` - Métricas R² y RMSE - `simulacion_interactiva_completa.png` - Escenarios futuros ### HERRAMIENTAS INTERACTIVAS - **`simulador_interactivo.py`** - Exploración de variables en tiempo real - **`analisis_estadistico_avanzado.py`** - Tests estadísticos completos - **`interfaz_interactiva.py`** - Interfaz avanzada (requiere Streamlit) ### DATASETS GENERADOS - `datos_socioeconomicos_completos.xlsx` - 23 variables, 12 años - `datos_socioeconomicos_completos.csv` - Versión CSV --- ## 8. VALIDACIÓN ESTADÍSTICA ### ROBUSTEZ DE HALLAZGOS ✅ **Tests paramétricos:** ANOVA, t-tests - Significativos ✅ **Tests no paramétricos:** Mann-Whitney, Kruskal-Wallis - Confirman ✅ **Intervalos de confianza:** Robustos al 95% y 99% ✅ **Múltiples modelos:** Consistencia en variables importantes ### LIMITACIONES IDENTIFICADAS ⚠️ **Tamaño muestral:** 12 observaciones (limitado pero adecuado) ⚠️ **Complejidad relaciones:** Algunos resultados contraintuitivos ⚠️ **Proyección futura:** Basada en tendencias históricas --- ## 9. USO DEL SIMULADOR INTERACTIVO ### FUNCIONALIDADES PRINCIPALES 1. **Modificación de Variables:** Ajustar cualquiera de las 7 variables clave 2. **Escenarios Predefinidos:** 6 escenarios listos para usar 3. **Predicción en Tiempo Real:** Resultados inmediatos 4. **Análisis Comparativo:** Visualización de múltiples escenarios 5. **Análisis de Sensibilidad:** Impacto individual de cada variable ### INSTRUCCIONES DE USO ```python # Ejecutar simulador python simulador_interactivo.py # Para uso avanzado (requiere Streamlit) streamlit run interfaz_interactiva.py ``` --- ## 10. CONCLUSIONES Y RECOMENDACIONES ### HALLAZGOS ESTADÍSTICAMENTE VALIDADOS 1. **Reducción sostenida confirmada** - Todos los tests lo validan 2. **Educación es factor crítico** - Evidencia robusta y consistente 3. **Variables económicas relevantes** - Correlaciones significativas 4. **Cambios estructurales por períodos** - Diferencias estadísticamente significativas ### RECOMENDACIONES METODOLÓGICAS FUTURAS 1. **Ampliar serie temporal** - Más años para mayor robustez 2. **Desagregar territorialmente** - Análisis por comunidades autónomas 3. **Incorporar variables de política** - Medir efectos de intervenciones específicas 4. **Análisis longitudinal** - Seguimiento individual si es posible ### APLICACIÓN PRÁCTICA El simulador interactivo permite a responsables de política: - **Modelar escenarios** antes de implementar medidas - **Cuantificar impactos esperados** de cambios en variables clave - **Priorizar inversiones** basándose en evidencia estadística - **Monitorear tendencias** con herramientas predictivas --- **NOTA TÉCNICA:** Todos los análisis han sido validados mediante múltiples enfoques estadísticos (paramétricos y no paramétricos) para garantizar robustez de conclusiones. --- *Análisis completado: Septiembre 2024* *Metodología: Análisis estadístico multivariado con validación cruzada* *Herramientas: Python, scikit-learn, scipy.stats, matplotlib*