Curso | Introducción al lenguaje de programación R para el análisis estadístico de la movilidad humana
Curso introductorio
Contenido de las clases:
Clase 1: Introducción a R y su entorno de desarrollo | Martes 19 de septiembre
Hora: 18h30 a 20h30
- Conceptos básicos de programación en R
- Instalación de paquetes en R
- Fuentes primarias de consulta con R
- Uso de proyectos para garantizar la reproducibilidad del análisis de datos
Clase 2: Introducción al tidyvese para manejar datos en R: la importancia de los proyectos y la importación de datos. | Jueves 21 de septiembre
Hora: 18h30 a 20h30
- Comprendiendo el entorno de desarrollo RStudio con operaciones básicas
- Importación de datos en R desde diferentes fuentes
- Introducción del concepto de operaciones concatenadas con la pipe
Clase 3: La importancia del análisis de datos migratorios (Conceptual) | Sábado 23 de septiembre
Hora: 10h30 a 12h30
- Conceptos claves sobre la migración (inicial, resaltar el glosario)
- Iniciativas para abordar el tema de la migración (Plataforma R4V, descargar uso potencial, consideraciones metodológicas)
- Otras experiencias sobre el análisis cuantitativo de la migración:
- Evidencia empírica de casos de protección de personas en movilidad (MIDAS)
- Uso de datos no tradicionales (redes sociales) para identificación de movilidad humana por conflictos bélicos.
Clase 4: Principios de estadística | Martes 26 de septiembre
Hora: 18h30 a 20h30
- Conceptos estadísticos como variables aleatorias, funciones de distribución
- Análisis de variables numéricas
- Análisis de variables categóricas
- Operaciones entre variables
Clase 5: Uso del tidyverse para la limpieza y transformaciones de datos | Jueves 28 de septiembre
Hora: 18h30 a 20h30
- Recodificación de variables y crear nuevas variables a partir de datos existentes
- Limpieza y transformación de datos
- Tratamiento de valores vacíos y duplicados
Clase 6: Exploración y visualización de datos con tidyverse I Sábado 30 de septiembre
Hora: 10h30 a 12h30
- La gramática de los gráficos ggplot2
- Visualización de variables numéricas
- Visualización de variables categóricas
Clase 7: Pruebas de hipótesis para la media entre grupos | Martes 3 de octubre
Hora: 18h30 a 20h30
- Casos de acuerdo a la varianza en los grupos es igual o distinta
- Casos de desbalance en los tamaños de los grupos
- Comparación y validación de estadísticas de grupo
Clase 8: Correlación y el modelo de regresión | Jueves 5 de octubre
Hora: 18h30 a 20h30
- El modelo de mínimos cuadrados ordinarios con una sola variable
- Interpretación y validación de los parámetros de una regresión
- La relación entre un modelo de regresión y la correlación de los datos
Clase 9: Regresión lineal con múltiples variables | Sábado 7 de octubre
Hora: 10h30 a 12h30
- Inclusión de variables dicotómicas en el modelo de regresión
- Interpretación de las estadísticas de performance de los modelos de regresión
- Selección y comparación de modelos
Clase 10: Recomendaciones para un gráfico efectivo | Martes 10 de octubre
Hora: 18h30 a 20h30
- Métodos y transformaciones de datos para contar una historia
- Paletas de colores y labels para mejorar la interpretación de los datos.
- Apuntes sobre la visualización de categorías divergentes y variables nominales
- Visibilidad de grupos vulnerables no presentes en los datos
Clase 11: Estudios académicos relacionados a la migración | Jueves 12 de octubre
Hora: 18h30 a 20h30
- Revisión de la estructura de una investigación académica relacionada a la movilidad humana.
- Métodos para abordar la movilidad humana desde la visualización y la disponibilidad de datos.
- Lecciones y métodos narrativos para abordar desde la estadística a la migración
Clase 12: Introducción a las series de tiempo con R | Sábado 14 de octubre
Hora: 10h30 a 12h30
- El manejo del formato de fechas con R
- Introducción a la librería {tsibble} para manejo de series de tiempo
- Las partes de un tsibble key y un index
- Operaciones agregadas en el tiempo y por grupo
Clase 13: Conceptos estadísticos sobre las series de tiempo | Martes 17 de octubre
Hora: 18h30 a 20h30
- Uso de los conceptos y técnicas aprendidos en las semanas anteriores para analizar datos de migración en el contexto de las series de tiempo
- La distribución de una variable en el tiempo.
- Identificación de patrones temporales en los datos de migración
Clase 14: Descomposición de series temporales | Jueves 19 de octubre
Hora: 18h30 a 20h30
- Modelado de los patrones temporales en los datos de migración del caso de estudio
- Visualización de los patrones temporales en los datos de migración del caso de estudio
Clase 15: Escritura de documentos estadísticos con Quarto | Sábado 21 de octubre
Hora: 10h30 a 12h30
- Combinación de narrativa y código en un mismo documento
- Recomendaciones para comunicar con datos
- Recomendaciones preliminares para la evaluación de políticas públicas