Objetivos
Los objetivos del curso es acercar la estadística desde un enfoque práctico, ameno y divertido a los analistas de cualquier sector.
Lo haremos desde un enfoque futbolístico recorriendo todas las materias necesarias para desenvolverte en el mundo analítico con una base suficiente de estadística.
¿Cuándo empieza?
Empezamos el 1 de abril donde tendrás acceso a los dos primeros módulos de R. Luego iremos habilitando los siguientes módulos y poniendo un link a cada clase. De manera orientativa las clases serán los jueves a las 18:30
Metodología
En este curso combinaremos las clases en directo y clases grabadas. Por supuesto si no puedes asistir a las clases no te preocupes, éstas serán grabadas y se subirán al correspondiente módulo.
Los 2 primeros módulos serán de aprendizaje del lenguaje R desde un enfoque tidyverse y en el módulo 2 pasaremos a profundizar en las librerias de visualización. Estos módulos estarán grabados.
El resto de módulos serán clases en directo los jueves por la tarde hora española a partir de las 18:30h. Su duración la marcáis vosotros. Este punto es importante porque creemos que una materia como la estadística requiere de una interacción total con el profesorado, interacción directa y resolución de dudas en vivo.
Si no puedes asistir no te preocupes, luego se subirá la clase y podrás plantear preguntas en el propio curso y en el canal de telegram.
Las clases combinarán teoría y práctica simultáneamente para ver la aplicación directa. Por supuesto el curso está pensando para perfiles que no tienen un bagaje técnico así que vamos a huir de una formación aburrida, será muy divertido aprender viendo las fórmulas justas y necesarias.
En total 10 módulos que podéis ver más abajo y cuando os apuntéis veréis que cada módulo tendrá un espacio donde tendréis el link al aula de la clase.
Temario
Módulo 1. Introducción a R (Módulo en video)
- Hay quien confunde R con R-Studio, instalar y cargar librerias, proyectos y entornos, etc. Empezaremos con los básicos
- Aprenderás a usar R desde el enfoque Tidyverse. Cargar, limpiar, transformar información desde multiples fuentes...de fútbol...
- Harás tus propias funciones, scripts y empezando con 1 + 1...y acabarás desenvolviéndote en R mejor que la mayoría de analistas
Módulo 2. Ggplot a fondo. (Módulo en video)
- Sin medias tintas, recorreremos a fondo el paquete ggplot y sus principales extensiones para que aprendas a visualizar todo tipo de información.
Módulo 3. Estadística descriptiva (Módulo en directo. 21/04/2022)
- ¿Cómo tienes que analizar una cualidad y una variable numérica?
- ¿Qué rol tiene cada variable en los datos?
- ¿Cuáles son los principales problemas que plantean las variables?
- Las coordenadas por las que se mueve un jugador, ¿qué tipo de variable son?
- ¿Qué errores comunes cometemos cuando analizamos datos?
- ¿Por qué es tan importante el análisis gráfico?
- Describir datos no es sólo dar a la tecla sobre todo cuando nuestros datos vienen de scraping
Módulo 4. Probabilidad y distribuciones (Módulo en directo. 28/04/2022)
- Aprende los conceptos básicos de probabilidad
- Empieza a mejorar tu retórica estadística
- ¿Qué es la distribución de una variable? La importancia del histograma
- ¿Por qué tienes que conocer las principales distribuciones? ¿Sabes que un penalty o un resultado sigue una distribución?
- Entenderás porque nos gusta tanto a los estadísticos la distribución normal pero no sólo existe esa distribución
- Muchos eventos futbolísticos tienen una distribución determinada, ¿cómo puedo simularlos?
- ¿Podemos idear un sistema que nos determine la probabilidad que tiene un equipo de descender?
- NO DEBEMOS APOSTAR siempre perderemos dinero
Módulo 5. Análisis bivariable (Módulo en directo. 05/05/2022)
- Empezamos a comparar variables y estudiar como influye una en otra
- La relación entre variables como base del análisis estadístico
- ¿Por qué es tan importante el rol que juega cada variable?
- ¿Empleamos un gráfico o el coeficiente de correlación para estudiar la relación de dos variables?
- Con variables numéricas empleo el coeficiente de correlación, ¿con factores qué tengo?
- Sigue habiendo errores habituales
- Las coordenadas dicen mucho, si las discretizamos más
Módulo 6. Muestreo e inferencia (Módulo en directo. 12/05/2022)
- Sabemos lo complejo que es el muestreo, ¿tienes que conocer todos los tipos de muestreo?
- El dilema sesgo-varianza, no lo sabes, pero lo estás usando constantemente
- ¿Nunca entendiste las hipótesis estadísticas? Porque no te las explicó Raúl
- Tenemos el compromiso, la seguridad, de que entenderás que es un intervalo de confianza y los contrastes de hipótesis
- ¿Cuáles son los contrastes de hipótesis más importantes?
- ¿De verdad es necesario aprender esto?
Módulo 7. Regresión lineal (Módulo en directo. 19/05/2022)
- Es la base de la modelización estadística pero no es el único motivo por el que debes conocerla técnica
- El R cuadrado no es alto, ¿significa que mi modelo no vale?
- El modelo no cumple las hipótesis, ¿algún modelo ha cumplido las hipótesis en la historia?
- La distancia como única variable para explicar el xG, ¿así de fácil?
- Vamos a conocer que hace un parámetro en un modelo, porque sirve o porque no sirve
- Raúl os recomienda discretizar variables cuantitativas en modelización, haced caso a Raúl
Módulo 8. Modelos GLM (Módulo en directo. 26/05/2022)
- ¿Por qué surgieron?
- ¿Qué artificio matemático nos permite usarlos?
- Vamos a hacer un modelo de xG
- Preparamos datos, recomendaciones, análisis bivariables, discretizamos coordenadas y variables numéricas,…
- Resulta que los parámetros del modelo me explican como se modifica el xG
- ¿Es un buen modelo de xG? ¿No entiendes la curva ROC? Tranquilo no estás sólo, pero entenderás la curva de ganancia
- Sin darte cuenta, estás asimilando la metodología necesaria para hacer modelos estadísticos
Módulo 9. Métodos de reducción de dimensionalidad y clusterización. (Módulo en directo. 02/06/2022)
- Seguro que has oído o leído las siglas PCA, o FA, o UMAP, y muchas más. Además de lanzar código ¿sabes lo que son?
- Segmentación de diferentes tipos de datos. ¿Cómo segmentamos por ejemplo rutas?
- Introduciremos los primeros puntos de estadística espacial
- Aquí hablaremos de las distancias también, si eso que ves cuando calculamos similitudes. ¿qué tipos de distancias? ¿qué implicaciones tiene? ¿si hacemos un PCA todas las componentes importan lo mismo en las distancias?
Módulo 10. Sistemas de redes. (Módulo en directo. 09/06/2022)
- Explicaremos las principales métricas de una red, como calcularlas, interpretarlas y darle valor en un entorno futbolístico.
Algo sobre mi...
Me llamo Raúl y llevo toda una vida dedicada al mundo de la estadística en muchos sectores pero sobre todo en el mundo de los seguros donde la estadística es vital para el cálculo de riesgos.
Cuando Jesús me propuso el proyecto ni me lo pensé, ¿a quién no le gusta el fútbol? ¿y enseñar estadística con fútbol? ¿y enseñaros todo lo que necestais para sobre vivir ahí fuera?
Os prometo pasión, diversión, y enseñaros una ciencia que puede parecer compleja, pero que la vamos a explicar para que te apasione.
Si quieres leer más de mí puedes visitar mi blog:
https://analisisydecision.es/