Logo

Sports Data Club

Using data in Sports

EN
I am a Data analytics professional with a passion for sports.
I will use this website as a portfolio and will try to show things that are not "out there" in the sports world and media. In this space you will be able to see some examples and interact with them.
ES
Soy un profesional en el campo del Data Analytics con pasión por los deportes y con ganas de mostrar datos, visualizaciones... que no están a la vista diariamente. En este espacio podréis ver ejemplos de mis trabajos e interactuar con ellos.


*Example of Player Profile Card (Small version)

© Sports Data Club. All rights reserved.

Portfolio

I´ve been working on several types of visualizations within football, basketball and other sports, mainly to websites like Baskeroseno and Smart Scouting Club.
These dataviz could contain different metric, some simples ones as goals, passes, points, possessions... and other more advance statistics like xG (Expected goals), USG, ORTG, etc.

I represent these on multiple styles like XY graphs, Radars, or more complex visualizations like Sankey Diagrams.

I use (among others) Tableau software to plot these stats.

In this website you can play around with some of my examples. Click the links at the right to see the examples from my personal portfolio (If you see some size errors in the visualizations, please press F5 to refresh).

Also, please be aware that to enjoy the full interactive viz, is better to visualize them on Desktop/Tablet.

You can also check my Interactive CV, my Tableau Public profile and other examples in the Blog space.

Radar Chart

One of the most common dataviz to compare players and teams. In a quick view, it gives you an understanding of who is doing better and in which fields.
You can see here and below 2 examples. At the left, comparing 2 football players.

Here it is another Radar example, this time for the Basket Euroleague comparing 2 teams.

Player Profile in the League

This useful view gives a clear vision of how is the player or team performing.
First image shows the actual numbers of Harry Maguire compared to the Top 6 League Central Defenders, showing Min, Average and Max actual numbers. Also it shows a "Percentil Quadrant" vs the rest of the data group.
In the second image, the length of the bars show the position in the percentile of the league, and the number shows the actual value of that stat.
The third example shows the Percentile % in the League of the player and the actual value of the stat.

Eriksen

Expected Goals (xG) For and Against

xG (Expected goals) can give us a different view on how were the occasions created by a team or player. Here we can see the trend from some teams of the Japanese League, if they are over or under performing.

La Liga 18/19: NP Goals - NP xG / 90min vs NP Goals Scored/ 90min

Below you can check how La Liga players performed this season, if they over or under performed on occasions created and goals scored. You can filter by team, minutes played and highlight by their position.
You can see all the Top 6 European Leagues Players on this blog entry

Expected Goals (xG) Trends

A good model of Expected Goals (xG) can show how is performing a certain team attacking and defending. In the example below you can see the Japanese League, showing xG For and Against. Top right of the graph would show the teams that have more contributions that are expected to be a goal, and also that concede less opportunities.

xG Contributions

Using xG (Expected Goals) and xA (Expected Assists), we can have a view of xG contributions, that will give us the players who could be the most decisive in the attacking part during the season. 2 examples below for La Liga and La Liga123.

*If browsing on the phone, please swich to Landscape view.

xG Timelines

Another way to show Expected Goals (xG) is through the timeline of a match, where in a quick look we can check how dangerous were the shots for both teams. Below and example from the Japanese first division.

xG_Timelines

Other possible view is the one below, by action and minute, where you can click the bar and it will give you info in the box about that action (who was the player, minute, xG value, if it was goal or not...)

xG_Timelines

XY Axis visualizations

Two dimension graphs are used a lot in several sports to show teams or players under 2 stats. It´s easy to check where they perfom good or not so good.
In this example we see the Fenerbahce Players prior to the Euroleague Basketball Final Four. Graph shows % Time vs PPP in Spot up game type.

Another XY example, this time NBA. In the Y axis we see the rank of a team on certain stat which appears on the X axis.

Parallel Coordinates Plot

This type of visualisation is used for plotting multivariate, numerical data. Parallel Coordinates Plots are ideal for comparing many variables together and seeing the relationships between them.
Below, we compare some of the variables from the strikers of Segunda División in Spain.

symmetric axis viz

This symmetric axis visualization shows the minutes played per age of the players from the different teams of the Second Division League in Spain. The higher and wider means that older players played more minutes. You can check the viz and see the minutes per age hovering it here.

symmetric axis

Jitter plot (2 dimensions)

The main reason to use a Jitter plot rather than a strip plot is when you have too many marks overlapping and you want to be able to select any individual mark (which is difficult or even impossible if the marks overlap entirely). Below you see this plot but applied to 2 dimensions in an Euroleague example with the Spanish team, where number of shots and efficacy are related. There are 2 tabs to choose different views.

Gant Diagram

Another cool way to see some % stats of some Player or Team. The darkness of the colour also gives an idea about which are the best stats.
Two examples below, with a different type of Gant Diagram, last one more stylish.

*If browsing on the phone, please swich to Landscape view.

Equiposegunda

Pass and Actions map

Focusing on one player and showing all his key actions in a match and where occurred, usually used for goals. Also the "pass map" shows the most common passes to other players on the pitch.

"Sankey" Pass Diagram

This colorful viz is useful to see how is the pass flow of an specific player. Which is the most common past he does? and from which player he receives more passes? You can see it below depending on how thick is the line.

"Sunburst" Diagram

A mixture of a pie chart and a donut chart, the Sunburst diagram is useful to represent categories and subcategories. This example is about field shots of a basketball player, made and attempted from different play types.

Play Types: Volume & Efficiency. Card Style

This is a Card Style viz, used for Basketball Play Types. Here you can compare Volume and Efficiency of 2 players in all the Play Types.

Bar Charte Race viz

One trendy viz that shows in a nice way a trend per time. Below you can see one about the top goalscorers of my team, Real Oviedo, over the years, and the % of snooker players for each nationality per season.

Dynamic Dashboards with several filters

This football example shows the dribbles per 90 min and the successful ones in the Premier League. You can filter by team, position, minutes played...

*If browsing on the phone, please swich to Landscape view.

Also useful for Basketball examples. Here we can see the different Possessions types and the volume & Efficiency per player in the Euroleague.

Visual Dashboards

It´s always nice to offer information in a different visual way. Here you can see a flower style dashboard with some of the triple crown winners on Snooker (a billiard modality which I follow).
Below you can see a Career Dashboard of a Snooker Legend, Ronnie O´Sullivan.

*If browsing on the phone, please swich to Landscape view. Better to see on Desktop.

Predictive applications

You can apply visualizations to predictive models. Below, you can see a graph where I applied a predictive model for the Segunda División table. From fixture 17, you can move fixture by fixture until the end of the season.

*If browsing on the phone, please swich to Landscape view. Better to see on Desktop.

Logo2

About me - ¿Quién soy?

EN
My name is Daniel Martínez, originally the north of Spain, I finished my Master Degree on Chemical Engineering and in these years I developed a professional career on Data Analytics in industries like Gambling (London, Gibraltar) and Online Marketing (Barcelona).
Recently I finished a University Course (Valladolid University) to become "Expert on Sports Data Analytics", using data and tools like: Opta Sports, iSF, Tracab, MediaCoach, NAC Sports, STATs, Wyscout, InStat and ERiC.

ES
Mi nombre es Daniel Martínez.
Licenciado en Ingeniería Química, mi vida profesional siempre ha estado ligada al mundo del análisis y los datos, reporting y visualizaciones (en industria del Juego Online y Marketing Online, Londres, Gibraltar y Barcelona).
En estos últimos años he reforzado mi curiosidad en el mundo del "Sport Analytics" y he realizado el curso de "Experto en Análisis de Datos y Big Data" de la uVa (Universidad de Valladolid)

Comparador de Jugadores basado en datos 19/20

Actualmente existen varias compañías que ofrecen métricas de jugadores y equipos para gran cantidad de partidos de fútbol ya jugados.
Estas métricas como pueden ser los tiros a puerta, regates, pases de diferentes clases, centros, acciones defensivas, saltos, la eficacia en cada uno de ellos… pueden ser muy interesantes y útiles pero muchas veces no ofrecen una descripción del jugador sólo viendo estos valores por separado.
Por eso, una opción es unir estas métricas en una “métrica general” como puede ser Ataque, Defensa, Pases, Asistencias… y poder crear una imagen global de un jugador comparándolo con el resto de los jugadores de su posición.
Para este “panel de comparación” he utilizado 8 métricas generales, que han sido generadas con unas 50 métricas de acciones individuales que ofrecen las compañías (en este caso Wyscout)
Estas métricas generales son: Ataque, Defensa, Pases, Progresión de balón, Asistencias a tiro, Regates, Remate de Cabeza y Visión de juego.
Estos grupos se han aplicado a los jugadores (más de 200 minutos jugados en esta liga, por ahora sólo 11 partidos) divididos por posiciones: Defensa Central, Defensa Lateral, Mediocentro no ofensivo (defensivos y creadores), Mediocentro ofensivo (Extremos y medias puntas) y Delanteros.
En este ejemplo se muestran los números del Panel de comparación (Tableau) del joven noruego de 20 años, Martin Ødegaard, cedido por el Real Madrid a La Real Sociedad.

comparador1

A primera vista se ven los valores del joven jugador noruego comparado con otros mediocentros de la liga. Destaca en los grupos que contienen métricas de ataque, asistencia de tiros, progresión de balón y visión de juego.
El panel gana importancia con los nombres que aparecen a la derecha, que son los 5 jugadores de su posición que tienen los números más similares a él. Si se hace click sobre uno de ellos se muestra la comparación en forma de línea azul sobre las barras. En este caso se destacan los nombres de José Campaña, Sergio Canales, Arthur, Santi Cazorla y Toni Cross.
Aquí la versión comparándolo con Santi Cazorla:

Logo2

También podemos compararlo contra otro jugador de la lista total de jugadores, pero hay que tener en cuenta que, si no es de la misma posición, el percentil no será comparado con jugadores de la misma posición. Por ejemplo, si se compara con un delantero y tiene más defensa no quiere decir que sea mejor defendiendo, sino que, entre el grupo de delanteros, ese delantero tiene mejor defensa que Ødegaard frente a los jugadores de su posición.
Otra opción que ofrece es comparar al jugador principal con el resto del equipo (también teniendo en cuenta que cada uno está comparado con los jugadores de su posición):

Logo2

Clave en la construcción y en el ataque de su equipo, Ødegaard está siendo referente de la Real Sociedad en este inicio de liga.

Este dashboard puede tener un gran poder de comparación ajustando los valores de las métricas, los grupos y las posiciones. Así como añadir otros factores como edad, altura, dar más valor a ciertas métricas si buscamos un jugador u otro… y también el añadir una liga o comparar jugadores de varias ligas juntos.
Las posibilidades son grandes y esto todavía no ha hecho nada más que empezar, pero seguro que este tipo de herramientas empiezan a ser cada vez más comunes en las secretarías técnicas de los equipos de fútbol (como ya pasa en la NBA de baloncesto) como apoyo e información adicional a sus informes.

Dashboard de Variables Liga SmartBank 19/20

He trabajado con datos de Instat para la creación de este Dashboard con filtros para seleccionar las variables de los ejes X e Y de #LaLigaSmartBank.
La selección de las variables de los ejes haced este panel una herramienta muy completa para combinar 2 métricas entre las más de 100 disponibles.

Otra opción es hacer el dashboard con los jugadores de la liga. Aquí con datos de Wyscout para la Segunda división española.

segunda dashboard

Alejandro Arribas. Fichaje del Real Oviedo para la temporada 19/20

#LaLigaSmartBank #Fichajes Alejandro Arribas llega desde México para reforzar la defensa central del @RealOviedo.
30 años, amplia experiencia en 1ª y gran relación con Michu y Egea
Para este gráfico ⬇️ he usado sus números durante el año 2018 y 2019 en México, vs La Segunda18/19

En este nuevo gráfico (a ver si os gusta y es claro!), el punto rojo es la posición de los números de Arribas en México comparado con el total de centrales de Segunda 18/19 (+1000 min jugados). La raya vertical es la media de todos, y las flechas los máximos y mínimos.
Lo que más destaca (y quizás lo más positivo para un central) es el % de duelos defensivos ganados (70%). Si, es otra liga, otro estilo... pero con ese número, hubiera sido el mejor de la temporada pasada en segunda, con un número medio de acciones defensivas.
Destacar también las pocas faltas cometidas, pese a ir a tope, parece que mide bien "el límite".
En el mapa de calor se ve que actuó (con balón) de central diestro, y también recibió balón más por detrás. Quizás pueda dar más opciones en defensa (como pasaba con Forlín).

radar1
radar2

Un par de comparaciones con dos de los centrales de la temporada pasada, Javi Hernández y Carlos Hernández.
Carlos muchas más faltas y más acciones defensivas, pero con menos eficacia. Mejor en duelos aéreos. Similar en pases.
Con Javi mejor en defensa y menos pases.

Son ligas diferentes, pero estos son sus números en % de sus últimas 4 temporadas. Bastante regular, e incluso mejorando algunas. No tiene pinta que llegue "de retiro".

Stats

Visualización de datos para analizar estilos de juego (baloncesto)

Ayer la selección española femenina de baloncesto hizo historia ganando su cuarto Eurobasket tras derrotar a la selección de Francia en la final.

Detrás de las jugadores y dentro del staff técnico está la zamorana Susana Ferreras, que actualmente trabaja como Data Scientist en el Arsenal de Unai Emery.

En el baloncesto (y especialmente en la NBA), el uso de datos y su análisis para preparar partidos lleva siendo importante desde hace unos años.

He aportado visualizaciones para sus artículos a la página web dedicada al análisis y scouting de baloncesto, Baskeroseno.com. Un ejemplo es esta gráfica en la que se comparan dos jugadores para conocer mejor el impacto en base a la frecuencia y la eficiencia según los diferentes tipos de jugadas.

El análisis es pertinente porque Andrew Albicy (azul) abandona Morabanc Andorra y Jeremy Senglin (verde) ha sido el fichaje que, presumiblemente, ocupará su rol de base titular. Esta posición es crucial para el rendimento de un equipo porque suele ser el director de juego y con mayor volumen de posesión de balón.

Mostrar los tipos de jugada nos permiten entender de un vistazo el estilo de juego tanto individual como colectivo. En este caso, vemos rápidamente las diferencias y semejanzas entre ambos y qué puede aportar la llegada de Senglin y cómo afectará la salida de Albicy.

Paralelamente, hemos hecho un estudio del estilo de juego de Andorra la temporada pasada que nos permitirá establecer una proyección de la frecuencia de cada tipo de jugada una vez se cierre la plantilla para la 2019/2020.

El uso de estadísticas y datos ya está normalizado en la NBA y es cuestión de tiempo que se instaure de forma generalizada en Europa. Ya son muchos los equipos que utilizan big data para optimizar decisiones tácticas y afinar en los fichajes. Todo parece indicar que, más pronto que tarde, otros deportes seguirán la estela del fútbol y del baloncesto para incorporar los datos en su trabajo diario.

Segunda División 18/19. Mejores jugadores

Usando los datos de Wyscout, he realizado un estudio con un sencillo algoritmo para obtener dos equipos con los jugadores que más han destacado en la Segunda División Española en la temporada 2018/2019.
Podéis descargar el PDF completo con análisis jugador a jugador Aquí o en la imagen de abajo de los dos equipos obtenidos.

Equiposegunda

Top 6 European Leagues 18/19: NP Goals - NP xG / 90min vs NP Goals Scored/ 90min

Vemos en este dashboard la diferencia entre goles marcados (sin penaltis) y los goles esperados xG por 90 minutos jugados en las 6 Ligas más importantes de Europa (España, Inglaterra, Alemania, Italia, Francia y Portugal). Pudiendo filtrar por Liga, Posición, Minutos Jugados e incluso por nombre del jugador.

Messi promedió 1 gol por 90 minutos y estuvo por encima de sus expectativas, con 0.4 goles/ 90 min por encima de lo esperado (xG).Mbappé superó esas cifras de goles por partido promediando 1.16 por partido.Haris Seferović se cuela junto a Messi y Mbappé con 1 gol por partido y prácticamente mismos números que Messi.

Christian Stuani, tras el descenso del Girona, será uno de los fichajes más deseados de este mercado de fichajes de verano para todo equipo que busque delantero centro. Promediando 0.4 goles por partido y en linea con sus números esperados.

symmetric axis

La Liga 18/19 Top 7: xG Contributors

#LaLiga #Datos Analizamos la contribución esperada de Goles (Sin penaltis) y Asistencias de los 7 Primeros equipos de la Liga 18/19.

Messi contribuyó en el 28% de los Goles Esperados (xG) y Asistencias Esperadas (xA) del #FCBarcelona. 29, dividido en 19 xG y 10 xA#dataviz ⚽️📊

En el #ATM, deberán sobreponerse a la marcha de #Griezmann, que contribuyó en el 23% de los xG y xA de su equipo con 9.4 Goles Esperados y 7 Asistencias Esperadas.

En el #SevillaFC, ¿Seguirá Ben Yedder? Ha contribuido en un 21% de xG y xA del conjunto andaluz.

Fichajes Real oviedo - temporada 18/19

Sergio Tejera

Sergio Tejera se convirtió ayer en el primer fichaje del @RealOviedo. Voy a hacer un hilo con @scouting_club para analizar su temporada pasada y si, a priori, es buen fichaje. Primero, algunos de sus datos de la temporada 17/18 #dataviz #footballanalytics

Mucho movimiento en el centro del campo, buen toque de balón con la zurda, y alto % de acierto en pases. Le faltó algún gol más. Lo vamos a comparar con otros jugadores de su posición (+/-) como Aleñá, Eguaras, Kunde, Michel, Iñigo Pérez... y con Rocha y Folch

Tejera destaca aquí en su % de acierto en centros, y vemos como está en el medio entre Folch y Rocha. Aquí ocupará el puesto de creación que entre Rocha-Folch tuvieron este año, y lo vemos en esta imagen. Más volumen de pases recibidos x 90 min y pases interiores

Los números de Tejera x 90 min se asemejan a Kunde o R.Alcaraz. Aportará esos pases entre líneas que tanto echó de menos el #RealOviedo esta temporada y que le vendrán de perlas.

Otro aspecto en el que Sergio Tejera destaca frente a Rocha/Folch es en el técnico, con los regates con éxito por 90 min, que le ayudan a sacar el balón. Sin duda esa zurda tiene mucha clase y hay que aprovecharla.

No es todo ofensivo, y Sergio Tejera es un jugador que se aplica en labores defensivas como recuperaciones y duelos defensivos/ofensivos (ambos por encima de Rocha y Folch). Además, al llevar el balón pegado, recibe muchas faltas (cerca de Aleñá en la gráfica de faltas x 90 min)

Los datos dicen que puede ser un jugador muy importante en el #RealOviedo, que llevará la batuta del centro del campo acompañado de Folch. Sólo esperar que le respeten las lesiones y pueda desplegar todo el fútbol que tiene esa zurda. #sportsdata #scouting #Liga123

Contact me!! Escríbeme!!

Logo2

EN
If you want to contact me for samples, collaborations or other doubts, please fill the form below:
ES
Para contactar conmigo para alguna muestra, de cara a colaboraciones o trabajos, por favor rellene el siguiente formulario:

Thank you! Muchas Gracias!

EN
Thanks for your message, I will reply as soon as possible!

ES
Muchas gracias por tu mensaje, responderé lo más rápido posible!