Introducción a los gráficos de datos en Python con Matplotlib

Primer gráfico

Empezaremos nuestra andadura viendo el gráfico más simple, el de líneas.

Dando por hecho que estáis continuando el curso de numpy y tenéis el entorno preparado, lo primero será cargar mumpy y matplotlib en una celda:

# %%
import numpy as np
import matplotlib.pyplot as plt

Supongamos que necesitamos un gráfico que muestre los ahorros que hemos tenido durante los últimos 4 meses.

Vamos a declarar una lista con ellos:

ahorros = [50, 100, 30, 65]

Ahora con matplotlib podemos dibujar un gráfico a partir de esta lista sin mucha complicación:

plt.plot(ahorros)

¿Qué os parece? ¿Os esperábais algo más complejo?

Este gráfico tiene dos ejes, el horizontal (X) con 4 números de 0 a 3 y el vertical con los ahorros (Y) que empieza con el mínimo 30 hasta el máximo 100. Estos números corresponden a los índices de los valores en la lista y matplotlib genera una escala a partir de ellos.

El primer elemento con índice 0 es el 50, el segundo de índice 1 el 100 y así sucesivamente.

Así pues podemos crear gráficos a partir de listas pero también podemos hacerlo con arrays de numpy, ahí está gracia de todo.

Por ejemplo podemos generar un array aleatorio de ahorros para el último año (12 meses):

# %%
ahorros = np.random.randint(100, size=[12])
plt.plot(ahorros)

Como véis con numpy tenemos una forma perfecta de generar valores aleatorios para nuestros gráficos de ejemplo.

Por cierto, nuestros gráficos se muestran porque como ya sabéis jupyter muestra la última celda automáticamente, de ahí que nos aparezca el nombre del objeto y su dirección en la memoria.

Podemos evitar que aparezca esa línea llamando explícitamente al método show() del gráfico:

# %%
plt.plot(ahorros)
plt.show()

Es una buena práctica para no mostrar información de más, así que vamos a usarlo de ahora en adelante.