Introducción al análisis de datos en Python con Numpy

Configuración previa

El análisis de datos básico en Python se realiza utilizando tres bibliotecas que se complementan perfectamente entre ellas. Juntas componen lo que yo denomino La Santa Trinidad del Análisis de Datos:

  • Numpy: Para manejar arrays.
  • Pandas: Para manejar dataframes.
  • Matplotlib: Para generar gráficos.

Todas estas bibliotecas son externas a Python por lo que tenemos que instalarlas para poder utilizarlas, esa será nuestra primera tarea.

Empezaremos abriendo una carpeta donde guardar nuestros códigos, por ejemplo curso-analisis y dentro en una terminal vamos a instalar jupyter, numpy, pandas y matplotlib en un nuevo entorno virtual con Pipenv. Si no tenéis pipenv lo podéis instalar antes haciendo:

pip install pipenv  # Si no lo tenéis
pipenv install jupyter numpy pandas matplotlib

Una vez creado reiniciamos Visual Studio Code y seleccionamos el Python del entorno virtual como entorno del proyecto.

Con esto ya estamos listos para empezar a aprender la biblioteca más esencial de todas: numpy.