Aprende Python Pandas sin tanto Rollo

Pandas es la libreria por excelencia para manejo y manipulacion de datos para la IA, Machine Learning y las nuevas tecnologias, se utiliza una estructura de datos en forma de tablas, por ejemplo un Excel o CSV.

En este tutorial vas a aprender a usar Pandas y Python, te invito a mi curso de Python que estoy dando en mi canal de Tiktok y de paso sigueme 😉

Les voy a explicar como aprender python pandas sin tanto rollo, explicaciones directas a lo que vamos y resultados inmediatos, para quienes buscan como hacer cada cosa les puse secciones con titulos para ser mas entendible.

Ventajas de Pandas

Pandas es eficiente, realiza operaciones rapidas con pocos recursos.

Cuenta con una Versatilidad para manejar todo tipo de formatos, excel, cvs, json, SQL, variables, etc.

Se integra facilmente con otras librerias como matplotlib y otras librerias.

Como Instalar Pandas

Si ya tenemos Python y pip , es tan facil como usar el comando:

pip install pandas

Y asi se va a instalar pandas y lo podremos usar en nuestro codigo.

Fuente de datos.

Para el ejemplo que vamos a seguir en este tutorial vamos a usar el archivo ventas.csv que tiene el siguiente contenido.

id, cliente_id, total, Fecha
1,2,10,2026-03-08
2,3,15,2026-03-09
3,4,20,2026-03-10
4,2,25,2026-03-11
5,6,30,2026-03-12
6,7,35,2026-03-13
7,8,40,2026-03-14
8,3,45,2026-03-15
9,10,50,2026-03-16
10,4,55,2026-03-17
11,2,10,2026-03-08
12,3,35,2026-03-09
13,4,20,2026-03-10
14,2,25,2026-03-11
15,6,50,2026-03-12
16,7,35,2026-03-13
17,8,20,2026-03-14
18,3,45,2026-03-15
19,10,50,2026-03-16
20,4,25,2026-03-17

Si ustedes tienen otro CSV lo pueden utilizar.

Como importar Pandas

Vamos a importar pandas, creamos un archivo con el nombre pandas1.py en la misma carpeta que nuestro archivo ventas.csv , para importar pandas usamos.

import pandas as pd

Aqui lo que hacemos es importar pandas y ponerle un alias para referirnos a pandas como pd.

Abrir un archivo CSV con Pandas

El siguiente paso es abrir un archivo CSV con pandas, nuestro archivo ventas.csv

ventas = pd.read_csv("ventas.csv")

Asi la variable ventas, va a tener la referencia al archivo ventas.csv y cuando realicemos consultas se van a leer los datos de el archivo.

Pandas maneja los datos como DataFrame un tipo de tabla especial para consultas como veremos mas adelante.

Obtener la informacion de los datos con Pandas

Vamos a obtener la informacion de los datos de las columnas de nuestro archivo:

print(ventas.info()) # mostrar información sobre el DataFrame

Aqui nos va a dar como resultado, el total de registro del archivo, las columnas y el tipo de columnas, la memoria utilizada.

RangeIndex: 20 entries, 0 to 19
Data columns (total 4 columns):
 #   Column       Non-Null Count  Dtype
---  ------       --------------  -----
 0   id           20 non-null     int64
 1    cliente_id  20 non-null     int64
 2    total       20 non-null     int64
 3    Fecha       20 non-null     str
dtypes: int64(3), str(1)
memory usage: 772.0 bytes

Obtener los Primeros y los Ultimos Registros de un DataFrame con Pandas

Los primeros y los ultimos registros los podemos obtener con las funciones head() y tail() respectivamente.

La funcion head() nos devuelve por default los primeros 5 registros de el DataFrame, si queremos obtener mas registros le pasamos como parametro el total de registros que queremos por ejemplo head(20)

print(ventas.head()) # mostrar las primeras filas del DataFrame

Resultado

   id  cliente_id  total       Fecha
0   1           2     10  2026-03-08
1   2           3     15  2026-03-09
2   3           4     20  2026-03-10
3   4           2     25  2026-03-11
4   5           6     30  2026-03-12

Y para obetener las ultimas finales usamos la funcion tail() que devuelve los ultimos 5 registros, si queremos mas tambien le pasamos la cantidad como parametro.

print(ventas.tail()) # mostrar las últimas filas del DataFrame

Resultado

    id  cliente_id  total       Fecha
15  16           7     35  2026-03-13
16  17           8     20  2026-03-14
17  18           3     45  2026-03-15
18  19          10     50  2026-03-16
19  20           4     25  2026-03-17

Obtener los registros de una columna con Pandas

Los DataFrames de pandas, tambien se comportan como si fueran diccionarios de python, si queremos obtener todos los registros de una columna, solo tenemos que poner el nombre de la columna entre corcheres.

clientes = ventas["cliente_id"] # resultado es un dataframe
clientes.head()
clientes.tail()

El resultado de hacer esta operacion es un Series es como un DataFrame pero solo tiene la columna seleccionada y como es un tipo DataFrame se pueden usar las funciones head() y tail() y el resto de funciones que vamos a ver.

Resultado

0    2
1    3
2    4
3    2
4    6
Name: cliente_id, dtype: int64

15     7
16     8
17     3
18    10
19     4
Name: cliente_id, dtype: int64

Filtrar Datos con Pandas

Filtrar datos es buscar un rango de datos o datos que complan ciertas condiciones.

Primero vamos a filtrar los resultados donde el cliente sea igual a el cliente_id=2.

cliente_2 = ventas[(ventas["cliente_id"] == 2)]
print(cliente_2) # mostrar las filas filtradas por cliente_id igual a 2

Resultado

    id  cliente_id  total       Fecha
0    1           2     10  2026-03-08
3    4           2     25  2026-03-11
10  11           2     10  2026-03-08
13  14           2     25  2026-03-11

Tambien podemos usar los operadores menor que (<) , mayour que ( >), menor o igual que (<= ) y mayor o igual que ( >= )

Por ejemplo vamos a filtrar las ventas que la columna total sea mayor o igual a 10.

ventas_may_10 = ventas[(ventas["total"] >= 10)]
print(ventas_may_10) # mostrar las filas filtradas mayores a 10

Y el resultado serian las ventas que la columna total sea mayor a 10.

Otro ejemplo sera obtener las ventas o los registros en un rango especifico, por ejemplo obtener las ventas que la columna total este entre 20 y 50.

Para agupar las condiciones se usa el operador & y podemos agregar varias condiciones.

ventas_entre_30_50 = ventas[(ventas["total"] >= 30) & (ventas["total"] <= 50)]
print(ventas_entre_30_50) # mostrar las filas filtradas entre 30 y 50

Resultado

4    5           6     30  2026-03-12
5    6           7     35  2026-03-13
6    7           8     40  2026-03-14
7    8           3     45  2026-03-15
8    9          10     50  2026-03-16
11  12           3     35  2026-03-09
14  15           6     50  2026-03-12
15  16           7     35  2026-03-13
17  18           3     45  2026-03-15
18  19          10     50  2026-03-16

Guardar un DataFrame de Pandas a un Archivo CSV

Es posible guardar o exportar un DataFrame a un Archivo, para ello simplemente vamos a usar el metodo to_csv(nombre) en el DataFrame que queremos guardar, por ejemplo.

ventas_entre_30_50 = ventas[(ventas["total"] >= 30) & (ventas["total"] <= 50)]
print(ventas_entre_30_50) # mostrar las filas filtradas entre 30 y 50
ventas_entre_30_50.to_csv("ventas2.csv")

Y listo ya tenemos nuestro DataFrame guardado para futuras consultas.

Ahora ya podemos usar pandas para analizar nuestros archivos CSV y crear framentos o reportes para tener una informacion mas condensada.

2 Comments

    • Buen dia narciso, claro, estaremos subiendo reels en facebook con lecciones de los cursos y estamos preparando un video largo para nuestro canal de youtube, Saludos desde Mexico tambien !!

Leave a Reply

Your email address will not be published. Required fields are marked *

Discover more from Evilnapsis

Subscribe now to keep reading and get access to the full archive.

Continue reading