Pandas es la libreria por excelencia para manejo y manipulacion de datos para la IA, Machine Learning y las nuevas tecnologias, se utiliza una estructura de datos en forma de tablas, por ejemplo un Excel o CSV.
En este tutorial vas a aprender a usar Pandas y Python, te invito a mi curso de Python que estoy dando en mi canal de Tiktok y de paso sigueme 😉
Les voy a explicar como aprender python pandas sin tanto rollo, explicaciones directas a lo que vamos y resultados inmediatos, para quienes buscan como hacer cada cosa les puse secciones con titulos para ser mas entendible.
Ventajas de Pandas
Pandas es eficiente, realiza operaciones rapidas con pocos recursos.
Cuenta con una Versatilidad para manejar todo tipo de formatos, excel, cvs, json, SQL, variables, etc.
Se integra facilmente con otras librerias como matplotlib y otras librerias.
Como Instalar Pandas
Si ya tenemos Python y pip , es tan facil como usar el comando:
pip install pandasY asi se va a instalar pandas y lo podremos usar en nuestro codigo.
Fuente de datos.
Para el ejemplo que vamos a seguir en este tutorial vamos a usar el archivo ventas.csv que tiene el siguiente contenido.
id, cliente_id, total, Fecha
1,2,10,2026-03-08
2,3,15,2026-03-09
3,4,20,2026-03-10
4,2,25,2026-03-11
5,6,30,2026-03-12
6,7,35,2026-03-13
7,8,40,2026-03-14
8,3,45,2026-03-15
9,10,50,2026-03-16
10,4,55,2026-03-17
11,2,10,2026-03-08
12,3,35,2026-03-09
13,4,20,2026-03-10
14,2,25,2026-03-11
15,6,50,2026-03-12
16,7,35,2026-03-13
17,8,20,2026-03-14
18,3,45,2026-03-15
19,10,50,2026-03-16
20,4,25,2026-03-17Si ustedes tienen otro CSV lo pueden utilizar.
Como importar Pandas
Vamos a importar pandas, creamos un archivo con el nombre pandas1.py en la misma carpeta que nuestro archivo ventas.csv , para importar pandas usamos.
import pandas as pd
Aqui lo que hacemos es importar pandas y ponerle un alias para referirnos a pandas como pd.
Abrir un archivo CSV con Pandas
El siguiente paso es abrir un archivo CSV con pandas, nuestro archivo ventas.csv
ventas = pd.read_csv("ventas.csv")Asi la variable ventas, va a tener la referencia al archivo ventas.csv y cuando realicemos consultas se van a leer los datos de el archivo.
Pandas maneja los datos como DataFrame un tipo de tabla especial para consultas como veremos mas adelante.
Obtener la informacion de los datos con Pandas
Vamos a obtener la informacion de los datos de las columnas de nuestro archivo:
print(ventas.info()) # mostrar información sobre el DataFrame
Aqui nos va a dar como resultado, el total de registro del archivo, las columnas y el tipo de columnas, la memoria utilizada.
RangeIndex: 20 entries, 0 to 19
Data columns (total 4 columns):
# Column Non-Null Count Dtype
--- ------ -------------- -----
0 id 20 non-null int64
1 cliente_id 20 non-null int64
2 total 20 non-null int64
3 Fecha 20 non-null str
dtypes: int64(3), str(1)
memory usage: 772.0 bytesObtener los Primeros y los Ultimos Registros de un DataFrame con Pandas
Los primeros y los ultimos registros los podemos obtener con las funciones head() y tail() respectivamente.
La funcion head() nos devuelve por default los primeros 5 registros de el DataFrame, si queremos obtener mas registros le pasamos como parametro el total de registros que queremos por ejemplo head(20)
print(ventas.head()) # mostrar las primeras filas del DataFrame
Resultado
id cliente_id total Fecha
0 1 2 10 2026-03-08
1 2 3 15 2026-03-09
2 3 4 20 2026-03-10
3 4 2 25 2026-03-11
4 5 6 30 2026-03-12Y para obetener las ultimas finales usamos la funcion tail() que devuelve los ultimos 5 registros, si queremos mas tambien le pasamos la cantidad como parametro.
print(ventas.tail()) # mostrar las últimas filas del DataFrame
Resultado
id cliente_id total Fecha
15 16 7 35 2026-03-13
16 17 8 20 2026-03-14
17 18 3 45 2026-03-15
18 19 10 50 2026-03-16
19 20 4 25 2026-03-17Obtener los registros de una columna con Pandas
Los DataFrames de pandas, tambien se comportan como si fueran diccionarios de python, si queremos obtener todos los registros de una columna, solo tenemos que poner el nombre de la columna entre corcheres.
clientes = ventas["cliente_id"] # resultado es un dataframe clientes.head() clientes.tail()
El resultado de hacer esta operacion es un Series es como un DataFrame pero solo tiene la columna seleccionada y como es un tipo DataFrame se pueden usar las funciones head() y tail() y el resto de funciones que vamos a ver.
Resultado
0 2
1 3
2 4
3 2
4 6
Name: cliente_id, dtype: int64
15 7
16 8
17 3
18 10
19 4
Name: cliente_id, dtype: int64Filtrar Datos con Pandas
Filtrar datos es buscar un rango de datos o datos que complan ciertas condiciones.
Primero vamos a filtrar los resultados donde el cliente sea igual a el cliente_id=2.
cliente_2 = ventas[(ventas["cliente_id"] == 2)] print(cliente_2) # mostrar las filas filtradas por cliente_id igual a 2
Resultado
id cliente_id total Fecha
0 1 2 10 2026-03-08
3 4 2 25 2026-03-11
10 11 2 10 2026-03-08
13 14 2 25 2026-03-11Tambien podemos usar los operadores menor que (<) , mayour que ( >), menor o igual que (<= ) y mayor o igual que ( >= )
Por ejemplo vamos a filtrar las ventas que la columna total sea mayor o igual a 10.
ventas_may_10 = ventas[(ventas["total"] >= 10)] print(ventas_may_10) # mostrar las filas filtradas mayores a 10
Y el resultado serian las ventas que la columna total sea mayor a 10.
Otro ejemplo sera obtener las ventas o los registros en un rango especifico, por ejemplo obtener las ventas que la columna total este entre 20 y 50.
Para agupar las condiciones se usa el operador & y podemos agregar varias condiciones.
ventas_entre_30_50 = ventas[(ventas["total"] >= 30) & (ventas["total"] <= 50)] print(ventas_entre_30_50) # mostrar las filas filtradas entre 30 y 50
Resultado
4 5 6 30 2026-03-12
5 6 7 35 2026-03-13
6 7 8 40 2026-03-14
7 8 3 45 2026-03-15
8 9 10 50 2026-03-16
11 12 3 35 2026-03-09
14 15 6 50 2026-03-12
15 16 7 35 2026-03-13
17 18 3 45 2026-03-15
18 19 10 50 2026-03-16Guardar un DataFrame de Pandas a un Archivo CSV
Es posible guardar o exportar un DataFrame a un Archivo, para ello simplemente vamos a usar el metodo to_csv(nombre) en el DataFrame que queremos guardar, por ejemplo.
ventas_entre_30_50 = ventas[(ventas["total"] >= 30) & (ventas["total"] <= 50)]
print(ventas_entre_30_50) # mostrar las filas filtradas entre 30 y 50
ventas_entre_30_50.to_csv("ventas2.csv")Y listo ya tenemos nuestro DataFrame guardado para futuras consultas.
Ahora ya podemos usar pandas para analizar nuestros archivos CSV y crear framentos o reportes para tener una informacion mas condensada.
Hola exelente página me interesa aprender python me gustaría que cuando realice un curso me tomé en cuenta
Saludos desde México
Buen dia narciso, claro, estaremos subiendo reels en facebook con lecciones de los cursos y estamos preparando un video largo para nuestro canal de youtube, Saludos desde Mexico tambien !!