Recursos libres para aprender a programar en español
Ya sabemos qué es un lote de datos, un DataFrame
y cómo podemos usar pandas
para cargarlo con datos. ¡Descubramos entonces qué podemos hacer con los datos a partir de ahora!
¡Seguínos!
Carguemos un luego lote de datos
>>> florerias = pd.read_csv("https://cdn.buenosaires.gob.ar/datosabiertos/datasets/ministerio-de-espacio-publico-e-higiene-urbana/puestos-de-flores/puestos-flores.csv")
>>> florerias
# para obtener los valores de una columna,
# la sintaxis es tabla[nombre_de_columna]
>>> florerias["TITULAR"]
0 PEVES SALLY STEPHANIE
1 HEREDIA LUIS HECTOR
2 AYBAR MARIA SOLEDAD
3 REBASA OTINIANO SANTOS CLARA
4 SALAZAR ESCOBAR ROSENDA
...
95 DE NICOLO CONO WALTER DARIO
96 SAGARDIA DESIDERIO
97 CONDOLUCI MARIA TERESA
98 MC INTYRE YOLANDA ELIZABETH
99 CORDERO EZEQUIEL MAXIMILIANO
Name: TITULAR, Length: 100, dtype: object
¡Ahora te toca a vos! Obtené las calles de las florerías
De la misma forma que podemos obtener las primeras y últimas filas de una tabla, también podemos obtener los primeros valores de una columna…
>>> florerias["TITULAR"].head(5)
0 PEVES SALLY STEPHANIE
1 HEREDIA LUIS HECTOR
2 AYBAR MARIA SOLEDAD
3 REBASA OTINIANO SANTOS CLARA
4 SALAZAR ESCOBAR ROSENDA
Name: TITULAR, dtype: object
… como los últimos:
>>> florerias["TITULAR"].tail(5)
95 DE NICOLO CONO WALTER DARIO
96 SAGARDIA DESIDERIO
97 CONDOLUCI MARIA TERESA
98 MC INTYRE YOLANDA ELIZABETH
99 CORDERO EZEQUIEL MAXIMILIANO
Name: TITULAR, dtype: object
Como vemos, esta funciones infijas toman un Series
y un número, y devuelven otro Series
con los valores seleccionados.
# a lo que llamos tabla, pandas lo llama DataFrame
# a lo que llamamos columna, pandas lo llama Series
Hay funciones y procedimientos que funcionan tanto con los DataFrames como con los Series.
Pero, al ser distintas sus estructuras, ya que el primero es una tabla con muchas columnas, mientras que el Series es básicamente una única columna, los parámetros variarán.
florerias["Calle"].unique()
>>> len(florerias["Calle"].unique())
67
Como esta operación es tan común, contamos con un atajo: la función infija nunique
:
>>> florerias["Calle"].nunique()
67
florerias["Calle"].value_counts()
Vuelta sobre el sort_values
No, ¡no es el índice de la lección!
# otro uso de corchetes:
# la función iloc se usa de la siguiente forma:
# tabla.iloc[indice]
# con iloc podemos obtener una fila en base a su número (índice) de fila
# OJO: el número o indice de fila no necesariamente coincide con la posición de la fila en la tabla
florerias.iloc[4]