In questo scenario ci troviamo con un DataFrame Pandas pieno di valori di cui vogliamo calcolarne la media in modi diversi.
Soluzione
Importiamo la libreria di Pandas e successivamente creiamo un dizionario con dei dati campione che poi convertiremo in un DataFrame.
import pandas as pd tecnologie = {
'Corso':["PHP","Python","C#","Unity",None],
'Tariffa' :[20000,25000,22000,None,30000],
'Durata':['30giorni','40giorni','35giorni','None','50giorni'],
'Sconto':[1000,2300,1200,2000,None]}
index_labels=['r1','r2','r3','r4','r5']
df = pd.DataFrame(tecnologie, index=index_labels)
print(df)
Calcolo della media per tutte le colonne del DataFrame
print(df.mean())
Calcolo della media per una specifica colonna del DataFrame
print(df["Tariffa"].mean())
Calcolo della media per specifiche colonne del DataFrame
print(df[["Tariffa","Sconto"]].mean())
Calcolo della media includendo i valori NaN
print(df.mean(axis = 0, skipna = False))
Calcolo di tutte le statistiche dei dati nel DataFrame
print(df.describe())
Conclusione
In questo articolo si illustra come calcolare la media dei valori contenuti in un DataFrame Pandas utilizzando le funzioni DataFrame.mean() e DataFrame.describe().