Come calcolare la media per colonna in un DataFrame Pandas

In questo scenario ci troviamo con un DataFrame Pandas pieno di valori di cui vogliamo calcolarne la media in modi diversi.

Soluzione

Importiamo la libreria di Pandas e successivamente creiamo un dizionario con dei dati campione che poi convertiremo in un DataFrame.

				
					import pandas as pd tecnologie = {
    'Corso':["PHP","Python","C#","Unity",None],
    'Tariffa' :[20000,25000,22000,None,30000],
    'Durata':['30giorni','40giorni','35giorni','None','50giorni'],
    'Sconto':[1000,2300,1200,2000,None]}
    
index_labels=['r1','r2','r3','r4','r5']
df = pd.DataFrame(tecnologie, index=index_labels)
print(df)
				
			

Calcolo della media per tutte le colonne del DataFrame

				
					print(df.mean())
				
			

Calcolo della media per una specifica colonna del DataFrame

				
					print(df["Tariffa"].mean())
				
			

Calcolo della media per specifiche colonne del DataFrame

				
					print(df[["Tariffa","Sconto"]].mean())
				
			

Calcolo della media includendo i valori NaN

				
					print(df.mean(axis = 0, skipna = False))
				
			

Calcolo di tutte le statistiche dei dati nel DataFrame

				
					print(df.describe())
				
			

Conclusione

In questo articolo si illustra come calcolare la media dei valori contenuti in un DataFrame Pandas utilizzando le funzioni DataFrame.mean() e DataFrame.describe().

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

Most Recent

Come abilitare SSH Server su Fedora 17

Mi è capitato recentemente di dover installare in una macchina virtuale una vecchia versione a 32 bit di Fedora 17. Al fine di poter trasferire

Che cos’è log_cnt in una Postgres sequence

Uno scenario interessante su cui mi è capitato di lavorare riguarda l’utilizzo di una sequence in un database Postgres. In un applicazione containerizzata con Docker

Partners