La moda è una delle misure di tendenza centrale più semplici e utili per descrivere un insieme di dati. Essa rappresenta il valore che compare con maggiore frequenza all'interno di un dataset. A differenza della media e della mediana, la moda può essere determinata anche per dati categorici o discreti e non richiede che i dati siano ordinati. Per questo motivo, fornisce un'indicazione immediata del valore più comune.
Indice
Definizione di moda
La moda è il valore che compare più frequentemente in un insieme di dati. A seconda della distribuzione, un insieme può essere:
- unimodale, se presenta una sola moda;
- multimodale, se presenta più mode;
- privo di moda, se tutti i valori compaiono con la stessa frequenza.
Calcolo della moda
Per determinare la moda di un insieme di dati, si procede nel seguente modo:
- Contare la frequenza di ciascun valore.
- Individuare il valore (o i valori) con frequenza massima.
- Se più valori condividono la stessa frequenza massima, l'insieme è multimodale.
Esempio 1: Un solo valore dominante
Consideriamo l'insieme:
\( \{5, 3, 7, 5, 9, 5, 6\} \)
Frequenze:
- \(5\) compare 3 volte;
- \(3\), \(7\), \(9\) e \(6\) compaiono una volta.
Poiché \(5\) è il valore più frequente:
\[ \text{Moda}=5 \]
Esempio 2: Dati multimodali
Consideriamo:
\( \{8, 10, 12, 10, 8, 14, 16\} \)
Frequenze:
- \(8\) compare 2 volte;
- \(10\) compare 2 volte;
- \(12\), \(14\) e \(16\) compaiono una volta.
I valori più frequenti sono due, quindi:
\[ \text{Moda}=8 \quad \text{e} \quad 10 \]
Esempio 3: Nessuna moda
Consideriamo:
\( \{1, 2, 3, 4, 5\} \)
Tutti i valori compaiono una sola volta, quindi l'insieme non ha moda.
\[ \text{Moda}=\text{nessuna} \]
Moda, media e mediana a confronto
La moda è particolarmente utile per individuare il valore più comune in un insieme di dati. A differenza della media e della mediana, non è influenzata dalla presenza di valori estremi (outlier) e può essere applicata anche a dati non numerici.
Nei dati categorici (ad esempio colori, preferenze o categorie), la moda rappresenta spesso l'unica misura di tendenza centrale significativa.
Utilizzata insieme a media e mediana, consente di ottenere una descrizione più completa della distribuzione dei dati e di identificare i valori più rappresentativi.