Perché ho smesso di usare i box plot: sono veramente superati?

Nel mondo della visualizzazione dei dati, la discussione sui migliori metodi per rappresentare informazioni continua a evolvere. Tradizionalmente, i box plot sono stati uno strumento di riferimento per visualizzare distribuzioni di dati. Tuttavia, come evidenziato da vari esperti del settore, l’efficacia dei box plot è stata messa in discussione, soprattutto quando ci sono alternative più moderne e intuitive. Alcuni sostengono che i box plot celano troppo l’informazione, trasformando dati ricchi in una rappresentazione eccessivamente semplificata e potenzialmente fuorviante.

Uno dei principali punti di discussione è l’uso dei violin plot e dei bee swarm plot. I violin plot, per esempio, offrono una visione più dettagliata della distribuzione dei dati grazie alla loro rappresentazione simmetrica e all’uso della stima della densità di kernel. Mentre i violin plot migliorano significativamente la chiarezza rispetto ai box plot, è importante considerare che la loro efficacia dipende dal corretto utilizzo del parametro di larghezza della banda, che può influenzare notevolmente la forma del plot. Un commento rilevante a tal proposito evidenzia: ‘La selezione del bandwidth ‘giusto’ è un classico problema di trade-off tra bias e varianza’.

image

I bee swarm plot, d’altro canto, offrono una visualizzazione quasi perfetta della distribuzione completa dei dati, posizionando proprio ogni singolo punto dati in modo tale da evitare sovrapposizioni e mostrando esattamente dove ogni punto si trova. Questo porta a una rappresentazione altamente dettagliata e immediatamente interpretabile. Come indicato da un utente, ‘I bee swarm plot sono i migliori quando i dati sono pochi’. Quando i dati sono molti, i violin plot possono essere preferibili per la loro rappresentazione grafica senza sovrapposizioni.

L’educazione gioca un ruolo cruciale nella scelta della tecnica di visualizzazione. Molti lettori non esperti potrebbero trovare difficile interpretare correttamente i box plot. Non è sufficiente solo mostrare i dati, ma è essenziale garantire che essi siano interpretabili facilmente dal maggiore numero possibile di persone. Un commento particolarmente incisivo sottolinea che: ‘Non importa se è un problema educativo o meno. Cessa di essere un buon mezzo di comunicazione se la tua audience non riesce a comprenderlo’. Ancora meglio, punti dati con overlays possono migliorare notevolmente la chiarezza.

In conclusione, sebbene i box plot possano avere il loro valore in contesti specifici, ci sono alternative che offrono migliori capacità di comunicazione in molti più casi. L’utilizzo di tecniche come strip plot con jittering, heatmap delle distribuzioni, violin plot, o bee swarm plot può fornire una visione molto più dettagliata e meno ambigua della distribuzione dei dati. Come accennato da un esperto: ‘Vi consiglio di rivalutare l’uso dei box plot e di prendere in considerazione alternative più intuitive’. L’evoluzione della visualizzazione dei dati continua, e adattarsi a nuovi strumenti e tecniche può arricchire la nostra capacità di comunicare informazioni in modo chiaro e efficace.


Comments

Leave a Reply

Your email address will not be published. Required fields are marked *