Articolo Data Analysis con le Tabelle Pivot

Data Analysis con le Tabelle Pivot 1 di 3

Dalle Tabelle Dati alle Tabelle Pivot di Excel

Articolo pubblicato il 06/05/2019 Da Donata Petrelli e rilasciato con licenza CC BY-NC-ND 3.0 IT (Creative Common – Attribuzione – Non commerciale – Non opere derivate 3.0 Italia)

In un mondo completamente dominato dai dati, la problematica che si vive quotidianamente è quella di riuscire ad ottenere delle informazioni utili da essi. Qualunque sia il nostro ruolo o professione, conoscerne il “risultato finale” ci dà vantaggio competitivo.

Esistono moltissime tecniche, dalla matematica alla statistica fino all’Intelligenza Artificiale, che consentono di ottenere informazione utili da una mole (spesso grezza e non omogenea) di dati ed altrettanti software specifici in grado di metterle in pratiche per ottenere la cosiddetta “risposta finale”.

Ma in mancanza di conoscenze tecniche specifiche o di software in grado di elaborarle, come possiamo in autonomia riuscire ad analizzare dati in nostro possesso ed ottenere da essi informazioni utili al nostro business o alla nostra salute?

In questo tutorial parleremo di come affrontare questo importantissimo argomento attraverso l’uso di uno dei software più diffusi e semplici al mondo ma, al tempo stesso, estremamente flessibile e potente, Excel di Microsoft e, in particolare, un uno dei suoi strumenti avanzati nati per questo preciso scopo: le Tabelle Pivot.

Materiale per articolo Data Analysis con le Tabelle Pivot
Size: 9 Kb

Per tutto il tutorial utilizzeremo una tabella con dei dati studiati appositamente allo scopo. Questi dati li abbiamo resi disponibili gratuitamente per consentire ai lettori di ricreare tutti gli esercizi che vedrete così da potervi aiutare nell’apprendimento.

Il file si chiama Dati_per_Tabella_Pivot.xlsx e lo potete scaricare in forma compressa (.zip) direttamente qui

Dalle tabelle alle tabelle Pivot

In generale, una tabella ha una specifica struttura. È organizzata in righe e colonne a formare una sorta di matrice. In una tabella deve essere presente almeno una riga e ogni riga prende il nome di record. Le colonne identificano i campi, a loro volta i dati contenuti nei campi possono essere di natura diversa: testi, numeri, immagini statiche o dinamiche, suoni ecc. A seconda della loro natura si avrà il corrispondente formato di un dato.

Per sua stessa natura, si tratta di una tabella bidimensionale in cui, come in una matrice, ogni dato è rappresentato utilizzando due coppie di valori: il primo contiene l’indice della riga, il secondo l’indice della colonna. Nell’esempio sottostante per ottenere il valore ‘217’, contenuto alla riga 6 della colonna D, basta scrivere il nome della cella D6 nella casella del nome.

Figura 1 – Struttura matriciale di una tabella
Figura 1 – Struttura matriciale di una tabella

Anche una semplice tabella si rivela preziosa nel momento in cui i dati devono essere poi analizzati, elaborati ed interpretati. Dunque, oltre ad archiviare i dati, una tabella è un Database (flat) che permette di poterli ordinare, filtrare, interrogare, analizzare ed effettuare molte altre operazioni necessarie ad estrapolare da essi informazioni preziose. La potenza di una tabella, la sua struttura matriciale, diventa però anche il suo limite al momento di effettuare queste operazioni in modo semplice e, soprattutto, veloce.

Infatti, sempre riprendendo la tabella dell’esempio precedente (Figura 1), ci accorgiamo che non è poi così immediato poter trarre informazioni utili da essa ma occorre lavorare prima su di essa. Ad esempio se volessimo analizzare i ricavi da diversi punti di vista, possiamo farlo secondo gli attributi (dimensioni):

  • settore
  • provincia
  • articolo

ed inoltre, utilizzando differenti misurazione quantitative (metriche) dei dati, ad esempio:

  • somma
  • media
  • massimo
  • minimo

Ragionamento analogo per il campo pezzi.

In ogni caso sarà necessario operare manualmente dapprima una pulizia dei dati nel caso fossero presenti record nulli o duplicati, quindi ordinare la tabella in base al campo assunto come dimensione principale per l’analisi. Da qui Excel mette a disposizione lo strumento ‘Subtotale’ che consente appunto di strutturare la tabella in modo da trarre le informazioni che cerchiamo da essa in modo immediato.

Ad esempio, se vogliamo ottenere dalla tabella di partenza il totale dei ricavi per articolo, dobbiamo lavorare su di essa tenendo in considerazione i seguenti parametri:

  • dimensione = articolo
  • metrica = somma

Pertanto ordiniamo dapprima la tabella in base al campo articolo, dal menù ‘Dati/Ordina’ dopo aver posizionato il mouse sulla cella C1 (Articolo):

Figura 2 – Tabella Ordinata in base al campo Articolo
Figura 2 – Tabella Ordinata in base al campo Articolo

Una volta ottenuta la nuova tabella, applicare lo strumento ‘Subtotale’ dal menù ‘Dati/Struttura/Subtotale’. Quindi impostare la finestra dei Subtotali in modo che ad ogni cambiamento in ‘Articolo’ si usi la funzione ‘Somma’. Per finire aggiungere i subtotali sotto il campo ‘Ricavi’. Riportiamo il risultato in Figura 3:

Figura 3 - Subtotali
Figura 3 – Subtotali

Come possiamo constatare, solo dopo aver lavorato preventivamente nella struttura iniziale della tabella possiamo ottenere le informazioni che desideriamo.

Ma nel caso occorrano altre informazioni? Ad esempio conoscere i ricavi divisi per provincia? O per settore? Inoltre, se il database iniziale dovesse subire modifiche per cui alcuni record potrebbero essere eliminati e dei nuovi aggiunti? … dobbiamo ripetere il procedimento da capo ogni volta 🙁

Ci accorgiamo che questo metodo, oltre che piuttosto lungo e macchinoso, a lungo andare può diventare scoraggiante. È a questo punto che intervengono le tabelle Pivot, per agevolare e velocizzare il processo di analisi dei dati.

Le tabelle Pivot sono particolari tabelle che permettono di riepilogare i dati su tre dimensioni, da cui il nome ‘pivot’, utilizzando le funzioni di calcolo come somma o media per sintetizzarli e diverse pagine per visualizzarli da ciascuna prospettiva.

Vengono utilizzate nei processi di analisi avanzata, come le classificazioni, calcolo e riepilogo dati.

Permettono inoltre di redigere velocemente report delle analisi fatte grazie ai quali è possibile fare confronti, trovare schemi e tendenze dei dati.

Si tratta dunque di un potente strumento di data analysis ma, al tempo stesso, di facile utilizzo e, dunque, adatto a tutti, anche per i non tecnici o esperti di programmazione, ma che devono comunque fare analisi per il loro business.


Se hai trovato questo articolo interessante ti consigliamo di continuare con la lettura della seconda e terza parte.

In più una sorpresa finale per te!

Registrati gratuitamente al sito per leggere tutta la guida completa e molte altre risorse utili per il lavoro e lo studio.

Torna su