Analisi dei dati
Home Up Ricerca di mercato Statistica What-If Data Mining Analisi decisionali Analisi dei dati Reti neurali M.I.S. Casi aziendali Business Intellig.

 

INDICE

PREMESSA

 L'analisi dei dati (a.d.d.) è agire all'interno di un sistema composto di più tappe, tutte ugualmente importanti ed interdipendenti: dai dati grezzi all'output di sintesi.

Spetta allo statistico la scelta della tecnica più opportuna di a.d.d. secondo lo scopo e l'oggetto del progetto, il che significa intervenire (per operare delle scelte) in tutte le fasi che costituiscono, nel loro complesso, l'analisi dei dati.

Nella figura successiva figurano, in successione logica indicata dalle frecce, 7 fasi principali nelle quali si può ipotizzare si svolga un'analisi dei dati: figurano, inoltre, due frecce (in senso inverso) contrassegnate con il termine feed-back (informazioni di ritorno) relative alle informazioni che possono emergere dai risultati dell'applicazione effettuata e che invitano a modificare o la tabella dei dati scelti per l'a.d.d. o, addirittura, i dati grezzi rilevati. Per brevità, si sono indicati solo due tipi di feed-back, ma nell'interpretazione dei risultati potrebbero emergere anche altri tipi di segnalazioni (ad esempio, errori di codifica a priori od a posteriori).

Le fasi dell'analisi dei dati

L'a.d.d. può essere impiegata per due scopi principali, spesso compresenti. Se lo scopo è confermativo, significa che tramite l'a.d.d si vogliono verificare ipotesi formulate sul fenomeno oggetto di studio; se lo scopo è, invece, esplorativo di fenomeni non noti, occorrerà considerare numerosi caratteri di partenza, appunto esplorativi, che tramite l'a.d.d si cercherà di "condensare"/ridurre in numero minore.

Nei paragrafi che seguono saranno commentate brevemente le fasi indicate nella figura.

I DATI GREZZI O MOMENTO DELLA RACCOLTA DEI DATI

Molti sono i metodi e le fonti (provenienza) possibili di raccolta di dati statistici: essi variano, principalmente,  secondo gli scopi  del progetto del progetto e la natura del problema.

Dal punto di vista statistico si possono, molto schematicamente (e non esaustivamente) individuare tre tipi principali di metodi possibili di raccolta dei dati grezzi che andranno a costituire documentazione statistica di partenza per un'analisi dei dati:

  •  un questionario proveniente da rilevazioni dirette mediante indagini ad hoc;

  •  statistiche indirette, raccolte da enti vari;

  •  risultati di osservazioni sperimentali o database aziendali.

I tre metodi di acquisizione dei dati grezzi possono, ovviamente, coesistere, purché siano salvaguardati gli stessi criteri di rappresentatività ed omogeneità rispetto al problema in esame.

Qualunque sia il metodo di raccolta impiegato, interessa osservare che la documentazione statistica ottenuta (dati grezzi) dovrebbe presentare i seguenti requisiti:

  •  scientifici: deve contenere la definizione del problema da analizzare;

  •  pratici: deve presentare omogeneità dei dati;

  •  informatici: contiene la premessa per la codifica a priori (2' fase della figura).

Di contro, dal punto di vista delle successive elaborazioni statistiche, occorre tener presente che la documentazione statistica di partenza contiene, quasi sempre:

  • caratteri statisticamente eterogenei: quantitativi e qualitativi.

  • dati grezzi: dati che richiedono ulteriori elaborazioni statistiche (ad esempio, calcolo di frequenze, rapporti statistici, ponderazioni, standardizzazioni, ecc.) prima di poter costituire la tabella dei dati da sottoporre all'a.d.d. richiesta.

LA CODIFICA A PRIORI DEI DATI GREZZI

La codifica a priori dei dati grezzi rilevati nella prima fase di un'a.d.d. rappresenta il primo passo per il trattamento automatico dei dati. Essa, tuttavia, non va vista soltanto nei suoi aspetti tecnico-informatici, ma anche scientifici.

Una buona codifica a priori richiede, infatti, la conoscenza dei fenomeni oggetto di studio: fenomeni poco noti (per mancanza di precedenti esperienze e/o conoscenze) conducono spesso a codifiche a priori ambigue o incomplete se non, in taluni casi, distorte.

Dal punto di vista operativo, la codifica a priori consiste nella trasposizione di tutti i dati grezzi, rilevati nella prima fase, nella matrice dei dati grezzi o tabella inventario.

LA CODIFICA A POSTERIORI

La codifica a posteriori riguarda la necessità di ricodificare i dati contenuti nella matrice dei dati grezzi (o tabella inventario), affinché essi siano compatibili con certi algoritmi.

LA SCELTA  DELLA TABELLA DEI DATI

La quarta fase dell'a.d.d riguarda la scelta della/e tabella/e dei dati da sottoporre a uno o più metodi di analisi dei dati. Non sempre, infatti, la matrice dei dati è da sottoporre interamente all'analisi.

sebbene non esistano criteri unici di scelta della/e tabella/e "migliore" da analizzare, osserviamo che che, in tale scelta, due sono i fattori che giocano un fattore importante:

  • i criteri di costruzione di una tabella dei dati: pertinenza (rispetto al problema da analizzare), omogeneità (dei dati), esaustività (rappresentatività dei dati sia rispetto alle unità che ai caratteri);

  • lo scopo dell'a.d.d.: confermativo o esplorativo.

Se lo scopo dell'a.d.d. è confermativo, i caratteri da prendere in considerazione sono, in genere, poco numerosi e le ipotesi di ricerca sono abbastanza precise. In tal caso, una volta effettuate correttamente le tre fasi precedenti descritte, la scelta della/e tabella/e dei dati non presenta molti problemi, poiché si può considerare interamente la matrice dei dati ottenuta nella terza fase dell'a.d.d..

Se lo scopo dell'a.d.d. è, invece, esplorativo, si avrà a che fare con un notevole numero di caratteri, appunto "esplorativi"; scegliere l'intera matrice dei dati come tabella dei dati da sottoporre ad analisi, porta a risultati difficilmente interpretabili.

Si possono, allora scegliere due approcci.

  • scelta a priori, in base alle conoscenze; criteri soggettivi del fenomeno oggetto di studio; l'aiuto di strumenti statistici di supporto della tabella dei dati da sottoporre ad analisi;

  • stepwise (passo-passo), per giungere, attraverso l'impiego di analisi fattoriali ad una riduzione dei molti caratteri di partenza

LA SCELTA  DELLA DISTANZA (O SIMILARITÀ) TRA UNITÀ

Questa fase riguarda la scelta di una misura della diversità (o somiglianza) tra i profili (righe) di una tabella dei dati. Più precisamente, dal punto di vista statistico, il significato che può essere attribuito alla matrice delle distanze (o similarità) tra unità - costruibile a partire dalla tabella dei dati, una volta scelta la misura (distanza, indice di diversità/dissimilarità), a livelli di precisione diversi secondo il tipo di dati a disposizione - è quello di misura dalla rassomiglianza o dissomoglianza di tutte le unità, prese due  due, rispetto a tutti i caratteri contemporaneamente considerati.

In generale, la scelta di una data distanza (o similarità), dipende dalla compatibilità che deve esistere tra tipo di tabella dei dati, tipo dei dati e misura/e possibili, nell'ipotesi di scegliere il livello di misurazione più alto tra quelli consentiti dai dati disponibili. Una volta, tuttavia, assicurata tale compatibilità e, qualora si sia in dubbio tra più misure possibili, non si possono stabilire dei criteri unici di scelta della misura "migliore": è, allora, conveniente fare più prove con misure diverse per valutarne la bontà o meno rispetto al problema da analizzare.

È, infine, il caso di osservare circa la scelta delle distanze che, non sempre i packages statistici di a.d.d. consentono opzioni tra diverse misure e che, qualora le consentano, non sempre tra esse figurano le distanze più importanti, obbligando al calcolo a parte delle matrice delle distanze da inserire poi in analisi.

LA SCELTA  DEL METODO E DEL PROGRAMMA DI A.D.D.

Questa fase dell'a.d.d. dovrebbe riguardare soltanto la scelta del software di a.d.d., ossia la scelta tra vari packages statistici esistenti /o disponibili per effettuare il tipo di analisi dei dati di partenza. Nella pratica accade, invece, che su una stessa tabella dei dati (o matrice delle distanze) si decida di effettuare più metodi di a.d.d., in base ai risultati via via ottenuti.

Importante è, dunque, in questa fase, la scelta del programma di a.d.d.. L'esistenza, oggi, di molti packages statistici di a.d.d., se da una parte rende ormai tale fase assai semplice e alla portata di tutti, dall'altra richiede, invece, da parte dell'utilizzatore, alcuni accorgimenti.

Anzitutto, una certa dimestichezza, ottenibile solo con la pratica, nel loro impiego: ciascun package statistico ha le sue specifiche caratteristiche informatiche e diverse sono le procedure.

Inoltre, è importante conoscere a fondo le potenzialità dei packages impiegati: spesso accade di dover ridurre i tipi di analisi richiesti per effettiva carenza del packages.

Oppure può accadere l'inverso, cioè di sottoutilizzare le potenzialità consentite da un dato package di a.d.d., per scarsa conoscenza.

L'OUTPUT DI SINTESI DEI RISULTATI

L'ultima fase dell'a.d.d riguarda la stampa dei risultati finali ottenuti dall'a.d.d., effettuata secondo le varie scelte nelle fasi precedenti ed espressa, oltre che da valori numerici, da rappresentazioni grafiche particolarmente importanti e necessarie all'interpretazione dei risultati ottenuti.

Ogni metodo di a.d.d ha una sua propria rappresentazione grafica di sintesi d'interpretazione dei risultati: ad esempio, l'analisi dei gruppi, il dendogramma o i grafi; l'analisi delle componenti principali e l'analisi delle corrispondenze, gli assi fattoriali; la regressione, la retta di regressione e così via.

La bontà della rappresentazione finale dipende, in ogni caso, da tutte le scelte che sono state effettuate nelle diverse fasi e che costituiscono, nel loro complesso, l'analisi dei dati: essa è direttamente proporzionale alla validità delle scelte operate.

Le decisioni d’impresa, spesso, non sono né giuste né sbagliate: noi ti aiutiamo, però, affinché esse siano sempre le migliori”.

Conseguire un vantaggio competitivo con l’analisi dei dati aziendali

Richiedete la soluzione gratuita di un vostro caso aziendale

La statistica nelle decisioni aziendali

Back Home Up Next

 
Invia un mail a webmaster@statix.ch con i tuoi commenti su questo sito.
Copyright © 2000, Statíx - metodi quantitativi d'impresa
Ultimo aggiornamento: 05 gennaio, 2019