Il P-value o valore P è la probabilità di osservare un risultato estremo come quello osservato, se l’ipotesi nulla fosse vera. Viene utilizzato per determinare la significatività statistica di un risultato. Un P-value inferiore a 0,05 è generalmente considerato statisticamente significativo, il che significa che c’è meno di una probabilità del 5% di ottenere il risultato osservato se l’ipotesi nulla fosse vera.

Ci sono alcune cose da tenere a mente quando si interpreta un P-Value:

  1. Il P-value dipende dalla dimensione del campione. Più piccola è la dimensione del campione, maggiore sarà il valore P.
  2. Il P-value non è la probabilità che l’ipotesi nulla sia vera. È la probabilità di osservare un risultato estremo come quello osservato, se l’ipotesi nulla fosse vera.
  3. Un P-value di 0,05 non significa che c’è una probabilità del 95% che l’ipotesi nulla sia vera. Significa che c’è una probabilità del 5% di ottenere il risultato osservato se l’ipotesi nulla fosse vera.

P-value: come leggere e interpretare la significatività statistica

Il P-value nei test statistici

Il valore P è una statistica che viene utilizzata per determinare la probabilità che i risultati di uno studio siano dovuti al caso. Questa statistica viene utilizzata per determinare il significato di uno studio. Più piccolo è il valore P, più è probabile che i risultati dello studio siano dovuti al caso. Il valore P viene utilizzato anche per determinare la potenza di uno studio. Il potere di uno studio è la capacità dello studio di rilevare una differenza se ce n’ è una.

Quando il P-value è minore di 0.05

In statistica, il valore p è una misura della forza delle prove rispetto all’ipotesi nulla. L’ipotesi nulla è l’ipotesi che afferma che non vi è alcuna differenza tra le medie dei due gruppi. Il valore p è la probabilità di osservare una differenza più grande o più grande di quella che è stata osservata, supponendo che l’ipotesi nulla sia vera. Se il valore p è inferiore a 0,05, l’evidenza a fronte dell’ipotesi nulla è abbastanza forte da respingerla.

E se è maggiore di 0.05?

Se il valore P è maggiore di 0,05, significa che c’è un 5% o meno di probabilità che l’ipotesi nulla sia vera. Ciò significa che c’è una probabilità pari o superiore al 95% che l’ipotesi alternativa sia vera.

Errori comuni sul P-Value

Ci sono diversi errori comuni riguardanti l’uso del p-value.

  • Il p-value non è la probabilità che l’ipotesi nulla sia vera o la probabilità che l’ipotesi nulla sia falsa. Non è connesso con nessuna delle due.
  • Il p-value non è la probabilità che un’osservazione sia un caso. Il calcolo del p-value è basato sull’ipotesi che ogni osservazione è un caso, un risultato aleatorio. Con la frase “il risultato è dovuto al caso” si intende di solito che l’ipotesi nulla è probabilmente corretta, ma ricordiamo che il p-value non può essere usato per rappresentare la probabilità che un’ipotesi sia vera.
  • Il p-value non è la probabilità di rifiutare l’ipotesi nulla quando questa è vera.
  • Il p-value non è la probabilità che replicando l’esperimento si otterrebbe la stessa conclusione. Per quantificare la replicabilità di un esperimento è stato introdotto il concetto di p-rep.
  • Il livello di significatività α non è determinato dal p-value. Il livello di significatività è deciso dalla persona che conduce l’esperimento prima di vedere i dati.

Come si costruisce un campione statistico

campione statistico

Foto di Canva

Il campione statistico è un gruppo di unità elementari che formano un sottoinsieme della popolazione.
Un campione è generalmente costituito in modo da consentire, con un rischio definito di errore, la generalizzazione all’intera popolazione. Data una popolazione, individuata dal valore di una o più variabili sulle unità elementari, è quindi possibile studiarne le caratteristiche sulla base delle informazioni derivanti dal campione.

Si possono definire diverse tecniche di selezione dei campioni. A ciascuna tecnica corrisponde un diverso spazio campionario, che rappresenta l’insieme di tutti i possibili campioni che possono essere estratti con la tecnica prescelta.

La scelta del campione

Attraverso le indagini statistiche è possibile analizzare determinati aspetti riferiti a un settore di mercato, prodotto o servizio. Per raggiungere tale obiettivo è utile identificare il campione da analizzare.

Modalità di selezione del campione sono:

  • Scelta di comodo (campionamento per quote o convenience sampling).
  • Scelta ragionata (campionamento ragionato o judgmental sampling).
  • Scelta casuale (campionamento casuale o random sampling).
  • Scelta sistematica (campionamento sistematico).
  • Scelta probabilistica (campionamento probabilistico o probabilistic sampling).

Per le ricerche di mercato e per i sondaggi di opinione solitamente vengono utilizzate tutte e cinque le modalità sopra indicate.

Come scegliere i metodi di campionamento statistico

Ricorrere al campione statistico è quindi utile in alcuni casi perché, data una popolazione di unità, il campione esprime una sua parte rappresentativa del tutto. In questo modo i dati raccolti possono essere poi attribuiti per estensione al target generale di riferimento per quella specifica indagine. Ma i metodi di campionamento da utilizzar

Come scegliere i metodi di campionamento statistico

Foto di Canva

e sono appunto molti, e vanno scelti in base all’obiettivo dell’indagine da realizzare.
Per approfondire quindi quali sono i metodi di campionamento statistico puoi leggere anche questo articolo.

Lettura consigliata: “Un campione” di Santarelli

Quanti sono gli italiani che approvano il congelamento della contingenza sulle liquidazioni? E come saperlo senza ricorrere ad un referendum? Come scegliere il campione su cui condurre la ricerca? E quale sarà l’errore dovuto al campione?

Vi consigliamo di leggere il manuale “Un campione. (francoangeli.it) che ha un duplice intento:

1. fornire un quadro logico del ragionamento statistico alle persone che operano nel settore delle ricerche sociali e che, generalmente, hanno una formazione prevalentemente umanistica

2. fornire uno strumento di lavoro per la stima di percentuali, compito quotidiano di chi tratta campioni in indagini di tipo survey.

Attraverso un’esposizione pianissima l’autore insegna ad utilizzare i concetti di errore campionario, livello di significatività, dimensionamento di un campione, ecc. fornendo ai non specialisti la chiave per comprendere in modo esatto il significato delle affermazioni coinvolgenti l’uso delle tecniche statistiche.

Agli specialisti invece fornisce uno strumento di uso quotidiano, per quando si debba valutare l’inevitabile “margine di errore” di un dato quantitativo.

Il volume è corredato da nuove tavole di campionamento, originariamente calcolate da Eurisko per uso interno e che, poi, l’Istituto ha affidato a Ulderico Santarelli perché le presentasse ad una più vasta cerchia di persone.

Ulderico Santarelli si è laureato in matematica a Milano. Lavora presso la Ibm dove si occupa soprattutto di ricerca operativa e di applicazione dei metodi statistici nel marketing e nella ricerca.