Glossario statistico

Accuratezza Vicinanza di un valore rilevato al corrispondente valore vero, anche riferito ad una stima. Può essere espressa quantitativamente dal reciproco dell'errore quadratico medio: maggiore è l'errore quadratico medio, minore l'accuratezza della stima e viceversa.
Affidabilità Il termine si riferisce alla fonte, allo strumento, al metodo, alla procedura, ecc. E' affidabile una procedura dalla quale si ottengono dati di qualità costante o poco variabile in ripetute applicazioni della stessa sotto identiche condizioni. Il termine affidabile è utilizzato anche per una stima, quando l’errore globale non supera un prestabilito livello.
Analisi di regressione In presenza di dati da una variabile dipendente e da una o più variabili indipendenti, l'analisi di regressione implica la ricerca del migliore modello matematico per descrivere o predire il valore della variabile dipendente in funzione dei valori della o delle variabili indipendenti. Esistono diversi modelli di regressione, adeguati per diverse esigenze. Tra le forme più comunemente usate vi sono la regressione lineare, logistica (nella quale la variabile dipendente è nominale) e del rischio proporzionale (come l'analisi di sopravvivenza secondo Cox). 
Attendibilità Espressione della qualità dei dati rilevati con procedure statistiche affidabili. Attendibile, sia in relazione al dato rilevato che alla stima, è il termine comunemente utilizzato per esprimere un livello di qualità valutabile statisticamente. 
Aumento relativo di rischio (RRI; relative risk increase)  L'aumento proporzionale di rischio tra i partecipanti assegnati al gruppo di sperimentale e quelli assegnati al gruppo di controllo in uno studio. 
Bias (errore sistematico) Deviazione sistematica dei risultati di uno studio dai risultati veri a causa del modo nel quale è stato condotto lo studio. In ogni studio o revisione sistematica dovrebbero essere discusse le potenziali fonti di bias e le misure prese per evitarne/limitarne l'effetto 
Campione Data una popolazione statistica composta da N unità, con N qualsiasi, si denomina campione l'insieme delle n unità selezionate fra le N che compongono la popolazione. Può essere formato in base a logiche probabilistiche o a criteri soggettivi di rappresentatività. Le tecniche campionarie sono utilizzate per stimare statistiche della popolazione, ad esempio: medie, totali, rapporti fra variabili. Le stime ottenute in base a campioni di popolazione sono soggette all'errore campionario. 
Cartella clinica Atto pubblico dotato di rilevanza giuridica, la cui corretta compilazione costituisce un obbligo e dunque una responsabilità per il medico. Essa adempie la funzione di diario relativo al decorso della malattia e ad altri fatti clinici rilevanti, coincidendo, di conseguenza, con la storia della degenza del paziente all’interno dell’ospedale per ogni episodio di ricovero. La cartella clinica viene aperta al momento dell’ammissione di un paziente in un istituto e viene chiusa al momento della dimissione.
Causa principale di morte Malattia o traumatismo che ha dato inizio a quella catena di eventi morbosi che porta direttamente a morte; oppure: l’insieme delle circostanze dell’accidente o della violenza che hanno provocato la lesione traumatica mortale.
Chi quadrato (χ2) Tecnica di valutazione statistica della distribuzione di esiti in forma nominale fra trattamenti. L'obiettivo è stimare quanto è probabile che la distribuzione osservata possa verificarsi per puro caso se la distribuzione degli esiti è indipendente dalla distribuzione dei trattamenti. Se la probabilità è piccola (<5%) si può respingere l'ipotesi di indipendenza tra esiti e trattamenti. Il test chi quadrato è alla base di tutte le stime di rischio. Respingere l'ipotesi di indipendenza non significa, tuttavia, affermare un rapporto causa-effetto
Coefficiente di correlazione Una misura di associazione che indica in che grado due variabili variano insieme in relazione lineare (o che può essere resa lineare con trasformazioni matematiche anche complesse). Viene rappresentato con la lettera r e varia tra -1 e +1. Quando vale +1 indica relazione positiva perfetta (quando una variabile aumenta, aumenta anche l'altra e la differenza rimane proporzionalmente costante). Quando vale -1 indica relazione negativa perfetta (quando una variabile aumenta, l'altra diminuisce e la differenza rimane proporzionalmente costante). Quando vale 0 indica assenza di correlazione, ma ciò non esclude una correlazione, esclude esclusivamente che tale correlazione abbia la forma considerata dall'equazione in studio. 
Confondente Effetto di una variabile estranea che può creare artificialmente o mascherare un'associazione tra esposizione e malattia. Il confondente deve essere almeno apparentemente associato con l'esposizione (fattore di rischio), non può essere conseguenza dell'esposizione e deve essere un fattore di rischio della malattia.
Correlazione Relazione che esiste tra due variabili. Quando due variabili sono positivamente correlate fra loro in modo lineare, al crescere dell’una crescono i valori dell'altra, mentre il contrario avviene se le due variabili sono correlate negativamente. E’ espressa da un coefficiente di correlazione (r), che oscilla da 0 a +1 in caso di relazione positiva e da 0 a - 1 in caso di relazione negativa.
Correttezza Proprietà per la quale il valore atteso dello stimatore coincide con quello del parametro stimato. In riferimento al dato rilevato sulla singola unità statistica esprime una misurazione non affetta da errore; in altri termini il dato è corretto se il valore rilevato coincide col valore vero. 
Covarianza Covarianza  di due variabili aleatorie  è il valore atteso dei prodotti delle loro distanze dalla media: La covarianza può anche essere espressa come la differenza tra il valore atteso del loro prodotto e il prodotto dei loro valori attesi
Covariata Fattore o caratteristica del paziente per cui si vuole analizzare l’associazione con un determinato evento o outcome.
Dati destagionalizzati Dati depurati, mediante apposite tecniche statistiche, dalle fluttuazioni attribuibili alla componente stagionale (dovute a fattori meteorologici, consuetudinari, legislativi, ecc.) e, se significativi, dagli effetti di calendario. Questa trasformazione dei dati è la più idonea a cogliere l’evoluzione congiunturale di un indicatore.
Day hospital Ricovero ospedaliero in regime di degenza diurna. Tale particolare forma di erogazione dell’assistenza ospedaliera viene effettuata in divisioni, sezioni o servizi ospedalieri per fini diagnostici e/o curativi e/o riabilitativi e risponde a tutte le seguenti caratteristiche funzionali: si tratta di ricovero o ciclo di ricoveri programmato/i;è limitato a una sola parte della giornata e non ricopre quindi l’intero arco delle 24 ore dal momento del ricovero; fornisce prestazioni multiprofessionali e/o multispecialistiche, che necessitano di un tempo di esecuzione che si discosta in modo netto da quello necessario per una normale prestazione ambulatoriale.
Day surgery Prestazione assistenziale di ricovero per acuti erogata da un istituto di cura pubblico o equiparato, privato accreditato, privato non accreditato, finalizzata alla esecuzione di un intervento chirurgico o procedure invasive e alle prestazioni propedeutiche e successive ad esso; comporta la permanenza del paziente all’interno della struttura per parte della giornata.
Degenza Evento riferito alla persona ricoverata in un istituto di cura.
Deviazione standard Misura della variabilità dei dati rispetto a un valore medio, calcolabile come radice quadrata della varianza ed espresso nella stessa unità dei dati originali.
Diagnosi principale alla dimissione Costituisce la condizione morbosa principale trattata o presa in esame durante il ricovero, ovvero la condizione morbosa che nel corso del ricovero ha comportato i più importanti problemi assistenziali e quindi ha assorbito la maggiore quantità di risorse in termini diagnostici e/o di trattamento. La diagnosi principale di dimissione deve essere codificata secondo la “Classificazione internazionale delle malattie” (Cim-10), che rappresenta l’edizione italiana della International classification of diseases basata sulle raccomandazioni della X Conferenza di revisione tenutasi a Chicago nel 1989.
Diagnosis related groups – Drg La classificazione della casistica ospedaliera basata essenzialmente sulla diagnosi principale di dimissione e degli interventi chirurgici e terapie effettuati nel corso del ricovero. Queste classi costituiscono il sistema Drg che è alla base del nuovo sistema di finanziamento degli istituti di cura, basato su tariffe specifiche associate ai singoli Drg.
Differenza interquartilica È data dalla differenza, nella distribuzione ordinata della variabile di riferimento, tra il primo e il terzo quartile, dove il primo quartile è pari al valore osservato minimo tale per cui il 25 per cento delle osservazioni è minore o uguale a questo, mentre il terzo quartile è pari al valore osservato minimo tale per cui il 75 per cento dei valori osservati è minore o uguale a questo. Nell’intervallo definito da tale differenza ricade, per definizione, il 50 per cento delle osservazioni.
Effetti fissi ed effetti casuali Un modello a effetti fissi stima parametri di regressione tenendo conto di variabili che assumono lo stesso valore nel tempo. Al contrario, in un modello con effetti casuali alcune variabili rappresentano una componente randomizzata. In biostatistica, per effetti fissi e casuali si intende, rispettivamente, effetti relativi a caratteristiche della popolazione ed effetti relativi allo specifico soggetto.
Efficienza Precisione relativa di uno stimatore
Epidemiologia L'epidemiologia è lo studio della distribuzione e dei determinanti della salute e della malattia nelle popolazioni.
Errore campionario Differenza tra la stima e il corrispondente valore che si sarebbe ottenuto esaminando la totalità delle unità statistiche della popolazione. Mediamente, l'errore diminuisce in valore all'aumentare della numerosità campionaria, ed è nullo quando il campione è composto dalla totalità delle unità che compongono la popolazione. L'errore dovuto al campionamento va tenuto distinto da quello non campionario, che si manifesta anche se la rilevazione è esaustiva.
Esito (outcome) Il termine "esito" si presta ad alcune ambiguità. La definizione stretta di "esito" lo indica come l'evento clinico misurabile tramite il quale si valuta se l'obiettivo dello studio è stato raggiunto o meno. Quindi qualsiasi evento clinico di qualsiasi natura può costituire esito di uno studio clinico. Tuttavia non tutti gli esiti sono ugualmente esenti da bias né sono tutti espressione diretta della domanda clinica posta. Un esito diretto è sempre preferibile a un esito surrogato (p.e., la riduzione di pressione arteriosa è surrogato della riduzione di rischio di eventi cardiovascolari, ma l'esito diretto è il verificarsi degli eventi cardiovascolari). Esiti direttamente rilevanti per i pazienti costituiscono maggiore evidenza rispetto a esiti surrogati. Esiti espressi come eventi poco soggetti a bias costituiscono evidenza di grado superiore rispetto a esiti presumibilmente soggetti a bias o con bias difficilmente valutabile (p.e., vivo/morto rispetto a pressione alta/ pressione normale) 
Età media al parto Età media delle madri al parto, si ottiene come media delle età al parto ponderata con i tassi specifici di fecondità per età della madre al parto (calcolati per anno di evento o per generazione).
Falso negativo In una classificazione di unità statistiche in base ad un attributo del quale possono essere portatrici, si dice falso negativo l'attribuzione (erronea) al gruppo delle unità che non possiedono l'attributo di un'unità che lo possieda. Il grado in cui lo strumento di classificazione è capace di evitare falsi negativi è detto sensibilità. 
Falso positivo In una classificazione di unità statistiche in base ad un attributo del quale possono essere portatrici, si dice falso positivo l'attribuzione (erronea) di una unità non portatrice dell'attributo al gruppo di unità che lo possiede. Il grado in cui lo strumento di classificazione è capace di evitare tale tipo di errore è detto specificità.
Frequenza assoluta Il numero delle volte che una determinata modalità si verifica nel collettivo di riferimento.
Frequenza relativa Rapporto tra il numero di elementi che assumono una determinata caratteristica e il totale degli elementi dell’insieme di dati da analizzare.
Gold standard In medicina, gold standard (o standard di riferimento) è l'esame diagnostico più accurato per confermare un determinato dubbio diagnostico, al quale ogni altro esame (e soprattutto ogni altro nuovo esame) deve rapportarsi per avere validità diagnostica.
Hazard ratio (HR) o rapporto di rischio Nell'analisi di sopravvivenza, rapporto tra il tasso di rischio istantaneo di un evento in presenza o assenza di un fattore. Rappresenta l'effetto di una variabile esplicativa a proposito del pericolo o del rischio di un evento. L’interpretazione dei parametri è la stessa definita per gli Odds Ratio (OR).
Incidenza Relazione matematica utilizzata in epidemiologia: misura il numero di nuovi casi di una condizione specificata che si verificano in una popolazione su un arco di tempo specificato. 
Intervallo di confidenza (IC; CI) Intervallo di valori plausibili per un parametro. I valori estremi dell'intervallo si chiamano limiti di confidenza. L'intervallo di confidenza è costituito da due limiti intorno al risultato osservato, generalmente definiti con una probabilità del 95% (a volte del 90%). L'intervallo di confidenza al 95% – o i limiti fiduciali al 95% – include il 95% dei risultati degli studi della stessa dimensione e con lo stesso disegno sperimentale condotti su campioni indipendenti estratti dalla stessa popolazione. È una dizione analoga, ma non identica, rispetto a dire che l'entità vera dell'effetto (che non è mai conosciuta esattamente) ha il 95% di probabilità di cadere entro l'intervallo di confidenza al 95%. Se l'intervallo di confidenza al 95% di un rischio relativo (RR) o di una odds ratio (OR) contiene il valore 1, si considera che non vi sia evidenza di effetto. Il vantaggio pratico dell'intervallo di confidenza rispetto al valore di P è che tale intervallo fornisce l'ampiezza degli effetti probabili. Un effetto espresso senza i suoi intervalli di confidenza ha un livello di evidenza praticamente nullo, indipendentemente dall'eventuale valore di P associato 
Malato cronico La persona che dichiara di essere affetta da almeno una delle seguenti malattie: diabete, ipertensione arteriosa, infarto del miocardio, angina pectoris o altre malattie del cuore, bronchite cronica, enfisema, insufficienza respiratoria, asma bronchiale, malattie allergiche, tumore (incluso linfoma e leucemia), ulcera gastrica e duodenale, calcolosi del fegato o delle vie biliari, cirrosi epatica, calcolosi renale, artrosi, artrite, osteoporosi, disturbi nervosi.
Mancata risposta, non risposta Assenza di risposta a una o più domande poste nel questionario, in altre parti compilato. Il problema delle mancate risposte ad una domanda può essere affrontato da diversi punti di vista. Una soluzione può essere quella della determinazione statistica delle risposte ottenibili utilizzando informazioni provenienti da fonti esterne all'indagine (registri, censimenti, ecc.), o tramite un supplemento di indagine. Un'altra via perseguibile è quella della utilizzazione di tutte le informazioni rilevate nell'indagine per imputare il valore più probabile alle unità che non hanno espresso una risposta valida. Se si tratta di una variabile quantitativa, la forma di imputazione più elementare consiste nell'attribuire alle unità con risposta assente un valore medio di risposte valide. 
Media La media aritmetica è la più nota e usata misura di quella che si dice la tendenza centrale di una distribuzione di misure. Si ottiene sommando fra loro tutti i valori della distribuzione e dividendo il risultato per il numero dei valori stessi. Accanto alla media, altre misura di tendenza centrale sono la mediana, che è il punteggio che divide a metà le misure di una distribuzione (equivale al 50° percentile), e la moda, che è il valore più frequente. Nel caso di una distribuzione perfettamente identica a una curva normale, la media, la mediana e la moda coincidono.
Mediana Indice di posizione di una distribuzione di dati disposti in ordine crescente e corrispondente al valore che divide il campione in due parti, per cui una metà degli elementi dell’insieme di dati sarà minore o uguale alla mediana, mentre la restante sarà superiore o uguale.
Moda o valore modale Si dice moda, o valore modale, di una distribuzione di frequenza il termine, se esiste, cui corrisponde la massima frequenza nella distribuzione. Si definisce mediana di una distribuzione di frequenza il termine che, disposti i dati in ordine crescente (oppure decrescente), occupa il posto centrale. La mediana ha un’importante proprietà, cioè la somma dei valori assoluti degli scarti dalla mediana è minima.
Modello di regressione di Poisson Modello lineare generalizzato di analisi di regressione usato per modellare dati espressi come conteggi. La regressione di Poisson assume che la variabile di risposta Y abbia una distribuzione di Poisson e che il legame matematico fra il suo valore atteso e la combinazione lineare dei parametri del modello sia il logaritmo.
Modello di regressione lineare Processo di determinazione di una funzione lineare che approssimi al meglio la relazione tra una variabile dipendente Y, di tipo quantitativo, e una o più variabili esplicative X1, ..., Xk, anch’esse di tipo quantitativo.
Modello di regressione logistica L’analisi di regressione logistica è una metodologia impiegata per prevedere il valore di una variabile dipendente dicotomica (riconducibile ai valori 0 e 1) sulla base di un insieme di variabili esplicative, sia di tipo qualitativo sia quantitativo. Il modello consente di comprendere le associazioni di più variabili (indipendenti) con una variabile risposta (dipendente). L’associazione di ogni singola variabile indipendente con la variabile risposta è valutata controllando simultaneamente per gli effetti di tutte le altre variabili indipendenti inserite nel modello. L’associazione viene espressa attraverso gli odds ratio che assumono valori maggiori di uno nel caso di associazione positiva, valori minori di uno in caso di associazione negativa.
Modello di regressione multinomiale Modello di regressione logistico applicato nei casi in cui la variabile dipendente Y sia a distribuzione discreta o qualitativa ordinale. La distribuzione multinomiale descrive il caso più generale in cui ogni prova possa fornire un numero finito di risultati, ognuno con la propria probabilità.
Modello di regressione quantilica La regressione quantilica consente di stimare gli effetti delle variabili indipendenti sulla variabile dipendente in diversi punti della distribuzione di quest’ultima. L’associazione di ogni singola variabile indipendente con la variabile risposta è valutata controllando simultaneamente per gli effetti di tutte le altre variabili indipendenti inserite nel modello.
Modello multilivello Classe di modelli statistici di regressione in cui i dati sono gerarchicamente organizzati in più livelli (ad esempio, gli individui e il contesto sociale nel quale vivono possono essere visti come un sistema gerarchico di individui e gruppi, nel quale gli individui e i gruppi stanno a livelli diversi). Integrando l’analisi dei due livelli, questi modelli sono particolarmente adatti in contesti in cui i dati sono organizzati in modo complesso.
Modello multistato Modello di regressione che si adatta a situazioni in cui un individuo passa, nel corso del tempo di osservazione, da uno stato all’altro di uno specifico percorso terapeutico. Le stime ottenute permettono di calcolare l’effetto del tempo trascorso in ciascuno dei trattamenti e delle variabili che possono influenzare la transizione tra uno specifico stato ed un altro, tenendo presente tutti i passaggi già effettuati in precedenza.
Mortalità infantile Comprende i morti nel primo anno di vita, ovvero i nati vivi deceduti anteriormente al compimento del primo compleanno, compresi quelli morti prima della registrazione della nascita.
Non statisticamente significativo Convenzionalmente si definisce come non significativo (più precisamente "non statisticamente significativo") un effetto osservato quando un effetto della stessa entità o di entità maggiore può verificarsi in più di 1 studio su 20 (5%) per puro effetto del caso, assumendo che non vi siano differenze vere di esito fra i trattamenti/interventi esaminati. Non è la stessa cosa che affermare che non c'è un effetto. Il termine "non significativo" indica semplicemente che lo studio non ha fornito una evidenza convincente dell'esistenza di un effetto. Ciò può avvenire perché lo studio non era dimensionato in modo tale da rilevare un effetto che in realtà esiste, o perché davvero non esiste nessun effetto, o per effetto del caso. Una differenza non significativa non è lo stesso che indicare una tendenza ("trend") non significativa. Tendenza ed effetto non sono sinonimi. Possono comunque verificarsi casi in cui una differenza potenzialmente clinicamente rilevante non è allo stesso tempo statisticamente significativa. Tale evenienza è comunque meritevole di essere evidenziata, sempre indicando chiaramente l'assenza di significatività statistica. 
Odds L'odds di un evento viene definita come la probabilità che avvenga un evento definito, espressa come proporzione della probabilità che l'evento non avvenga. Si calcola come rapporto tra soggetti con evento e soggetti senza evento. 
Odds ratio (OR) Misura dell'associazione tra due fattori, per esempio tra un fattore di rischio e la presenza di una malattia oppure l'efficacia di un trattamento/intervento. È il rapporto tra la odds che avvenga un evento nel gruppo sperimentale e la odds che avvenga lo stesso evento nel gruppo di controllo. Si ottiene dividendo il rapporto tra eventi e non eventi nel gruppo in esame per il rapporto tra eventi e non eventi nel gruppo di controllo. Quanto più prossima al valore 1, tanto più piccola la differenza tra l'effetto del trattamento/ intervento in esame e l'effetto del trattamento/intervento di controllo. Una OR maggiore di 1 indica che l'effetto del trattamento/intervento in esame è maggiore rispetto al trattamento/intervento di controllo; se minore di 1 significa il contrario. La OR ha significato solo se espressa con il suo intervallo di confidenza al 95%; se questo comprende il valore 1 non vi è evidenza di differenze di effetto. Per pochi eventi OR e rischio relativo (RR) tendono a coincidere; per molti eventi i due indici divergono rapidamente. L'uso della OR dovrebbe essere limitato a studi retrospettivi o caso-controllo e a metanalisi. In studi prospettici è più accurato esaminare la differenza assoluta di rischio o, al più, il rischio relativo. A volte la odds ratio viene citata nei documenti di origine USA come rate ratio. Quest'ultimo termine viene evitato in ambito europeo perché facilmente fonte di confusione. 
P (valore) Probabilità che si osservi una differenza uguale o maggiore per puro effetto del caso, nell'ipotesi che non via sia una reale differenza di effetto tra gli interventi confrontati. Convenzionalmente se tale probabilità è <5% (P<0.05) si considera il risultato come "statisticamente significativo".
Posto letto ospedaliero Il letto nell’ambito di una struttura ospedaliera, dotata di personale medico e attrezzata per l’accoglienza e l’assistenza a tempo pieno di un insieme di degenti. Il posto letto è situato in una corsia o area dell’ospedale in cui l’assistenza medica ai degenti è garantita e continua. Il numero di posti letto fornisce una misura della capacità ricettiva dell’istituto di cura.
Potenza Si definisce "potenza" la probabilità di uno studio di poter osservare una differenza di esito fra due o più trattamenti/interventi della entità predefinita nel protocollo di studio con il livello di confidenza predefinito nello stesso protocollo, nel caso tale differenza esista. A parità di tutti gli altri elementi, la potenza aumenta con la dimensione del campione e con la precisione della misura dell'esito. 
Precisione Se riferito allo stimatore (o alla stima) è espressione del grado di dispersione di una classe di misure (stime) ottenibili da ipotetiche replicazioni, in identiche condizioni, della procedura di campionamento, intorno al loro valore atteso. La misura della precisione è data dal reciproco dell'errore medio di stima. Maggiore l'errore medio, minore la precisione e viceversa. Se riferito a singole misure, il termine esprime l'entità dell'approssimazione della misurazione stessa. Si dice precisa una misura, il cui grado di approssimazione non supera un prestabilito limite di tolleranza. 
Prevalenza Proporzione di soggetti che presenta uno specifico fenomeno o patologia in una popolazione definita a un momento temporale definito. Rapporto fra il numero di eventi sanitari rilevati in una popolazione in un definito momento e il numero degli individui della popolazione osservati nello stesso periodo. Vi è una distinzione tra prevalenza puntuale (detta anche point prevalence) e prevalenza periodale (period prevalence): nella prima, l'osservazione del numero di individui malati è riferita ad un definito momento. Nella seconda, si riferisce ad un breve arco temporale. 
Probabilità Indica la probabilità di sperimentare un evento entro un determinato intervallo di tempo di riferimento ed è calcolata come rapporto tra eventi avvenuti nel periodo e persone presenti a inizio periodo (e a rischio di sperimentare l’evento in questione).
Probabilità di morte all’età x Il rischio che una persona ha di morire tra il compimento dello x-esimo compleanno e il compimento del successivo.
Proxy Indicatore statistico che descrive il comportamento di un determinato fenomeno non osservabile direttamente.
Qualità del dato statistico Rispondenza degli stessi alla realtà fattuale che con essi si intende quantificare. La qualità del "dato-prodotto" è la sua capacità di soddisfare le proprietà garantite dal "produttore". Queste proprietà riguardano due ambiti distinti, quello dell'attendibilità che concerne i livelli di accuratezza delle stime e quello dell'adeguatezza che concerne particolari aspetti del piano di una rilevazione e più precisamente quelli connessi, da un lato, alla definizione degli obiettivi e, dall'altro, alla diffusione dei risultati. Si parla in quest'ultimo caso di tempestività dell'informazione, di trasparenza del dato, ecc.. 
Quartili, quintili, percentili quando la distribuzione si suddivide in 4 parti uguali (q=4) si parla di quartili (ognuno ha il 25% della numerosità del totale), in 5 parti uguali (q=5) si parla di quintili, in 10 parti uguali (q=10) si parla di decili, in 100p parti uguali (q=100) si parla di percentili.
Quoziente di mortalità Il rapporto tra il numero dei decessi nell’anno e l’ammontare medio della popolazione residente (per mille).
Quoziente di mortalità infantile Il rapporto tra il numero di decessi avvenuti nel primo anno di vita e il numero di nati vivi (per mille).
Quoziente di mortalità perinatale La somma dei nati morti e dei decessi avvenuti nella prima settimana di vita rapportata al numero complessivo di nati (per mille).
Quoziente di natalità Il rapporto tra il numero di nati vivi dell’anno e l’ammontare medio della popolazione residente (per mille).
Quoziente di natimortalità Il rapporto tra il numero di nati morti e il numero complessivo di nati (per mille).
Quoziente di nuzialità Il rapporto tra il numero di matrimoni celebrati nell’anno e l’ammontare medio della popolazione residente (per mille).
Quoziente specifico di fecondità Il rapporto fra nati vivi da donne di età feconda (15-49 anni) e l’ammontare medio annuo della popolazione femminile della corrispondente età.
Rapporto di tasso di rischio (HR; hazard ratio) Grossolanamente equivalente al rischio relativo (RR) è una misura utile quando il tasso di rischio (hazard rate) non è costante nel tempo. Utilizzando informazioni raccolte su un arco di tempo sufficientemente lungo, è una misura sufficientemente accurata del rischio corso nel contesto di analisi di sopravvivenza. Diversamente dall'accezione comune lo HR può essere usato per eventi negativi e positivi. Il significato numerico non è diverso dalla odds ratio (in effetti i due termini possono essere derivati uno dall'altro). 
Rapporto di verosimiglianza (likelihood ratio) Il rapporto tra la probabilità che un soggetto con la condizione in esame presenti un risultato specifico a un test e la probabilità che un soggetto senza la condizione in esame presenti lo stesso risultato allo stesso test. Da questa definizione ristretta e usata in ambito diagnostico il rapporto di verosimiglianza è stato esteso a tutta una serie di altre tecniche di analisi statistica. Al di fuori degli studi su tecniche diagnostiche indica quanto bene si adattino i dati osservati al modello interpretativo utilizzato ("goodness of fit"). 
Regime di ricovero La particolare forma di erogazione dell’assistenza ospedaliera. Può assumere le modalità di ricovero ordinario e di ricovero in day hospital.
Registro Raccolta sistematica di un insieme minimo concordato di informazioni relative a una patologia, una popolazione, una condizione clinica, un intervento medico specifico. Teoricamente dovrebbe coprire tutti i casi che si verificano nella popolazione compresa nell'ambito degli obiettivi del registro
Ricovero ordinario L’ammissione in ospedale con pernottamento (il paziente vi trascorre almeno una notte).
Rischio assoluto (AR; absolute risk) La probabilità che in un soggetto si verifichi l'esito specificato entro il periodo di tempo specificato. Può variare tra 0 e 1 (espresso come probabilità) o tra 0% e 100% (espresso come percentuale). Diversamente dall'uso comune, il termine "rischio" si può riferire a eventi sfavorevoli (p.es. il verificarsi di un ictus) o a eventi favorevoli (p.es. guarigione completa).
Rischio relativo (RR) Quante volte è più (RR>1) o meno (RR<1) probabile che si verifichi un evento in un gruppo a confronto con un altro gruppo. È il rapporto del rischio assoluto (AR) per ciascun gruppo. Sovrapponibile alla odds ratio (OR) quando vi sono pochi eventi. Nei documenti di origine USA a volte la odds ratio viene indicata col termine relative risk. Poiché le due misure non sono sovrapponibili se non in presenza di pochi eventi, e preferibile attenersi alla definizione rigorosa di RR come AR(test)/AR(controlli). 
Riservatezza Condizione di ciò che è affidato alla discrezione e al rispetto del segreto. La condizione riguarda normalmente il dato elementare. E' riservato il dato per il quale esiste un prestabilito limite di diffusione e notorietà. Ciò è in conflitto con la necessità di diffusione e pubblicità del dato, che può tuttavia essere realizzata previa adeguata manipolazione (arrotondamento, iniezioni di errori, aggregazione di più dati, ecc.) del dato stesso, in modo che da esso non sia possibile risalire all'unità statistica cui è associato. 
Scheda di dimissione ospedaliera – Sdo La rappresentazione sintetica della cartella clinica finalizzata a consentire una raccolta corrente, economica e di qualità controllabile di alcune fra le informazioni contenute nella cartella stessa. La Sdo contiene informazioni relative a dati anagrafici, nonché informazioni rilevate al momento dell’accettazione del paziente nell’istituto di cura, nel corso della degenza e al momento della dimissione.
Segreto statistico Esclusione della possibilità di individuare l'unità statistica alla quale si riferisce un dato reso pubblicamente disponibile. In qualche caso l’informazione è ammessa per categorie privilegiate di utenti. Talvolta si vede usato il termine confidenzialità. Per rispetto della privacy, l'Italia aderisce alla convenzione europea che esclude per le statistiche ufficiali domande intorno a razza, religione, opinioni politiche, ecc.
Sensibilità La probabilità di avere un risultato positivo a un test nel caso sia presente la patologia in esame 
Sezione di censimento Unità minima di rilevazione del comune sulla cui base è organizzata la rilevazione censuaria. È costituita da un solo corpo delimitato da una linea spezzata chiusa. A partire dalle sezioni di censimento sono ricostruibili, per somma, le entità geografiche ed amministrative di livello superiore (località abitate, aree sub-comunali, collegi elettorali e altre). Ciascuna sezione di censimento deve essere completamente contenuta all’interno di una ed una sola località. Il territorio comunale deve essere esaustivamente suddiviso in sezioni di censimento; la somma di tutte le sezioni di censimento ricostruisce l’intero territorio nazionale.
Significatività statistica Probabilità che il valore osservato di un indicatore sia o meno dovuto al caso. Si dice che un certo indice è statisticamente significativo quando la probabilità di ottenere casualmente un valore come quello rilevato è inferiore a una soglia stabilita (5%, 1%, 0,1%). La significatività di un indice si calcola con formule che tengono conto contemporaneamente dell'entità del valore osservato e della numerosità del campione su cui è stato rilevato.
Sopravviventi (lx) Una delle funzioni biometriche calcolate nell'ambito delle tavole di mortalità; nello specifico, sono coloro che, provenienti dalla generazione iniziale fittizia di 1.000 nati, sopravvivono ai vari compleanni.
Sopravvivenza osservata, attesa, relativa Stima della proporzione di pazienti ancora viventi al termine di un certo periodo di tempo, utilizzando i dati raccolti su base di popolazione dai registri. La sopravvivenza relativa è il rapporto fra la sopravvivenza della popolazione dovuta a tutte le cause di morte (osservata) e la sopravvivenza di un gruppo di pazienti aventi caratteristiche di salute comparabili alla popolazione generale (attesa).
Specificità La probabilità di avere un risultato negativo a un test nel caso non sia presente la patologia in esame. 
Speranza di vita Indicatore statistico che esprime il numero medio di anni che un individuo di una certa popolazione, giunto a una certa età in anni compiuti, si aspetta ancora di vivere. 
Standardizzazione di un tasso Procedimento che porta ad annullare l’effetto di eventuali differenze di età tra due popolazioni, evidenziando le reali differenze nella frequenza di malattia. I metodi sono due: diretto o indiretto. Il metodo di standardizzazione diretta risponde alla seguente domanda: ‘Quale tasso osserverei nella popolazione A se la sua popolazione fosse distribuita per classe di età come la popolazione B?’ Il metodo di standardizzazione indiretta risponde alla seguente domanda: ‘Quanti casi di malattia osserverei nella popolazione A se i tasso specifici per età fossero gli stessi osservati nella popolazione B?’
Stima Particolare valore ottenuto dall'applicazione di uno stimatore in determinate circostanze. Il termine è comunemente usato, in senso più ampio, per indicare anche l'insieme delle regole attraverso le quali è stato ottenuto quel particolare valore, ovverosia lo stimatore stesso.
Stimatore Si denomina stimatore una regola o un metodo per stimare una costante della popolazione. E' di solito espresso come una funzione dei valori campionari ed è quindi una variabile statistica la cui distribuzione è di grande importanza nell'accertamento dell'attendibilità della stima che dallo stimatore deriva 
Studio caso-controllo Disegno sperimentale che esamina un gruppo di soggetti che hanno avuto un evento (di solito negativo) e un gruppo di soggetti che non hanno avuto lo stesso evento, in cerca della maniera nella quale l'esposizione ad agenti sospetti (di solito nocivi) differiva tra i due gruppi. Questo tipo di disegno sperimentale è principalmente utile per cercare di accertare la causa di eventi rari, come p.es., forme rare di tumore. Gli studi caso controllo possono generare solo odds ratio (OR), non rischi relativi (RR). Gli studi caso controllo generano evidenze più deboli degli studi coorte ma più affidabili delle serie di casi. 
Studio controllato (CCT; controlled clinical trial) Uno studio nel quale i partecipanti sono assegnati a due o più gruppi di trattamento. Normalmente limitato a quegli studi in cui il meccanismo di allocazione è diverso dalla randomizzazione. Nel caso di studi controllati nei quali l'allocazione è ottenuta per randomizzazione, si preferisce il termine "studio clinico randomizzato e controllato" o RCT ("randomised controlled trial"). Gli studi controllati e non randomizzati sono maggiormente soggetti a rischio di bias degli RCT. 
Studio coorte Un disegno non sperimentale di studio che segue un gruppo di soggetti (una coorte) ed esamina come gli eventi differiscano tra soggetti del gruppo. Uno studio che esamina una coorte che differisce in relazione all'esposizione a sospetti fattori di rischio (p.es., fumo di sigaretta) è utile per cercare di determinare se è probabile che l'esposizione causi specifici eventi (p.es. l'ictus). Gli studi coorte prospettici (che seguono i partecipanti a partire da un certo momento in avanti raccogliendo i dati a mano a mano che si presentano) sono più affidabili rispetto agli studi retrospettivi (che raccolgono dati già registrati in passato). 
Studio osservazionale Studi nei quali si registrano i dati di interesse in una popolazione o in un campione seguito senza operare interventi sulla normale pratica clinica. Anche con questa definizione, tuttavia, uno studio osservazione prevede un adeguato protocollo di ricerca. Gli studi osservazionali non possono fornire evidenze di effetto. Sono invece appropriati per raccogliere evidenze in merito a prognosi, eziologia, incidenza e prevalenza. Fanno parte degli studi osservazionali le serie di casi, gli studi casocontrollo, gli studi coorte prospettici e retrospettivi. 
Studio randomizzato Studio nel quale la tecnica di allocazione dei partecipanti alle diverse forme di trattamento è determinata esclusivamente dal caso. Sono tecniche adeguate di randomizzazione il lancio della monetina (se la moneta è "onesta"), le tavole dei numeri casuali, le sequenze generate da computer con programmi di randomizzazione certificati. 
Studio randomizzato e controllato (RCT; randomised controlled trial) Studio nel quale i partecipanti sono assegnati per randomizzazione a uno o più gruppi, almeno uno dei quali (gruppo sperimentale) riceve un trattamento/intervento in valutazione e l'altro (gruppo di controllo o di riferimento) riceve il un trattamento alternativo o placebo o lo "standard of care". Questo disegno sperimentale permette una stima sufficientemente accurata dell'effetto relativo dei vari interventi. L'evidenza fornita dagli studi randomizzati e controllati è di livello elevato ma deve essere considerata probante solo quando più studi indipendenti generano risultati coerenti. 
Studio sperimentale Uno studio nel quale il ricercatore valuta gli effetti dell'alterazione voluta di uno o più fattori apportata in condizioni controllate. Uno di questi fattori può essere il trattamento/ intervento. 
Studio trasversale (cross-sectional) Un disegno di studio che implica l'osservazione di una popolazione in merito a una esposizione o condizione o entrambe, per uno specifico arco temporale o uno specifico momento nel tempo. Può essere utilizzato per determinare la prevalenza di una condizione nella popolazione. Non può essere utilizzato per stimare la causalità di un intervento o trattamento. 
Tasso Rapporto tra il numero di eventi nel periodo e il numero di anni-persona (individui*anni vissuti nell’arco del periodo), solitamente indicato per 1000 residenti.
Tasso di fecondità totale Esprime il numero medio di figli per donna. In un anno di calendario (anno di evento), è dato dalla somma dei tassi specifici di fecondità calcolati rapportando, per ogni età feconda, il numero di nati vivi all’ammontare medio annuo della popolazione femminile di quell'età. Riferito alla generazione, misura il numero medio di figli messi al mondo al termine della vita feconda da 1.000 donne appartenenti ad una certa generazione in ipotesi di mortalità nulla.
Tavola di mortalità Strumento per l'analisi statistica della mortalità. Descrive per singole generazioni (chiuse e fittizie) l'andamento del numero di sopravvissuti dal momento della nascita fino alla morte dell'ultimo individuo della coorte.
Tempestività Aspetto della qualità dei dati relativo al lasso di tempo che intercorre tra la loro rilevazione e la loro disponibilità. Questi possono essere considerati tempestivi se, in rapporto a determinati obiettivi, sono diffusi in tempi congrui al loro raggiungimento. 
Tendenza (trend) Termine rigorosamente limitato all'analisi di regressioni e di frequenze marginali in tabelle di contingenza complesse. Assolutamente da evitare – e privo di valore semantico – se riferito a differenze di esito interessanti ma non statisticamente significative. 
Trasparenza Con riferimento ai risultati di un'indagine statistica, o più in particolare ai passaggi operativi di una singola procedura, il termine sottintende la disponibilità delle informazioni necessarie per esprimere un giudizio sulla qualità dei dati. E' quindi espressione di un particolare atteggiamento del soggetto che, avendo effettuato l'indagine, consente ad altri di valutare in modo approfondito il proprio operato. 
Unità campionaria Una delle unità che compongono il campione. Conviene distinguere questa denominazione da quella di "unità di campionamento", con la quale si intende una delle unità che compongono un aggregato che deve essere sottoposto a campionamento, che sono individuali e indivisibili nel momento in cui si effettua la selezione campionaria. Le unità da estrarre possono essere definite su basi naturali (persone, famiglie di fatto, animali, ecc.), giuridiche (famiglie anagrafiche), amministrative (comuni, ospedali) o su qualsiasi altra base (aree in cui è suddiviso un territorio da sottoporre a indagine). Nel campionamento su più stadi, le unità di campionamento sono diverse ad ogni stadio: sono più grandi al livello superiore e gradatamente più piccole a mano a mano che si scende di livello.
Unità statistica Unità elementare della popolazione statistica. Può trattarsi di una persona fisica (il censito, il dimesso da un istituto di cura), di una persona giuridica (l'impresa), di un'istituzione (la scuola), di un evento (un matrimonio, una nevicata), ecc. 
Validità Si usa per indicare la rigorosità o la consistenza di uno studio. Si considera "internamente valido" uno studio se il modo in cui è progettato ed eseguito porta a risultati non biased e fornisce una stima accurata dell'effetto che si intende misurare. Si considera "esternamente valido" uno studio i cui risultati sono applicabili ai normali pazienti trattati nella pratica clinica quotidiana. L'uso del termine "validità" implica un giudizio soggettivo da parte degli esaminatori degli studi e non è quantificabile. 
Valore atteso Risultato dell'applicazione dell'operazione matematica "media" ad una statistica dipendente da dati campionari e avente una distribuzione statistica. Il "valore atteso" non è necessariamente il più frequente; può addirittura non esistere: si pensi ad una variabile che può assumere solo i valori 0 (con probabilità 1-p) o 1 (con probabilità p, p<1), il cui valore atteso (p) è compreso fra questi due valori. Il valore atteso di un dato elementare è la media dei valori osservabili sotto certe condizioni presso l'unità statistica: in assenza di errore sistematico coinciderà con il valore vero dell'unità.
Valore predittivo negativo La probabilità di non avere la patologia considerata in presenza di un risultato negativo del test in esame (da non confondere con specificità). 
Valore predittivo positivo La probabilità di avere la patologia considerata in presenza di un risultato positivo del test in esame (da non confondere con sensibilità). 
Varianza misura di variabilità che si ottiene sommando i quadrati degli scarti dei valori osservati dalla loro media e dividendo il valore della somma per il numero di osservazioni.
Varianza campionaria La varianza campionaria è un indicatore di variabilità statistica calcolabile in un campione anziché in una popolazione. Un campione è composto da un minore numero di elementi rispetto alla popolazione. Quindi, la dispersione intorno al valore medio è inferiore. La varianza del campione risulterebbe inferiore rispetto a quella della popolazione da cui è stato estratto. Per attenuare questa distorsione si utilizza la formula della varianza campionaria. Nella formula della varianza campionaria il denominatore N viene sostituito con N-1. Il divisore è inferiore.
Varianza di stima Varianza di uno stimatore attorno al proprio valor medio. E' data dalla somma delle varianze dovute alle singole componenti di variabilità, quella campionaria (v. varianza campionaria) e quelle extracampionarie e delle covarianze tra le componenti. 
Vita media Il numero medio di anni che sono da vivere per un neonato.
torna all'inizio del contenuto