Gli studi osservazionali: vantaggi e limiti
Graziano Onder
Centro di Medicina dell’Invecchiamento (CEMI), Università Cattolica del Sacro Cuore, Roma
Randomized clinical trials are considered the gold standard for establishing treatment efficacy and generate evidence-based medicine. Nonetheless, because of the stringent exclusion criteria used in selecting study populations, concerns are raised about the limited generalizability of evidence they provide. Indeed, randomized clinical trials assess treatment efficacy for an “average” patient, quite often far from older adults characterized by chronic comorbidities of different severity, or by functional and/or cognitive impairment. Observational studies have been proposed as alternative means of testing intervention effectiveness in older populations with multifaceted problems. Unlike randomized clinical trials, they assess outcomes in regular clinical practice, thereby reflecting real adherence to treatment/intervention. The availability of huge, high quality databases offers the potential to bring research closer to practice and audit. Databases provide fertile grounds for observational studies, and can generate hypotheses and provide ready access to trialists as well, setting new possibilities for epidemiological research. They must include complete data on all consecutive patients, use standard definitions of conditions and outcomes, and include all clinical characteristics likely to affect outcomes. In addition, their potential for research and audit is greatly enhanced by linking to other databases, like the census ones, which allow evaluation of geographical and contextual information.
Key words. Clinical trials; Databases; Effectiveness; Observational studies.


Sin dalla loro introduzione, i trial clinici randomizzati sono divenuti il gold standard per stabilire l’efficacia dei trattamenti1,2 e sono considerati attualmente la pietra miliare su cui poggia la medicina basata sull’evidenza3,4. Recentemente, tuttavia, è stato messo in dubbio – come riportato in dettaglio in altro capitolo di questo stesso Supplemento – il ruolo di tali studi nel fornire evidenze cliniche generalizzabili alla popolazione anziana5-8.
Infatti, mentre è evidente l’importanza degli interventi definiti dai trial per specifici gruppi di pazienti, l’eterogeneità della popolazione anziana può rappresentare un limite all’applicazione su larga scala di tali interventi. I trial randomizzati non sono in realtà costruiti per rispondere a tale eterogeneità: in particolare la randomizzazione (se valida) permette la comparazione degli interventi, senza tener conto delle caratteristiche individuali dei pazienti. E questa rappresenta una delle maggiori limitazioni dei trial: l’essere la migliore modalità per testare strategie di intervento, ma il peggior modo per valutare chi trarrà reali benefici dall’intervento stesso. Tale contraddizione lascia un gap nell’evidenza disponibile per i clinici. Nel cercare la validità interna, i trial clinici esplorano e dimostrano l’efficacia di un trattamento in un paziente “medio” eleggibile e randomizzabile. Tali risultati non sono necessariamente generalizzabili a sottogruppi di pazienti caratterizzati da elementi variabili quali diversa severità dei sintomi, comorbosità che hanno costituito criteri di esclusione predefiniti, e altre sfumature cliniche. Pertanto, la validità esterna di tali dati non è ottimale.
I trial clinici randomizzati nella loro espressione più compiuta, quantificano e dimostrano relazioni già fortemente sospette prima del loro inizio. L’attacco frontale nei confronti degli errori sistematici e il controllo dell’errore stesso, rappresentano le preoccupazioni principali in tali studi, mentre l’identificazione di nuove informazioni ha scarso valore. Malgrado la crescente consapevolezza circa i loro limiti e potenziali problemi, negli ultimi anni si sta assistendo alla rapida proliferazione e promozione di linee guida basate sui risultati di trial clinici randomizzati orientati a pazienti “ideali”, mentre nella pratica medica ci si confronta con pazienti ben più “reali”. Come analizzato in dettaglio in un precedente capitolo di questo Supplemento, gli anziani, specialmente di sesso femminile, sono sorprendentemente sottorappresentati nei trial clinici, e pazienti con diverse comorbosità sono generalmente esclusi. Per esempio, in uno studio che valutava la percentuale di donne e di soggetti ultra75enni rappresentata in 593 studi clinici randomizzati in materia di sindromi coronariche acute 9, pazienti ultra75enni comparivano in soli 268 trial. Complessivamente, le donne rappresentavano meno del 24% dei pazienti considerati e, di queste, le ultra75enni erano solo il 6.7%. Così, la mancanza di dati appropriati ha portato a generare criteri per valutare la prescrizione farmacologica e linee guida basati sul consenso limitato e variabile di esperti e non sul vero outcome10.
Mentre Fahey11 afferma che l’insuccesso dei trial clinici nel reclutare un campione rappresentativo di anziani con importanti comorbosità conduce ad una sottostima sia del beneficio relativo che assoluto, la realtà rimane che non conosciamo l’effettivo beneficio legato alla terapia farmacologica in pazienti anziani non inclusi in questi studi. Anche quando il target del trial è l’anziano, il campione arruolato resta generalmente altamente selezionato. Per esempio nello SHEP (Systolic Hypertension in the Elderly Program), che dimostra il beneficio derivante dal trattamento dell’ipertensione sistolica isolata in pazienti anziani, sono inclusi solo 2% di pazienti affetti da demenza, 10% di depressi e 7% con disabilità fisica: condizioni che in un campione di popolazione generale non selezionata si riscontrerebbero rispettivamente nel 6%, 23% e 19% 12.
GLI STUDI OSSERVAZIONALI ED I DATABASE CLINICI
Riconoscendo i limiti dei trial clinici randomizzati, una questione rimane aperta: come poter migliorare la qualità dell’evidenza per poterla applicare nel miglior modo al singolo paziente? È sempre più riconosciuta la necessità di un cambio di atteggiamento nella ricerca e nella pratica clinica. La necessità di trovare metodi che abbiano lo stesso rigore è ben nota da lungo tempo ai geriatri. Con l’obiettivo di evitare il rischio di una medicina evidence-biased, vari ricercatori stanno promuovendo lo sviluppo di database clinici di alta qualità (HQCD), come punto di partenza per la realizzazione di studi osservazionali, che potrebbero essere in grado di fornire informazioni più aderenti alla realtà clinica13.
In particolare, la pratica clinica può esser supportata tramite lo svolgimento di questo tipo di studi in due modi: primariamente, in virtù delle loro dimensioni, possibilità di generalizzazione, gli HQCD forniscono aggiornamenti, accurate stime circa la probabilità di riscontrare determinati outcome in altrettanti contesti clinici. Gli analisti necessitano di tali informazioni per incorporarle nei loro modelli, elaborati al fine di dare indicazioni sulla gestione clinica del paziente, e per implementare le basi scientifiche delle politiche sanitarie. Progressi nella partecipazione del paziente al processo decisionale dipendono dalla disponibilità di informazioni e risultati da tali database. In secondo luogo, a differenza di molti trial prospettici, un largo numero di pazienti viene incluso in tali database, permettendo analisi per sottogruppi e consentendo ai clinici di raccogliere informazioni su specifiche categorie di pazienti e non su pazienti “tipici” ma molto spesso del tutto teorici 14.
I dati forniti dagli HQCD possono anche aiutare nella gestione dei servizi sanitari e nello sviluppo di linee di indirizzo di politica sanitaria. Possono essere utilizzati per stabilire il corretto uso delle risorse – per esempio la migliore collocazione del servizio dialisi, in modo da ridurre le necessità di spostamento dei pazienti – o la distribuzione ideale dei reparti di cure intensive, per diminuire il numero di trasferimenti interospedalieri15.
Inoltre, l’alto tasso di partecipazione dei clinici da una vasta gamma di ospedali per la costituzione degli HQCD (comparata con la partecipazione a studi tradizionali di ricerca ad hoc), aumenta la possibilità di generalizzare i risultati16 e aumenta l’appropriatezza della ricerca potendo incoraggiare così la comprensione dei risultati applicati alla pratica clinica (obiettivo della medicina basata sull’evidenza). Ricerche orientate all’analisi di database sono anche relativamente economiche, ed il loro costo si distribuisce su diversi studi ed è condiviso con altre applicazioni (pratica clinica; gestione; revisione).
Anche se le considerazioni ricavate dai dati derivati da database sono per definizione confronti non randomizzati (o osservazionali), questi possono fornire due strumenti per promuovere trial clinici randomizzati. Prima di tutto, aumentando il livello di incertezza circa l’efficacia di interventi stabiliti, possono aumentare la possibilità di partecipazione dei centri clinici ai trial clinici randomizzati; poi, rappresentando un’infrastruttura permanente per disegnare grandi trial multicentrici. Infine, l’adozione degli HQCD allarga la prospettiva e la partecipazione a linee di ricerca al di là di una ristretta nicchia di centri altamente specialistici, consentendo la partecipazione ai clinici che operano in strutture di secondo livello; il che, ancora una volta, aumenta la possibilità di generalizzazione dei risultati.
Infine, la costituzione di HQDC porta vantaggi anche a livello locale, dove clinici e manager possono ottenere informazioni accurate e standardizzate sulle loro attività e sui risultati17, costituendo una sorta di audit permanente di area. Alla luce della mancanza di gold standard universalmente accettati, in molte aree dell’assistenza sanitaria la revisione si deve basare su confronti significativi con altri centri (benchmarking). In una prospettiva nazionale, tali database possono favorire il confronto tra ospedali, amministrazioni e distretti. Con dati necessari all’aggiustamento per una serie sufficientemente ampia, possono essere elaborati confronti risk-adjusted. Se si corrono rischi quando tali raffronti sono basati su dati amministrativi routinari, quando ci si basa sugli HQCD il potere del confronto è invece considerevole18. Gli HQCD consentono anche di valutare rari disordini e trattamenti, cosa che i diversi centri, presi singolarmente, non potrebbero mai fare per inadeguate dimensioni campionarie. Gli HQCD permettono inoltre di verificare la equa allocazione delle procedure diagnostiche e terapeutiche in una prospettiva di reale pratica clinica. Infatti, quando i dati sono in collegamento con altri database di popolazione, la valutazione dell’accesso ai servizi di cura in relazione a fattori demografici e sociali quali età, sesso, profilo socio-economico, luogo di residenza, può esser agevolmente effettuata.
Molti ricercatori hanno recentemente enfatizzato l’importanza degli studi osservazionali basati su HQCD, al fine di esplorare la complessità e le diverse sfaccettature della comorbosità nell’anziano. A differenza dei trial clinici randomizzati, per esempio, gli studi osservazionali riguardanti i risultati dell’intervento medico nella pratica clinica, non essendovi randomizzazione al trattamento, coinvolgono un campione di popolazione non selezionata e i risultati riflettono i veri benefici ma anche le vere complicanze del trattamento/intervento. Inoltre, negli studi osservazionali possono essere valutati temi come il confronto di un farmaco con la successiva terapia disponibile o l’utilizzo di un farmaco nel mondo reale ( effectiveness) confrontato con il suo uso nei trial clinici (efficacy); questioni e differenze, queste, di importanza cruciale nella cura dell’anziano.
Il processo decisionale presuppone evidenze di efficacia provenienti dai trial clinici ed evidenze di applicabilità dagli studi osservazionali. Ciò è importante non solo per identificare il profilo di rischio di base e il beneficio assoluto per il singolo paziente, ma anche per caratterizzare la frequenza di effetti avversi a lungo termine, le conseguenze dell’intervento decisionale/terapeutico a differenti stadi clinici della malattia, e la possibilità concreta di migliorare gli interventi di efficacia nella pratica clinica. Questo approccio contrasta con la posizione dogmatica legata al considerare i trial clinici come unica fonte di evidenza clinica.
Ad oggi, l’implementazione di HQCD ha fornito la possibilità di condurre studi osservazionali di elevato profilo, per quanto già detto orientando la ricerca verso la pratica clinica. Utilizzando una metodologia appropriata, i ricercatori che svolgono studi osservazionali sono portati a considerare l’errore nella misurazione come sfida e sono costantemente alla ricerca di strategie per migliorarne la validità interna. Come sottolineato da Black14: «... a differenza di molti trial prospettici, un cospicuo numero di pazienti sono inclusi in database clinici, che permettono peraltro analisi per sottogruppi, consentendo a loro volta ai ricercatori di ricavare informazioni su particolari categorie di pazienti e non su pazienti “teorici”. Tali database includono dati di singoli pazienti su casi consecutivi e non selezionati, usano definizioni standardizzate per identificare patologie e outcome, i dati inclusi sono completi e comprendono tutte le caratteristiche cliniche fondamentali (ad es. severità dei sintomi; malattia e comorbosità; altri aspetti clinici di rilievo) tali da poter influenzare l’outcome».
SAGE E OsMed: DUE ESEMPI DI RILIEVO
Sin dal 1991, negli Stati Uniti, le residenze sanitarie assistenziali (RSA) sono tenute ad utilizzare uno strumento di valutazione multidimensionale, l’InterRAI Long Term Care Facility (InterRAI-LCTF), che offre un ampio spettro di informazioni quali comorbostà, sindromi, problemi socio-economici, deficit cognitivi e funzionali. Come parte del primo Health Care Financing Administration, Multistate, Case-Mix and Quality Demonstration Project iniziato nel 1992, 1492 RSA di 5 Stati – Kansas, Maine, Mississippi, New York e South Dakota – hanno implementato la valutazione tramite InterRAI-LCTF. In aggiunta a tali informazioni, sono stati raccolti dati circa i farmaci utilizzati da ciascun paziente al momento della valutazione.
Dopo 5 anni, era stato creato un database di 750 000 pazienti e 4 milioni di valutazioni. Basandosi su tali premesse, un gruppo di ricercatori fondò il gruppo di studio SAGE (Systematic Assessment of Geriatric drug use via Epidemiology). Il database contenente dati sulla valutazione e informazioni sui farmaci è stato poi integrato con altri database disponibili. Informazioni sulle prestazioni erogate sono state ottenute confrontando singolarmente individui con una valutazione InterRAI con i file dei Centers for Medicare and Medicaid. Da ciò sono derivate informazioni quali residenza, condizioni di assistenza in organizzazioni per il mantenimento della salute (HMO), stato in vita, e una serie di dati ricavati da ciascuna ospedalizzazione (diagnosi, procedure, rimborsi), dalle ammissioni in hospice o in assistenza domiciliare integrata, dalle visite ambulatoriali o in Pronto Soccorso.
Il database SAGE ha rappresentato una risorsa precedentemente non disponibile per esaminare questioni cruciali inerenti al trattamento dei pazienti anziani, complessi e affetti da malattie croniche. In considerazione del fatto che tali soggetti non vengono generalmente inclusi nei trial clinici, il medico e il resto del personale sanitario è solito prendere qualsiasi decisione alla luce della propria miglior valutazione e giudizio clinico.
Il database SAGE ha permesso di indagare un’ampia gamma di quesiti clinici riguardanti sindromi come cadute e dolore, comuni patologie quali ipertensione arteriosa, demenza, scompenso cardiaco cronico e diabete. Un documento importante dal database SAGE ha evidenziato come la gestione del dolore neoplastico negli anziani sia inadeguata, con il 28% degli individui che presentano dolore quotidiano senza ricevere alcuna terapia analgesica. Inoltre, dato più rilevante, sono stati identificati fattori predittivi di inadeguata gestione del dolore inclusa età, bassa estrazione sociale e bassa performance cognitiva 19. Questi risultati hanno rappresentato il filo guida nello sviluppo di programmi mirati al miglioramento dell’appropriatezza prescrittiva (ad es. analgesici) e per ridurre l’uso di farmaci inappropriati.
Alcune delle scoperte derivanti dal database SAGE sono state approfondite e utilizzate per generare ipotesi. Per esempio, in una coorte di pazienti con scompenso cardiaco cronico, l’analisi aveva documentato per la prima volta che quelli che ricevevano inibitori dell’enzima di conversione dell’angiotensina preservavano meglio la performance fisica, rispetto a coloro che non ne ricevevano20. Tale risultato è stato poi confermato da diversi altri autori e attribuito ad un miglioramento della performance muscolare. In maniera simile, tramite l’uso del database, sono stati evidenziati gli eventi avversi legati all’uso di antipsicotici, mostrando che tanto l’uso di antipsicotici tipici che atipici è associato ad un aumentato rischio di tromboembolismo venoso, eventi cerebrovascolari, fratture di femore e, in ultimo, ad un’aumentata mortalità 21-25.
In Italia, l’Osservatorio sull’Impiego dei Medicinali (OsMed) assicura il monitoraggio della spesa farmaceutica convenzionata a livello nazionale e regionale tramite l’elaborazione di milioni di ricette prescritte dai medici di medicina generale e inviate da circa 18 000 farmacie del territorio. È lo strumento necessario e insostituibile per la determinazione dello sfondamento del tetto di spesa programmato, e per l’adozione delle misure di ripiano. I rapporti OsMed sono pubblicati annualmente, con la finalità di descrivere l’uso dei farmaci a livello nazionale e le differenze nel tempo, e di identificare le differenze inter-regionali nel consumo di medicinali 26.
Nel solo 2011, oltre un miliardo di prescrizioni dispensate dal Sistema Sanitario Nazionale sono state classificate in base al codice Anatomical Therapeutic Chemical (ATC) e all’ID package unique identifier code e tracciate a livello individuale all’interno del database OsMed. Questi dati sono stati ad oggi utilizzati per ricerche – recentemente inviate per la pubblicazione – limitate alla valutazione della qualità della prescrizione farmacologica in Italia.
Ad oggi l’utilizzo della banca dati OsMed ha consentito di valutare la qualità della prescrizione farmacologica in Italia. La prevalenza di 13 indicatori, sviluppati dal Geriatric Working Group dell’Agenzia Italiana del Farmaco, con l’intento di fornire uno strumento per monitorare la qualità della prescrizione farmacologica, è stata valutata all’interno dell’intera popolazione anziana ultra65enne in Italia tramite l’utilizzo dei dati OsMed. Gli indicatori proposti interessano diversi aspetti della qualità della prescrizione farmacologica (polifarmacoterapia; aderenza; cascata prescrittiva; sottotrattamento; interazione farmacologica; farmaci da evitare) e sono stati identificati mediante una revisione della letteratura scientifica, finalizzata ad identificare i comportamenti prescrittivi associati a peggiori outcome clinici negli anziani. L’analisi della prevalenza di questi indicatori nella popolazione OsMed (Tabella 1) ha mostrato che la qualità della prescrizione farmacologica in Italia non è ottimale e che sono frequenti comportamenti prescrittivi non appropriati.
Nonostante il database OsMed sia stato utilizzato ad oggi per studi di prevalenza, la potenzialità di linkare questi dati con dati amministrativi relativi ai registri di morte e alle schede di dimissione ospedaliera apre la strada a studi osservazionali di elevata qualità che coinvolga l’intera popolazione nazionale.




RIASSUNTO
I trial clinici randomizzati sono considerati il metodo di riferimento per stabilire l’efficacia di trattamenti e generare medicina basata sulle evidenze. Tuttavia, per criteri di arruolamento spesso troppo selettivi, esistono dubbi sulla generalizzabilità dei loro risultati. I trial clinici randomizzati esplorano infatti gli effetti dei trattamenti in un paziente “medio”, spesso lontano dagli anziani del mondo reale, caratterizzati da comorbosità croniche associate a deterioramento funzionale e/o cognitivo. Gli studi osservazionali sono stati proposti come metodo alternativo per analizzare l’efficacia clinica di trattamenti nella popolazione anziana “reale”, con problemi clinici compositi. A differenza dei trial clinici randomizzati, essi indagano i risultati nella pratica clinica, e riflettono in tal modo la vera aderenza al trattamento in esame. La disponibilità di enormi database di alta qualità offre il potenziale per condurre ricerca ed audit più aderenti alla pratica clinica. Essi sono un terreno fertile per la conduzione di studi osservazionali e per generare ipotesi di lavoro e nuova ricerca epidemiologica, purché completi dei dati di tutti i pazienti consecutivi, con definizioni standardizzate di malattie ed esiti, e con tutte le variabili potenzialmente in grado di influenzare i risultati. È dimostrato che il loro potenziale viene largamente accresciuto se si collegano con altri database, come quelli socio-demografici.
Parole chiave. Database; Efficacia; Studi osservazionali; Trial clinici.
bibliografia
1. Sackett DL, Rosenberg WM, Gray JA, Haynes RB, Richardson WS. Evidence based medicine: what it is and what it isn’t. It’s about integrating individual clinical expertise and the best external evidence. BMJ 1996;312:71.
2. Sibbald B, Roland M. Understanding controlled trials: why are randomised controlled trials important? BMJ 1998;316:201.
3. Evidence-Based Medicine Working Group. Evidence-based medicine. A new approach to teaching the practice of medicine. JAMA 1992;268:2420-5.
4. Levin A. Evidence-based medicine gaining supporters. Ann Intern Med 1998;128: 334-6.
5. Charlton BG. Randomized clinical trials: the worst kind of epidemiology? Nat Med 1995;1:1101-2.
6. Taubes G. Looking for the evidence in medicine. Science 1996;272:22-4.
7. Feinstein AR, Horwitz RI. Problems in the “evidence” of “evidence-based medicine”. Am J Med 1997;103:529-35.
8. Maynard A. Evidence-based medicine: an incomplete method for informing treatment choices. Lancet 1997;349:126-8.
9. Lee PY, Alexander KP, Hammill BG, Pasquali SK, Peterson ED. Representation of elderly persons and women in published randomized trials of acute coronary syndromes. JAMA 2001;286:708-13.
10. Avorn J, Gurwitz JH. Drug use in the nursing home. Ann Intern Med 1995;123: 195-204.
11. Fahey T. Applying the results of clinical trials to patients in general practice: perceived problems, strengths, assumptions, and challenges for the future. Br J Gen Pract 1998;48:1173-8.
12. SHEP Cooperative Research Group. Prevention of stroke by antihypertensive drug treatment in older persons with isolated systolic hypertension. Final results of the Systolic Hypertension in the Elderly Program (SHEP). JAMA 1991;265:3255-64.
13. Pauker SG, Kassirer JP. Decision analysis. N Engl J Med 1987;316:250-8.
14. Black N. High-quality clinical databases: breaking down barriers. Lancet 1999;353: 1205-6.
15. Coulter A. Partnerships with patients: the pros and cons of shared clinical decision-making. J Health Serv Res Policy 1997; 2:112-21.
16. Rothwell PM. Can overall results of clinical trials be applied to all patients? Lancet 1995;345:1616-9.
17. Van Spall HG, Toren A, Kiss A, Fowler RA. Eligibility criteria of randomized controlled trials published in high-impact general medical journals: a systematic sampling review. JAMA 2007;297:1233-40.
18. Fried TR, McGraw S, Agostini JV, Tinetti ME. Views of older persons with multiple morbidities on competing outcomes and clinical decision-making. J Am Geriatr Soc 2008;56:1839-44.
19. Bernabei R, Gambassi G, Lapane K, et al. Management of pain in elderly patients with cancer. SAGE Study Group. Systematic Assessment of Geriatric Drug Use via Epidemiology. JAMA 1998;279:1877-82.
20. Gambassi G, Lapane KL, Sgadari A, et al. Effects of angiotensin-converting enzyme inhibitors and digoxin on health outcomes of very old patients with heart failure. SAGE Study Group. Systematic Assessment of Geriatric drug use via Epidemiology. Arch Intern Med 2000;160:53-60.
21. Liperoti R, Gambassi G, Lapane KL, et al. Conventional and atypical antipsychotics and the risk of hospitalization for ventricular arrhythmias or cardiac arrest. Arch Intern Med 2005;165:696-701.
22. Liperoti R, Gambassi G, Lapane KL, et al. Cerebrovascular events among elderly nursing home patients treated with conventional or atypical antipsychotics. J Clin Psychiatry 2005;66:1090-6.
23. Liperoti R, Pedone C, Lapane KL, Mor V, Bernabei R, Gambassi G. Venous thromboembolism among elderly patients treated with atypical and conventional antipsychotic agents. Arch Intern Med 2005;165:2677-82.
24. Liperoti R, Onder G, Lapane KL, et al. Conventional or atypical antipsychotics and the risk of femur fracture among elderly patients: results of a case-control study. J Clin Psychiatry 2007;68:929-34.
25. Liperoti R, Onder G, Landi F, et al. All-cause mortality associated with atypical and conventional antipsychotics among nursing home residents with dementia: a retrospective cohort study. J Clin Psychiatry 2009;70: 1340-7.
26. Gruppo di Lavoro OsMed. L’uso dei farmaci in Italia. Rapporto nazionale anno 2011. Roma: Il Pensiero Scientifico Editore, 2012.