Vis emner som begynner på ...
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
Æ
Ø
Å

Tolking av prøvesvar

03.09.2021Versjon 2.2

Generelt 

Tolking av prøvesvar
Det kan være mange grunner til at vi bestiller laboratorieprøver. Ikke alle grunner er like rasjonelle, men hovedsakelig blir laboratorieprøver bestilt i to ulike kliniske situasjoner:

 

  • Diagnostikk: Vi ønsker å påvise sykdom eller grad av sykdom, for å tilby pasienten rett behandling og for å kunne vurdere prognosen
  • Kontroll: Vi skal overvåke endringer hos pasienter med kjente tilstander, fordi endringer i tilstanden kan kreve endret behandling.

 

Dette kapitlet omhandler noen verktøy som er nyttige når vi skal tolke prøvesvar til diagnostikk og kontroll.

Diagnostikk 

Sannsynlighet for sykdom
Hvis vi bestiller laboratorietester for å stille en diagnose, betyr det som regel at vi ikke er sikker på diagnosen etter å ha vurdert sykehistorien og utført en klinisk undersøkelse. Men vi har en mistanke om hvilken tilstand pasienten kan ha, og denne mistanken eller sannsynligheten kalles pretestsannsynlighet for sykdom. Den bruker vi, sammen med prøveresultatet, til å finne posttestsannsynlighet. Dette gjør vi etter beste skjønn, men vi kan også gjøre det rent formelt etter følgende formel [1]:

 

post = [S • pre] / [S • pre + (1 - pre)]

der post er posttestsannsynlighet, pre er pretestsannsynlighet og S er prøvesvarets sannsynlighetsratio.

 

Vårt problem som diagnostikere er således todelt. Vi må ha en viss formening om pretestsannsynlighet, basert på sykehistorie og kliniske funn, og vi må bestemme oss for hvilken vekt vi vil tillegge prøvesvaret. Denne vekten kalles sannsynlighetsratio (på engelsk ”likelihood ratio”).

 

Når sannsynlighetsratio er lik 1, blir posttestsannsynlighet lik pretestsannsynlighet. Sannsynlighetsratio mindre enn 1 gir posttestsannsynlighet mindre enn pretestsannsynlighet, mens sannsynlighetsratio større enn 1 gir posttestsannsynlighet større enn pretestsannsynlighet. Se figur 1, der posttestsannsynlighet er plottet som funksjon av pretestsannsynlighet.

Sannsynlighetsratio er definert slik:

S = P (prøveresultat gitt sykdom) / P (prøveresultat gitt ikkesykdom)

Sannsynlighetsratio er sannsynligheten (P) for å få et visst prøvesvar hos en pasient som har den sykdommen vi mistenker, dividert med sannsynligheten for få akkurat det samme prøvesvaret hos en person som ikke har sykdommen. Hvis prøven bare kan ha positivt eller negativt svar, blir sannsynlighetsratio for positivt svar lik sensitivitet/(1-spesifisitet) og sannsynlighetsratio for negativt svar blir (1-sensitivitet)/spesifisitet. Sensitivitet er sannsynlighet for positivt prøvesvar hos syke, og spesifisitet er sannsynlighet for negativt prøvesvar hos friske.

 

Innen medisinsk mikrobiologi og patologi er mange prøvesvar positive (patologiske) eller negative (normale). Slik er det ikke i medisinsk biokjemi, der nesten alle prøvesvar er kvantitative og kan anta uendelig mange verdier. For å ta vare på informasjonen i kvantitative prøvesvar, trenger vi funksjoner for sannsynlighetsratio. Det kan laboratoriet som regel ikke framskaffe, men det hjelper å inndele prøvesvarene i grader av patologi. Et eksempel er vist i tabell 1. Diagnosen som skal stilles er jernmangelanemi og testen er p-ferritin, med prøvesvarene inndelt i 6 kategorier. Jo lavere p-ferritin, jo høyere er sannsynlighetsratio. Vi kunne ha omgjort svarene til positive og negative ved å sette en grense ved for eksempel 15 µg/L. I så fall ville sannsynlighetsratio for et positivt (patologisk) svar bli 54,5, det samme som for kategorien < = 15 µg/L. For et negativt (normalt) svar ville sannsynlighetsratio bli 0,4, uansett om svaret var 16 eller 400 µg/L, og det blir selvsagt misvisende.

 

Tabell 1
Sannsynlighetsratio for ulike verdier av p-ferritin ved diagnostikk av jernmangelanemi. Antall pasienter i hver kategori er hentet fra referanse [2].

P-ferritin (µg/L) Antall pasienter med jernmangel Antall pasienter uten jernmangel Sannsynlighets-ratio
< =15 474 20 54,5
16-24 117 29 9,3
25-34 58 50 2,7
35-44 36 43 1,9
45-99 76 398 0,4
>=100 48 1320 0,1


Likevel blir både kvantitative og semikvantitative prøvesvar ofte omgjort til positive eller negative i forhold til en grense, trolig fordi det er lettere å forholde seg til bare to mulige svar. Sannsynlighetsratio for resultater av forskjellige undersøkelser finnes på internett, se for eksempel [3] og [4]. De fleste angivelser gjelder kliniske undersøkelser.


I de fleste kliniske situasjoner har vi ikke kunnskap om sannsynlighetsratio for ulike prøvesvar. Da må vi tolke svarene i forhold til referanseområder, og vi må huske at:

 

  • Referanseområdet omfatter som regel de sentrale 95 % av verdiene til personer i en referansepopulasjon, oftest en frisk populasjon (gjerne blodgivere), slik at en frisk person har 95 % sannsynlighet for at prøvesvaret vil være innenfor referanseområdet og 5 % sannsynlighet for at det vil være utenfor
  • Et referanseområde basert på friske personer sier ingenting om fordeling av prøvesvar hos syke personer. Hvis vi for eksempel bruker øvre referansegrense som beslutningsgrense for å stille en diagnose, og øvre referansegrense tilsvarer 97,5%-persentilen i referansepopulasjonen, da setter vi testens spesifisitet til 0,975 i forhold til friske referansepersoner. Hvis vi ikke kjenner fordelingen i en syk populasjon, kjenner vi ikke sensitiviteten. Å bruke referansegrenser som beslutningsgrenser kan derfor være lite rasjonelt: Spesifisiteten blir satt i forhold til en mindre relevant populasjon, og sensitiviteten er i prinsippet ukjent!

 

Tenk dynamisk: Et prøvesvar som ligger like utenfor referanseområdet, kan være en normal verdi for vedkommende person. Jo lengre fra referanseområdet et prøvesvar ligger, jo sikrere kan vi tolke det som patologisk. Men et prøvesvar innenfor referanseområdet utelukker ikke nødvendigvis sykdom.

 

Trenger vi egentlig noen laboratorieprøve?
Vi beregner sannsynlighet for sykdom for å kunne tilby pasienten riktig behandling. Hvis en behandling for en sykdom er nyttig for syke, men ikke ufarlig for friske, er behandling å foretrekke når sannsynlighet for sykdom overstiger en viss behandlingsterskel [5]. Ved sannsynligheter lavere enn denne terskelen bør vi ikke behandle.

I denne sammenheng trenger vi laboratorieprøver bare hvis prøvesvaret får oss til å endre valg av behandling. Hvis prøvesvaret ikke får noen konsekvenser, skal vi selvsagt ikke bestille prøven. I figur 2 er dette vist for prøver som bare kan ha positivt eller negativt svar.

Vi ser at ved tilstrekkelig lav pretestsannsynlighet for sykdom (mindre enn T1) vil selv et positivt svar ikke øke sannsynlighet for sykdom til en verdi som ligger over behandlingsterskelen. Hvis vi da behandler på grunnlag av et positivt svar, gjør vi mer skade enn nytte. Tilsvarende, hvis pretestsannsynlighet er over en viss terskel (T2), bør vi behandle uten å teste, fordi selv et negativt svar ikke vil redusere sannsynlighet for sykdom til en verdi som ligger under behandlingsterskelen. Hvis vi da lar være å behandle på grunnlag av et negativt svar, gjør vi mer skade enn nytte. Kun når pretestsannsynlighet ligger mellom de to tersklene, bør vi teste og behandle avhengig av testresultatet [6].

 

Kostnadseffektiv bruk av laboratorietester krever derfor at vi kan estimere både pretestsannsynlighet og behandlingsterskel. I de fleste kliniske situasjoner kan vi ikke tallfeste disse sannsynlighetene, men vi må likevel ha en mening om i hvilken størrelsesorden de ligger. For eksempel ligger behandlingsterskelen for sepsis meget lavt, og ved klinisk mistanke om sepsis vil vi som regel behandle uten å avvente noe prøvesvar som eventuelt kan avkrefte tilstanden (redusere sannsynligheten til et nivå under behandlingsterskelen). Riktignok tar vi laboratorieprøver, men da mer som en hjelp til å justere behandlingen. I den andre enden av skalaen, meget høyt, ligger behandlingsterskelen for de fleste kreftformer, og behandling igangsettes ikke på grunnlag av en positiv kreftmarkørtest. Som det framgår av figur 2, er indikasjonsområdet (målt som pretestsannsynlighet) størst når behandlingsterskelen er rundt 0,5, det vil si når sannsynligheten for sykdom er lik sannsynligheten for ikke-sykdom. For så vidt er det naturlig: Når tvilen er størst, har vi mest nytte av ekstra informasjon.

Kontroll 

I denne situasjon skal prøvesvarene hjelpe oss til å påvise eventuelle endringer hos pasienter med kjente helsetilstander. Da må vi kunne skille ut andre årsaker til endret prøvesvar. De kan deles inn i tre grupper:

 

  • Preanalytiske faktorer
  • Analytiske faktorer
  • Normale biologiske endringer

 

Preanalytiske faktorer
Dette gjelder faktorer som forberedelse av pasienten til prøvetaking, selve prøvetakingen og behandling av prøven før analyse. De viktigste faktorene er:

  • Matinntak
  • Kaffeinholdige drikker
  • Røyking
  • Alkohol
  • Legemidler
  • Kroppsaktivitet
  • Kroppsstilling under prøvetaking
  • Prøvetakingsteknikk
  • Prøvemateriale
  • Prøveoppbevaring

 

Det er vanskelig å eliminere effekten av preanalytiske faktorer, men så langt det er mulig, må pasienten være forberedt på samme måte til hver prøvetaking, og prøvene må tas og oppbevares forskriftsmessig hver gang. For eksempel vil det være villedende å måle b-hemoglobin hos en pasient som en gang er sengeliggende og neste gang er stående. Når en person reiser seg fra liggende til stående stilling, vil konsentrasjonen av celle- og proteinbundne substanser stige med 8-10 % etter ca. 10 minutter.

 

Analytiske faktorer
Utføring av analysen er selvsagt viktig. Vi bruker to mål for hvor korrekt en analyse er: Upresisjon og riktighet.

Upresisjon er et uttrykk for spredning av analyseresultater ved gjentatt analysering av samme prøve, og blir ofte oppgitt som en dag til dag-variasjonskoeffisient. Se nedenfor om tolking og bruk av slike variasjonskoeffisienter.

Riktighet er et uttrykk for at gjennomsnittet av analyseresultatene ved gjentatt analysering av samme prøve ligger i rett nivå, dvs. at analysen er riktig kalibrert og spesifikk (at den måler det den skal og ikke noe annet). Som en regel må vi gå ut fra at laboratoriet har korrigert prøvesvaret for kjent uriktighet. Ulike laboratorier kan likevel måle ulikt nivå av en viss substans i samme prøve, fordi ulike analysemetoder kan være ulikt kalibrert. For mange analyser finnes det ikke noen nasjonal eller internasjonal kalibreringsstandard. Ved kontroll av pasienter med kjente tilstander er det derfor viktig at man bruker det samme laboratoriet hver gang, og at laboratoriet varsler ved eventuelle betydningsfulle nivåendringer på grunn av rekalibrering eller skift av metode.

 

Normale biologiske endringer
En rekke normale forhold påvirker prøvesvarene, som for eksempel:

  • Alder
  • Kjønn
  • Kroppsmasse
  • Biologiske rytmer

 

Når vi har gjort rede for slike kjente årsaker til endringer i konsentrasjonen av ulike substanser, står vi tilbake med endringer som best kan kalles tilfeldige. Det betyr at det ikke er noe regelmessig mønster i endringene, og det er heller ikke noen grunn til å hevde at endrede stoffskifteprosesser ligger under. Endringene kan best beskrives som tilfeldig fluktuasjon rundt et gjennomsnitt, og kan antas å følge en Gauss-fordeling [7]. Denne tilfeldige variasjon i konsentrasjon av en substans hos samme person kalles intraindividuell biologisk variasjon.

Er sykdomsprosess årsak til endret prøvesvar?
Når vi sammenligner to prøvesvar tatt på ulike tidspunkter, skal vi vurdere om preanalytiske faktorer, analytiske faktorer og normal biologisk variasjon kan forklare forskjellen, eller om en reell endring i pasientens tilstand har funnet sted.

Under forutsetning av at preanalytiske faktorer er uendret, og at det ikke har funnet sted andre normale biologiske endringer enn de tilfeldige, kan vi som en grov tilnærming sette at (SD betyr standardavvik):

SDtotal = [(SDanalytisk)2 + (SDbiologisk)2]0,5

Dessuten vet vi at:

SDdiff = [2•(SDtotal)2]0,5 = 1,414 • SDtotal

der SDdiff er standardavviket til differansen mellom to prøvesvar.

 

Undersøker vi differansen mellom to prøvesvar mange ganger, antar vi at verdiene fordeler seg som en Gauss-fordeling med gjennomsnitt lik 0 og standardavvik lik SDdiff. Hvis vi krever minst 95 % sannsynlighet for at forskjellen mellom to prøvesvar skyldes endringer i pasientens tilstand, krever vi at tallverdien til differansen mellom resultatene er minst 1,96•SDdiff, fordi det er bare 5 % sannsynlighet for å få en så stor, eller større, tallverdi på grunn av analytiske faktorer og tilfeldig intraindividuell biologisk variasjon. Omregnet til SDtotal blir det 1,96• SDdiff =1,96•1,414•SDtotal = 2,8•SDtotal. Nøyer vi oss med minst 90 % sannsynlighet, er det nok at differansen er minst 1,65•SDdiff =1,65•1,414•SDtotal = 2,3•SDtotal.

 

I omtalen av de enkelte analyser og undersøkelser har vi oppgitt analytisk variasjon for de fleste kvantitative analyser, samt tilfeldig intraindividuell biologisk variasjon der denne er kjent, og i så fall også totalvariasjonen. Disse angivelsene er i form av variasjonskoeffisienter, som er standardavvik i prosent av gjennomsnitt. Tallene for analytisk variasjon er såkalt dag-til-dag-variasjonskoeffisienter gjeldende over et tidsrom på flere måneder. Angivelsene er representative for norske medisinsk-biokjemiske laboratorier, men de kan variere noe fra et laboratorium til et annet, så best er det å bruke tall fra det laboratoriet man benytter. Tallene for biologisk variasjon er mediane variasjonskoeffisienter gjeldende over et tidsrom på dager til måneder. Hos den enkelte pasient kan variasjonskoeffisientene være mindre eller større. The European Federation of Clinical Chemistry and Laboratory Medicine (EFLM) har opprettet og vedlikeholder en database med kvalitetssikrede data for biologisk variasjon (EFLM Biological Variation) og det anbefales at denne kilden benyttes der det er mulig [8].

 

Ved sammenlikning av to prøvesvar bruker vi samme regnemåte for variasjonskoeffisienter som for standardavvik.

Et eksempel: La oss si at totalvariasjonen for b-HbA1c er oppgitt til 2,5 %. Hvis vi vil være 95 % sikre på at en forskjell mellom 2 prøvesvar ikke bare skyldes tilfeldig variasjon (analytisk og biologisk), må forskjellen være minst 2,8•SDtotal =2,8•2,5 % = 7,0 %. Hvis pasientens første prøvesvar var b-HbA1c=43 mmol/mol, må det andre prøvesvaret være mindre enn 0,93•43 mmol/mol = 40 mmol/mol, eller større enn 1,07•43 mmol/mol = 46 mmol/mol for at vi kan være 95 % sikre på at forskjellen ikke bare skyldes tilfeldig variasjon (analytisk og biologisk).

Denne tankegangen kan si noe om sannsynligheten for at en endring i pasientens tilstand har funnet sted, men regnestykket sier ingenting om endringen har klinisk betyding. Og omvendt - klinisk betydningsfulle endringer i pasientens tilstand kan selvsagt finne sted uten at vi påviser statistisk signifikante forskjeller mellom to prøvesvar.

 

Et annet forbehold er at normale, tilfeldige intraindividuelle biologiske variasjoner ikke kan forventes å være uavhengige av det første prøvesvaret. Hvis det første prøvesvaret tilfeldigvis er relativt høyt, er det mest sannsynlig at det neste blir lavere, fordi kroppen har reguleringsmekanismer for konsentrasjonen av de fleste forbindelser. Vi må huske at modellen er meget enkel.

Skal vi vurdere endringer på grunnlag av mer enn to prøvesvar, kan vi ikke bruke den enkle modellen som er nevnt over. Det finnes statistiske metoder som er beregnet for vurdering av seriemålinger med mer enn to resultater, men de er tungvinte å bruke, så vi har ingen praktiske alternativer til den gamle ”øyemål-metoden”, det vil si erfaring om hva som er betydningsfulle endringer. En spesiell situasjon er seriemåling av kreftmarkør for å vurdere om svulstfjerning har vært vellykket og for tidlig å oppdage residiv. Da kan vi ha nytte av matematiske modeller som beskriver endring av kreftmarkørens konsentrasjon hos pasienter med kjente sykdomsforløp. Slik endring kan for eksempel tallfestes som halveringstid og fordoblingstid [11, 12].

Referanser 

  1. Albert A. On the use and computation of likelihood ratios in clinical chemistry. Clin Chem 1982;28:1113-1119.
  2. Guyatt GH, Oxman AD, Ali M, Willan A, McIlroy W, Patterson C. Laboratory diagnosis of iron-deficiency anemia: An overview. J Gen Intern Med 1992; 7: 145-53.
  3. Evidence-Based Medicine Toolbox - More Details on Likelihood Ratios (knowledgetranslation.net).
  4. LR Home – The NNT group.

  5. Pauker SG, Kassirer JP. Therapeutic decision making: A cost-benefit analysis. N Engl J Med 1975; 293: 229-34.
  6. Pauker SG, Kassirer JP. The threshold approach to clinical decision making. N Engl J Med 1980; 302: 1109-17.
  7. Fraser CG. Biological Variation: From Principles to Practice. Washington: AACC Press, 2001.
  8. Aarsand AK, Fernandez-Calle P, Webster C, Coskun A, Gonzales-Lao E, Diaz-Garzon J, Jonker N, Minchinela J, Simon M, Braga F, Perich C, Boned B, Roraas T, Marques-Garcia F, Carobene A, Aslan B, Barlett WA, Sandberg S. The EFLM Biological Variation Database. https://biologicalvariation.eu/ [accessed 09.03.2021].
  9. Bidart J-M, Thuillier F, Augereau C, Chalas J, Daver A, Jacob N, Labrousse F, Voitot H. Kinetics of serum tumor marker concentrations and usefulness in clinical monitoring. Clin Chem 1999; 45: 1696-1707.
  10. Schoeberl MR. A model for the behavior of ß-hCG after evacuation of hydatidiform moles. Gynecol Oncol 2007; 105: 776–9.