Foto: Iistockphoto/ angelp

MEDIZINPRODUKTE  | Schnelltests

No risk, no fun!

Prof. Wilhelm Behringer leitet das Zentrum für Notfallme- dizin am Universitätsklinikum Jena. Im Interview erklärt er die wichtigsten Grundlagen zur Beurteilung von

medizinischen Tests wie Vortestwahrscheinlichkeit, Sen- sitivität, Spezifizität,

Nachtestwahrscheinlichkeit und was diese Begriffe für die tägliche Praxis bedeuten.

?Ein neuer Test für den Nachweis/Ausschluss einer Erkrankung wurde entwickelt. Wie kann man die Qualität dieses Tests beurteilen?

Die Qualität (oder Testgüte) des Tests ergibt sich aus der Sensitivität und Spe- zifizität des Tests. Vielleicht kann sich jeder aus der Studienzeit an die Vierfel- dertafel erinnern, in der die gesunden und kranken Patienten und die positiven und negativen Ergebnisse angeführt werden: richtig positiv (rp), falsch positiv (fp), richtig negativ (rn) und falsch negativ (fn). Die Sensitivität bezieht sich auf das Kollektiv der kranken Patienten und misst den Prozentsatz der Kranken, die korrekt als solche erkannt werden (rp/rp+fn). Die Spezifität bezieht sich auf das Kollektiv der gesunden Patienten und misst den Prozentsatz der Gesun- den, die korrekt als solche erkannt werden (rn/rn+fp).


?Hilft uns die Testgüte, eine Erkrankung zu diagnostizieren oder auszuschließen?

Der Patient kommt mit einem positiven oder negativen Test zum Arzt und möchte wissen, ob er tatsächlich krank oder gesund ist. Zur Beantwortung die-

ser Frage und für die weitere Interpretation des Testergebnisses hilft weder Sensitivität noch Spezifität, sondern wir brauchen den positiven und negativen Vorhersagewert, die wir wieder aus der Vierfeldertafel berechnen können. Der positive Vorhersage- wert bezieht sich auf die positiven Ergebnisse und misst den Prozentsatz der korrekt positiven Ergebnisse aus allen positiven Er- gebnissen (rp/rp+fp). Der negative Vorhersagewert bezieht sich auf die negativen Ergebnisse und misst den Prozentsatz der korrekt negativen Ergebnisse aus allen negativen Ergebnissen (rn/rn+fn). Sensitivität und Spezifität sind testbezogen und geben nur Auskunft über die Testqualität, während positiver und negativer Vorhersagewert patientenbezogen sind und Auskunft geben, wie wahrscheinlich ein Patient mit positivem Test tatsächlich krank oder mit negativem Test tatsächlich gesund ist.


?Ist es für die Beurteilung eines Testergebnisses wichtig, ob ich den Test in meiner Hausarztpraxis oder in einem Kran- kenhaus mache?

Nehmen wir an, der neue Test hat eine Sensitivität von 97 % und eine Spezifität von 90 %. Der Test wird zunächst in einem Kol- lektiv von 100 kranken und 1.000 gesunden Patienten evaluiert (Prävalenz 9 %). Aus der Vierfeldertafel ergibt sich ein positiver Vorhersagewert von 49 % (97/97+100) und ein negativer Vorhersagewert von 99,7 % (900/3+900), das heißt, die Wahrschein- lichkeit, dass ein Patient mit positivem Befund wirklich krank ist liegt bei 49 % (wie bei einem Münzwurf) und die Wahrscheinlich- keit, dass ein Patient mit negativem Befund wirklich gesund ist, liegt bei nahezu 100%. Nun wird der Test in einem Kollektiv mit 1.000 kranken und 100 gesunden Patienten evaluiert (Prävalenz 91 %). Aus der Vierfeldertafel ergibt sich nun ein positiver Vor- hersagewert von 99 % (970/970+10) und ein negativer Vorhersagewert von 75 % (90/30+90), das heißt in diesem Patientenkol- lektiv mit höherer Prävalenz liegt die Wahrscheinlichkeit, dass ein Patient mit positivem Befund wirklich krank ist, bei fast 100 % und die Wahrscheinlichkeit, dass ein Patient mit negativem Befund wirklich gesund ist, nur noch bei 75 %.

Ganz allgemein ausgedrückt, mit zunehmender Prävalenz steigt der positive und sinkt der negative Vorhersagewert und mit ab- nehmender Prävalenz steigt der negative und sinkt der positive Vorhersagewert eines Testes. Das Wissen um die die Abhängig- keit der Testinterpretation von der Prävalenz ist besonders wichtig, wenn der gleiche Test in unterschiedlichen Umgebungen ver- wendet wird: Das Patientengut in der Hausarztpraxis zeigt in der Regel eine niedrigere Prävalenz als das Patientengut einer Spi- talsambulanz, das heißt Patienten sind in einer Hausarztpraxis mit negativem Befund mit höherer Wahrscheinlichkeit als in der Spitalsambulanz wirklich gesund und in einer Spitalsambulanz mit positiven Befund mit höherer Wahrscheinlichkeit als in der Hausarztpraxis wirklich krank (beispielsweise Tumormarkerbestimmung als Screening in der Hausarztpraxis vs. Therapieverlauf in der onkologischen Spitalsambulanz).


?Muss ich nun in meiner Praxis jedes Mal eine komplizierte Rechnung machen, um sagen zu können, mit welcher Wahr- scheinlichkeit mein Patient erkrankt ist?

In der Hausarztpraxis sind die Zahlen für eine Vierfeldertafel nicht verfügbar. Verfügbar sind allerdings fast immer die Angaben über die Sensitivität und Spezifität und davon abgeleitet die positive und negative Likelihood Ratio des anzuwendenden Tests sowie die Prävalenz (Vortestwahrscheinlichkeit) für eine Erkrankung, basierend auf Literatur oder diversen Risiko-Scores. Das Bayes- Theorem besagt: Die Vortestwahrscheinlichkeit multipliziert mit der Testgüte ergibt die Nachtestwahrscheinlichkeit. Mithil- fe des Fagan- Nomogramms kann man ohne Formelrechnung für jede beliebige Vortestwahrscheinlichkeit abhängig von der Li- kelihood Ratio die Nachtestwahrscheinlichkeit für einen positiven oder negativen Test bestimmen.


?Wie hilft mir die Nachtestwahrscheinlichkeit mit dem weiteren Prozedere für den Patienten?

Die Nachtestwahrscheinlichkeit hilft bei der Planung des weiteren Vorgehens. Hierbei sind zwei Begriffe notwendig: die Test- schwelle und die Behandlungsschwelle. Wenn die Wahrscheinlichkeit für eine Erkrankung unterhalb der Testschwelle liegt, so sollte keine weitere Diagnostik durchgeführt werden, weil die potenziellen Nebenwirkungen weiterer eventueller falsch positiver Befunde und deren Behandlungskonsequenzen die Vorteile der Behandlung der wenigen vielleicht doch diagnostizierten Er- krankungen überwiegen. Als Beispiel seien Patienten mit Verdacht auf Lungenarterienembolie genannt, wo in der Literatur eine Testschwelle von < 2 % angegeben wird. Wenn die Wahrscheinlichkeit für die Erkrankung über der Behandlungsschwelle liegt, so ist ebenfalls keine weitere Diagnostik notwendig. Nur wenn die Wahrscheinlichkeit für eine Erkrankung zwischen der Test- schwelle und der Behandlungsschwelle liegt, ist eine weitere Diagnostik indiziert. Allerdings sind Testschwelle und Behand- lungsschwelle oft nicht in der Literatur zu finden und müssen mit den Patienten individuell besprochen und diskutiert werden (shared decision-making).


?Gibt es ein häufiges und prägnantes Beispiel für das Zusammenspiel zwischen Risiko und Testgenauigkeit?

Patienten mit Verdacht auf Lungenarterienembolie (LAE) sind ein gutes Beispiel, um den Zusammenhang

zwischen Vortestwahrscheinlichkeit, Testgüte und Nachtestwahrscheinlichkeit zu zeigen. Die Vortestwahrscheinlichkeit lässt sich bei Patienten mit Verdacht auf LAE anhand des Wells-Scores bestimmen, wobei aus der Literatur bei einem Wells-Score von 0-1 Punkten eine geringe Wahrscheinlichkeit 6 %, bei 2-6 Punkten eine mittlere Wahrscheinlichkeit 23 % und bei >6 Punkten eine hohe Wahrscheinlichkeit 49 % für eine LAE angegeben ist.

Der D-Dimer-Test hat eine negative Likelihood Ratio von 0,11 und eine positive Likelihood Ratio von 1,72 (siehe Abbildung). Unter Verwendung des Fagan-Nomogramms ergibt sich bei negativem D-Dimer-Test für Patienten mit einer niedrigen Vortest- wahrscheinlichkeit von 6 % eine Nachtestwahrscheinlichkeit von 0,5 %, für Patienten mit einer mittleren Vortestwahrscheinlichkeit von 23 % eine Nachtestwahrscheinlichkeit von < 2 % und für Patienten mit einer hohen Vortestwahrscheinlichkeit von 49 % eine Nachtestwahrscheinlichkeit von 6 %. Bei positivem D-Dimer liegt die Nachtestwahrscheinlichkeit abhängig von der Vortest- wahrscheinlichkeit zwischen 10 % und 60 %. Während also bei niedriger und mittlerer Vortestwahrscheinlichkeit für eine LAE ein negatives D-Dimer dazu führt, dass die Wahrscheinlichkeit für eine LAE unter die Testschwelle sinkt, bleibt bei hoher Vortest- wahrscheinlichkeit für eine LAE auch bei negativen D-Dimer die Wahrscheinlichkeit für eine LAE über der Testschwelle. Insofern ist bei Patienten mit hoher Vortestwahrscheinlichkeit für eine LAE eine Bestimmung des D-Dimers sinnlos, weil die Nachtest- wahrscheinlichkeit sowohl für ein negatives als auch positives D-Dimer zwischen der Testschelle und der Behandlungsschwelle liegt und die Patienten unabhängig vom D-Dimer-Resultat auf jeden Fall einer weiteren Diagnostik bedürfen.


?Kann man die Grundprinzipien zur Risikoabschätzung universell anwenden?

Das Prinzip der Risikostratifizierung und Testauswahl ist immer gleich: Die Vortestwahrscheinlichkeit multipliziert mit der Testgüte ergibt die Nachtestwahrscheinlichkeit. Es lässt sich relativ einfach und schnell auf alle klinischen Situationen gleichermaßen an- wenden, egal ob wir das Risiko für eine Koronarerkrankung oder das Risiko für eine Appendizitis mittels eines diagnostischen Test abschätzen wollen. Wann immer wir einen Test machen, sollten wir uns vorher überlegen, wie hoch ist die Wahrschein- lichkeit für die Erkrankung, brauchen wir einen bestimmten Test überhaupt, hilft uns ein bestimmter Test überhaupt weiter und was bedeutet das Ergebnis für unsere Patienten? Rechtfertigt eine niedrige Wahrscheinlichkeit für eine Erkrankung die Konse- quenzen einer weiterführenden (Über-)Diagnostik? Auf jeden Fall sollte immer auch eine individuelle Risikoabschätzung im Dia- log mit dem Patienten oder deren Angehörigen Bestandteil der Abklärung sein.


ja