¿Qué es el propensity score? Parte 3

Posted On 29 Abr 2019
Comment: Off

En las entregas anteriores, que invitamos a releer, desarrollamos el concepto de propensity score, y su utilidad para superar el sesgo de selección que implica todo estudio observacional. A la hora de definir el efecto de un tratamiento determinado, y cuando el mismo no ha sido asignado en forma aleatoria, es claro que el efecto observado pude deberse en gran parte a las características basales que hacen que cada individuo sea tratado o no (sesgo de selección).

Una forma de poder homologar los hallazgos de un estudio aleatorio (donde el azar decide el tratamiento) con uno observacional (donde hay variables que condicionan la elección del tratamiento) es justamente recurrir a la confección de un score de propensión.

Especificamos que generar un score de propensión implica adjudicar a cada paciente de un estudio observacional un puntaje que señala la probabilidad de recibir un determinado tratamiento de acuerdo con el patrón de covariables independientemente asociado a esa probabilidad. Mediante regresión logística se construye dicho score, que crece en valor cuanto mayor la probabilidad de haber recibido el tratamiento.

Sin embargo debe quedar muy en claro que una cosa es la probabilidad y otra la realidad. Pacientes con alta probabilidad pueden de cualquier manera no estar tratados (por diferentes circunstancias, incluyendo desde ya la decisión del médico de cabecera), y viceversa. Por ejemplo: un paciente con muy alta probabilidad de recibir la indicación de un resincronizador (porque tiene baja fracción de eyección de ventrículo izquierdo, QRS ancho, patente de bloqueo de rama izquierda y ritmo sinusal) puede no tenerlo colocado (porque su médico desconoce los criterios, o estima que no lo beneficiará, o por falta de cobertura adecuada), mientras que otro con fracción de eyección más alta, QRS no tan ancho, patente de bloqueo de rama derecha y fibrilación auricular puede tenerlo colocado porque el grupo tratante estimó que de cualquier manera puede serle útil y se pudo acceder al dispositivo. ¿Cómo considerar entonces la probabilidad de estar tratado o no en relación con la realidad, y cómo analizar los resultados? Cómo atribuir al tratamiento un efecto determinado más allá de las características basales?

Hay 4 diferentes maneras de emplear el score de propensión:

Apareamiento: es el método que describimos en la entrega anterior. Básicamente consiste en aparear dos cohortes de pacientes en base a su score. Por cada paciente con un puntaje determinado que está tratado se aparea uno que con el mismo puntaje (o un valor muy, muy cercano) no lo está. Lógicamente en el rango de puntajes altos predominarán los tratados, por lo que al aparear 1 a 1, se perderán pacientes con puntaje alto no tratados. Y lo inverso sucederá en el rango de puntajes bajos. Finalmente quedarán definidas 2 cohortes de pacientes con puntaje similar, donde para cada valor del score que implica determinada propensión a estar tratado, habrá uno efectivamente tratado y otro no, como si se tratara de un estudio aleatorizado. En teoría, como la probabilidad de tratamiento es la misma en ambas cohortes, cualquier diferencia en la evolución puede atribuirse al mismo, y no a las características basales. El apareamiento es el método más empleado cuando se recurre al propensity score. Su gran déficit es que, por lo que dijimos, se descarta gran cantidad de pacientes (aquellos que “sobran” a la hora de aparear: puntajes altos sin tratamiento, puntajes bajos con tratamiento)

Estratificación: en este caso lo que se hace es considerar a todos los pacientes, cada uno con su score, se los ordena de menor a mayor y se los divide en estratos, por lo menos 5 (quintilos), y en algunos casos hasta 10 (decilos). En cada estrato del score están los pacientes tratados y no tratados, aunque su número no sea el mismo, como sucede al aparear. Una ventaja de este método es que no desaprovecha pacientes (todos entran en el análisis, en el estrato correspondiente) y que permite definir el efecto del tratamiento para cada estrato en particular, con lo que puede explorarse si la intervención es más efectiva en determinado patrón de covariables.

Ponderación de la probabilidad inversa de tratamiento: es un método más complejo, que considera de distinta manera a los pacientes según si están tratados o no, y el valor del score. Entre los pacientes tratados, el peso que corresponde a cada observación es 1/ score. Entre los no tratados, el peso que corresponde a cada observación es 1/ (1-score). Como corolario, un tratado “pesa” más en el análisis si su score es bajo (está tratado pese a baja probabilidad de estarlo) que si es alto (está tratado, pero con alta probabilidad de estarlo). En cambio, un no tratado “pesa“más si su score es alto (no tratado cuando era esperable que lo estuviera) y menos si es bajo (su probabilidad de estar tratado ya era baja).

Supongamos que contamos con 50 pacientes con score 0,40. De ellos 20 están tratados y 30 no. De acuerdo con la fórmula, en cada tratado el peso de la observación es 1/0,40 = 2,5. Y en cada no tratado el peso de la observación es 1/0,60= 1,66. La suma de la ponderación de los tratados es 20 x 2,5= 50. Y la de los no tratados es 30 x 1,66=50. Como vemos, se genera una pseudo población (porque los pacientes tienen un peso en el análisis que no es el similar para todos, sino que varía de acuerdo con la probabilidad previa de haber recibido un tratamiento o no, y el estar efectivamente tratado o no). Notemos también que la suma de los pesos ponderados termina siendo la misma para tratados y no tratados en cada valor del score.

Ajuste por covariables: en este caso, simplemente se emplea el score de propensión obtenido como una de las covariables que en el modelo multivariado se usan para predecir el evento de interés. En dicho modelo, el score de propensión es una de las variables predictoras, y el tratamiento otra. Ajustando por el score de propensión, definimos si el tratamiento es un predictor independiente de la evolución o no.
Si no lo es, es porque la propensión al tratamiento es la verdadera responsable de la evolución. Si lo es, quiere decir que independientemente de las variables basales que definen la propensión al tratamiento, la intervención en sí misma mejora el pronóstico.

Veamos ahora un ejemplo sobre la utilización del score de propensión con cada una de las 4 aproximaciones:

En un estudio observacional, sobre 1.480 pacientes con disfunción ventricular izquierda, 630 están tratados con betabloqueantes y 850 no. Queremos definir si en un seguimiento medio de 3 años el empleo de betabloqueantes es un predictor independiente de menor mortalidad. Los pacientes tratados con betabloqueantes tienen tensión arterial mayor, fracción de eyección algo más alta, tienen menos trastornos de conducción en el ECG, menos hiponatremia, mejor función renal y menos frecuentemente patología respiratoria. Puede entonces que todas estas condiciones aseguren mejor sobrevida, más allá del uso del uso de betabloqueantes. Para ajustar por estas características basales construimos en base a los predictores independientes de uso de betabloqueantes un score de propensión. Cada uno de los 1.480 pacientes tiene su score que señala la probabilidad de estar tratado, independientemente de si lo está o no.

Si vamos a emplear el apareamiento, lo hacemos empleando parejas de pacientes en las que para el mismo score (o uno muy similar) uno está efectivamente tratado y el otro no. Generamos 2 cohortes de pacientes con score similar (una tratada, la otra no) y las seguimos en el tiempo para definir, con análisis de sobrevida o regresión logística, si la mortalidad es significativamente diferente. Descartamos en este análisis a todos los pacientes que no pudimos aparear, por no encontrarles pareja en la población. Es decir, a tratados con puntaje alto (porque no es fácil encontrar a no tratados con puntaje de propensión elevado) y a no tratados con puntaje bajo (porque no es fácil encontrar a tratados con puntaje de propensión bajo).

Si usamos la estratificación, empleamos en el análisis a todos los pacientes. Los ordenamos de menor a mayor por su score, dividimos a los pacientes en estratos de acuerdo al mismo y podemos explorar el efecto del tratamiento betabloqueante en cada estrato, y obtener una medida de efecto global.

Si empleamos la probabilidad inversa ponderada de tratamiento también consideramos a todos los pacientes en el análisis, pero aquellos en los que hay discrepancia más marcada entre el score y la realidad (tratados con puntajes muy bajos, no tratados con puntajes muy altos) pesan más en el análisis.

Si usamos el ajuste por covariables, consideramos a todos los pacientes y usamos el score como una covariable en el análisis para definir el papel de los betabloqueantes en la evolución, y al tratamiento betabloqueante como otra covariable.

Cada una de las aproximaciones tiene ventajas y desventajas. En determinados contextos una forma de análisis es mejor que otra. Esta discriminación excede el propósito de esta sección. En general, repetimos, el apareamiento es la más empleada, por la semejanza que establece con un estudio aleatorio, aunque, como dijimos, esa semejanza no es completa (no considera las variables desconocidas, hay riesgo de confusión residual).

Un último comentario: el score de propensión puede ser empleado también para definir el valor pronóstico de condiciones aunque no sean específicamente un tratamiento. Supongamos un estudio observacional en que se quiere definir el valor pronóstico de la hiponatremia. Hay pacientes con y sin hiponatremia, que son diferentes en cuanto a sus características basales. Algunas de ellas predicen independientemente la condición de hiponatremia (por ejemplo, disfunción renal, consumos de diuréticos, insuficiencia cardíaca, hipotiroidismo) Con ellas se construye un score de propensión para hiponatremia, y…..Lo demás ya es historia conocida.

 

Por el Dr. Jorge Thierer