Los últimos tiempos nos han exigido un esfuerzo de aprendizaje en la interpretación de nuevas metodologías de análisis cuantitativo que han sido aplicadas en algunos de los principales trabajos que nutren la literatura cardiológica y cardioquirúrgica. Atrás quedó la crítica de si los diseños eran prospectivos o retrospectivos, el control de sesgos y confusores o el test estadístico aplicado. Los ensayos clínicos aleatorizados se encumbraron como el cénit de la calidad de la evidencia y se aderezaron con metodologías que hablaban, entre otros, de la no inferioridad o del teorema de Bayes.
Los resultados del análisis del trabajo en cuestión, a pesar de su relevancia, no merecen gran extensión. Sin embargo, la metodología seguida, es la que realmente nos llevará un esfuerzo de comprensión para entender de dónde proceden las afirmaciones hechas por los autores. Brevemente, se trata de un metaanálisis que aglutina los resultados de mortalidad a un máximo de 5 años de los principales trabajos comparativos de TAVI vs. sustitución valvular aórtica (SVA) disponibles y que siguieron metodologías de no inferioridad. Se trata de un metaanálisis que aglutinó todos los espectros de riesgo: PARTNER 1A, PARTNER 2A, PARTNER 3, CoreValve US, SURTAVI, NOTIONL, Evolut Low Risk, UK-TAVI. Con ello, se incluyó un total 8.698 pacientes, 4.443 sometidos a TAVI y 4.255 intervenidos de SVA. Tras un metaanálisis con diferentes metodologías bayesianas, los autores concluyeron que no es pertinente considerar el TAVI como no inferior a la SVA con los resultados de mortalidad a 5 años o, lo que es lo mismo, la SVA fue significativamente superior en dicho seguimiento a medio plazo.
COMENTARIO:
En la inferencia estadística “tradicional”, determinábamos que la ocurrencia de un fenómeno de manera diferente entre grupos era significativa cuando se consideraba que, con un margen de error menor a un criterio predeterminado (llamado error alfa, 5%), no era debida al azar. La ausencia de diferencias o la probabilidad de la ocurrencia del fenómeno en un porcentaje mayor a ese 5%, llevaría a considerarlo como equivalente. Los estudios de no inferioridad se centran en dicho concepto de equivalencia, pero adoptan un punto de vista diferente. Expresado en lenguaje llano, pretenden determinar si la diferencia en la ocurrencia de un fenómeno entre dos grupos está comprendida dentro de un intervalo previamente especificado, fuera del cual se consideraría como clínicamente relevante. La finalidad, por lo tanto, no es establecer el grado en el que el fenómeno ocurre ni las diferencias entre los grupos, sino la perspectiva del impacto clínico que pueda tener de acuerdo a un determinado margen de no inferioridad. Los límites de este margen se determinarían por las diferencias en la ocurrencia del fenómeno reportada entre un grupo y el otro. La superación de este margen, llevaría a negar la no inferioridad o, lo que es lo mismo, la superioridad en la ocurrencia del fenómeno en un grupo frente al otro. Entendiendo este tipo de análisis, es razonable pensar que son menos exigentes que los de la inferencia “tradicional”, ya que la incursión en la no inferioridad, principal objetivo de los mismos, es más fácil que encontrar diferencias estadísticamente significativas. Además, son menos dependientes de la potencia estadística, no sólo aunque íntimamente relacionada con el tamaño muestral, cuya insuficiencia es una de las principales causas de no identificar diferencias estadísticamente significativas en la estadística “tradicional”.
Si nos pareció rebuscado el análisis de no inferioridad, la estadística bayesiana puede resultar todavía más “marciana”. Se trata de calcular la probabilidad de un suceso futuro, mediante una distribución predictiva que formula el teorema de Bayes, todo ello dentro de unos márgenes de probabilidad de que ocurra y atendiendo a una probabilidad inicial que es conocida y real. Por así decirlo, es la bola de cristal estadística. Pero claro, en ocasiones sólo hace que amplificar tendencias futuras a partir de resultados actuales no significativos o considerados no inferiores. En definitiva, entendidos ambos conceptos, claramente podemos ver que están hechos el uno para el otro. Con el primero no es difícil incurrir en la conclusión de la “equivalencia” y, con el segundo, pueden predecirse tendencias futuras a partir de ese resultado inicial.
Pues bien, entrando en una opinión personal de la que muchos no son ajenos, estas metodologías han sido incorporadas a diferentes ensayos clínicos en campos de alta controversia por su adecuación para la obtención de resultados interesados: de falsa equivalencia con los primeros, y de falso anticipo de beneficios con los segundos, para así formar un cuerpo de evidencia rápido e interesado al servicio de la industria. Y si aplicamos este razonamiento al mundo TAVI vs. sustitución valvular aórtica, la hoja de ruta es evidente: encontrar la no inferioridad a corto plazo que permita justificar una aparente técnica menos invasiva y, posteriormente, con los beneficios conocidos en el/los primer/os año/dos años respecto de la penalización quirúrgica, anticipar resultados futuros que apuntalen la indicación incluso en las guías clínicas.
Pues bien, el análisis propuesto, al haber utilizado resultados reales a medio plazo, una vez superado el famoso punto de corte de las curvas de supervivencia a los dos años, parece ofrecer resultados “fuera del guión”, ya que no hace sino amplificar tendencias que, en muchos de los trabajos, ya son significativamente superiores para la opción quirúrgica. También hemos de tener en cuenta que, a pesar de la aleatorización, los pacientes sometidos a TAVI en los estudios de alto y moderado riesgo, eran especialmente comórbidos, lo cual podría haber impactado en los resultados al considerarlos en un análisis conjunto.
Aunque este trabajo vuelve a llamar la atención al avance descontrolado del intervencionismo ofreciendo resultados positivos para la cirugía, quizá su principal relevancia sea demostrar que estas metodologías, tan diferentes de las “tradicionales”, retuercen los datos y son tendenciosas. Dicho en castizo, el “cazador ha quedado cazado” o el hecho de realizar el análisis bayesiano con datos que superan los dos años de seguimiento ha dado a la industria del TAVI, “su propia medicina”. En un documento de consenso previamente analizado en el blog sobre el tratamiento de la enfermedad del tronco coronario izquierdo se proscribían ciertos tipos de análisis como la mortalidad por todas las causas o los eventos compuestos. Esperemos que, de una vez por todas, se acoja el principio EBM en el intervencionismo estructural: “evidence-based medicine” en lugar de “evidence-biased medicine”.
COMENTARIO:
Heuts S, Kawczynski MJ, Sardari Nia P, Maessen JG, Biondi-Zoccai G, Gabrio A. Bayesian interpretation of non-inferiority in transcatheter versus surgical aortic valve replacement trials: a systematic review and meta-analysis. Interdiscip Cardiovasc Thorac Surg. 2023 Nov 2;37(5):ivad185. doi: 10.1093/icvts/ivad185.