Los modelos o escalas de riesgo se utilizan ampliamente para predecir los resultados de los pacientes después de una cirugía cardíaca1. Se han desarrollado múltiples de estas escalas, dentro de las más reconocidas están el Society of Thoracic Surgeons Score (STS score)2 y el European System for Cardiac Operative Risk Evaluation (EuroSCORE) en todas sus versiones3–5. Estas escalas de riesgo incluyen diferentes variables del paciente, además del tipo y momento de la cirugía2,5. De esta manera, se estima el riesgo de mortalidad que tiene al someterse a una cirugía cardiaca, y así, tomar las medidas necesarias para disminuir el riesgo y preparar al personal ante posibles complicaciones.
Algunos países han desarrollado escalas de riesgo locales considerando indicadores poblacionales regionales y/o propios de cada país. Específicamente en Latinoamérica, dos países han construido escalas propias: Brasil con el InsCor6 y Argentina con el Argentinean System for Cardiac Operative Risk Evaluation (ArgenSCORE)7. En Chile, no se ha desarrollado un indicador de riesgo nacional para cardiocirugías y no existen estudios que comparen los diferentes indicadores existentes que permita evidenciar científicamente cuál es el más apropiado en nuestro medio. Uno de los más utilizados en nuestro país es el EuroSCORE II8–11.
El EuroSCORE se ha ido calibrando con el tiempo. Su primera versión, el EuroSCORE aditivo, se publicó en el año 19993. Luego, fue actualizado en EuroSCORE logístico en 20034 y finalmente llegó a su última versión, el EuroSCORE II, en el año 20115. Esta nueva calibración fue necesaria, ya que con la mejora de los resultados después de la cirugía cardíaca en los últimos años, EuroSCORE se volvió menos calibrado y la evidencia sugería que los modelos anteriores “sobrepredicen el riesgo”5. El estudio para la realización de EuroSCORE II consideró 22.381 pacientes de 43 países en un período de 12 semanas, donde se recopiló la información en una base de datos electrónica. Dentro de estos, se consideraron tres países latinoamericanos, Argentina, Brasil y Uruguay con seis centros participantes de un total de 1545.
Existen múltiples estudios a nivel mundial que han evaluado el rendimiento del EuroSCORE II en sus propias poblaciones, obteniendo diferentes resultados. En algunos casos, concluyen que es un modelo válido y en otros, subestiman el riesgo de mortalidad dependiendo de la población y tipo de cirugía1,12–14. Es importante que la escala utilizada estime de manera precisa los resultados de la cirugía, ya que de esta manera permite la comparación entre diferentes centros, por lo cual, un rendimiento deficiente conduce a una predicción inadecuada y, potencialmente, a una evaluación comparativa no válida15.
A nivel latinoamericano son escasos los estudios que han evaluado la relación entre la mortalidad observada y estimada por esta escala15–18. Considerando la importancia de tener bien calibrado un indicador de riesgo de mortalidad para cirugías cardiacas, es importante exponer la evidencia científica que permita determinar la validez del EuroSCORE II medido en Latinoamérica.
Dado que no existe una revisión que reúna todos estos datos en un solo estudio, el objetivo de esta revisión es, determinar la precisión del EuroSCORE II en estimar el riesgo de mortalidad operatoria en cirugías cardíacas en pacientes latinoamericanos.
Pacientes y Métodos
Protocolo
Esta revisión se realizó siguiendo los lineamientos de la declaración PRISMA19. No se registró un protocolo previo a esta revisión.
Criterios de elegibilidad
Se seleccionaron todos los estudios que evalúan el rendimiento de EuroSCORE II en cirugías cardiacas, en pacientes mayores de 18 años, pertenecientes a países latinoamericanos, publicados en idiomas inglés, español y/o portugués, entre los años 2012 a 2020, con el término “EuroSCORE II” en el título. Se excluyeron cartas al autor, publicaciones duplicadas y todos aquellos estudios que no cumplieran con los criterios de selección. También se excluyeron estudios de cirugías cardiacas mínimamente invasivas.
Fuentes de información
La búsqueda se realizó en las bases de datos electrónicas Scielo, Pubmed y Scopus.
Estrategia de búsqueda
Se llevó a cabo una búsqueda con el término libre: EuroSCORE II, sin filtros aplicados. Todos los artículos se centralizaron en el programa Zotero20 y se eliminaron los duplicados. Tras esto, se realizó un filtrado de estudios por título de manera manual, efectuado por dos revisores independientes, seleccionando aquellos que incluyeran la palabra “EuroSCORE II” en el título. De los estudios preseleccionados, se filtró por país y año de publicación, y se excluyeron estudios de acuerdo con los criterios preestablecidos.
Selección de estudios
Los artículos seleccionados fueron leídos a texto completo para determinar si cumplían con los criterios de inclusión. Se incluyeron en la revisión aquellos estudios que evalúan el rendimiento predictivo de EuroSCORE II sobre mortalidad operatoria en cirugías cardiacas coronarias y valvulares. Se utilizó un formulario de extracción de datos para identificar los estudios potencialmente elegibles de acuerdo con los criterios de inclusión y se incluyeron en la revisión cuantitativa aquellos estudios que mostraron mortalidad observada y estimada por EuroSCORE II.
Extracción de datos
De los estudios seleccionados se recolectó la siguiente información: autor, país, número de centros participantes, años de estudio, número de pacientes y tipo de cirugía. También se obtuvo: edad, porcentaje (%) de sexo femenino, mortalidad observada, mortalidad estimada por EuroSCORE II y el área bajo la curva (AUC) característica operativa del receptor (ROC). Estos datos fueron recopilados de forma independiente en una planilla de Excel diseñada para esta revisión y posteriormente tabulados.
Evaluación del riesgo de sesgo de los estudios incluidos
Se evaluó el riesgo de sesgo de los estudios incluidos de forma independiente utilizando el sistema Grading of Recommendations Assessment, Development and Evaluation (GRADE)21, el cual clasifica la evidencia en alta, moderada, baja y muy baja.
Medidas de resumen
Se identificaron como variables la mortalidad observada y la mortalidad estimada por EuroSCORE II. La calibración del modelo se determinó mediante la relación mortalidad observada/estimada (O/E) y la discriminación mediante el AUC de la ROC. El análisis de esta curva se utiliza con el fin de cuantificar la precisión de EuroSCORE II para diferenciar entre dos estados de pacientes como lo es en este caso, un paciente de alto y bajo riesgo de mortalidad. Los ejes gráficos de la curva ROC presentan valores entre 0 y 1 y la capacidad discriminativa aumenta a medida que el AUC se acerca al valor 122.
Síntesis de resultados
Para cada estudio se determinó la relación de mortalidad O/E, calculado como:
Un valor de mortalidad O/E mayor que 1 se tradujo en un riesgo de mortalidad subestimado por EuroSCORE II, mientras que un valor de mortalidad O/E menor que 1 significó una sobrestimación de la mortalidad por el mismo estudio23.
Además, se calculó un AUC de la ROC promedio, calculado como promedio ponderado, para establecer una discriminación global; y una Mortalidad O/E general, calculado como el total de los pacientes fallecidos divido por el total de los pacientes estimados por fallecer, para establecer una calibración global.
Resultados
Selección de los estudios
En la Figura 1 se presenta el diagrama de flujo de la selección de estudios, de acuerdo con la metodología PRISMA19. Se identificaron 2.037 publicaciones de acuerdo con el término de búsqueda preestablecido, de los cuales se eliminaron 952 duplicadas. Luego de analizar los artículos por título y resumen, se excluyeron 1.077 por no cumplir con los criterios de inclusión. De los ocho registros analizados a texto completo, se eliminaron dos por corresponder a cirugía cardiaca mínimamente invasiva y dos por presentar datos contenidos en otros estudios. Los cuatro restantes fueron incluidos en la síntesis cualitativa y cuantitativa15–18.
Estudios incluidos
Según los criterios de búsqueda, se seleccionaron cuatro estudios para el análisis cuantitativo. De estos, dos pertenecen a Argentina15,18 y dos a Brasil16,17, incluyendo a un total de 8.372 pacientes. Las cuatro publicaciones corresponden a estudios multicéntricos y observacionales. Las características de los estudios incluidos se presentan en la Tabla 1.
Tabla 1 Características de los estudios incluidos
Autor principal, año de publicación | Nombre del estudio | País | n de centros participantes | Años de estudio | n de pacientes | Tipo de cirugía |
---|---|---|---|---|---|---|
Mejía, 2020 | Validation and quality measurements for STS, EuroSCORE II and a regional risk model in Brazilian patients | Brasil | 11 | 2013-2017 | 5.222 | Bypass coronario y cirugía valvular aislada o combinada |
Borrachi, 2019 | Multicenter prospective validation of the EuroSCORE II in Argentina | Argentina | *N/E | 2012-2018 | 2.000 | Cirugías cardiacas, (excepto disección aórtica aguda, trasplante e implante valvular aórtico transcatéter) |
Lisboa, 2014 | EuroSCORE II and the importance of a local model, InsCor and the future SP-SCORE | Brasil | *N/E | 2008-2009 | 900 | Bypass coronario o cirugía valvular asociada y / o aislada o combinada |
Carosella, 2014 | Validación prospectiva y multicéntrica del ArgenSCORE en la cirugía de reemplazo valvular aórtico. Comparación con el EuroSCORE I y el EuroSCORE II | Argentina | 4 | 2008-2012 | 250 | Reemplazo valvular aórtico aislado o asociado con cirugía de revascularización miocárdica |
*N/E: No se especifica este dato en el estudio.
Datos recolectados
Los datos recolectados de cada estudio se presentan en la Tabla 2. Según estos, el promedio de edad de los participantes fue de 62,45 años y el porcentaje de población femenina fue de 34,3%. La mortalidad operatoria, definida como la mortalidad a 30 días ocurrió en 7,08%, lo que corresponde a 593 pacientes. Mientras que la mortalidad estimada por EuroScore II fue de 3,89%, lo que correspondería a 326 pacientes. La AUC promedio de los estudios fue de 0,77 y la relación de mortalidad O/E general de 2,04.
Tabla 2 Resultados obtenidos de los estudios incluidos
Autor principal, año de publicación | Edad (años) | Femenino (%) | Mortalidad observada (%) | Mortalidad estimada (%) | AUC | Mortalidad O/E |
---|---|---|---|---|---|---|
Mejía, 2020 | 60,6 | 36,4 | 7,64 | 3,1 | 0,76 | 2,46** |
Borrachi, 2019 | 66,5 ± 10,7 | 28,5 | 4,3 | 3,0 | 0,80 | 1,43** |
Lisboa, 2014 | *N/E | *N/E | 11,1** | 11,1** | 0,81 | 1** |
Carosella, 2014 | 68,62 ± 13,3 | 36,8 | 3,6 | 1,64 | 0,76 | 2,19** |
*No se especifica este dato en el estudio.
**Estos resultados fueron calculados a partir de los datos presentados en cada estudio.
Riesgo de sesgo dentro de los estudios
El riesgo de sesgo de los estudios incluidos en esta revisión se presenta en la Tabla 3. Todos los estudios corresponden a estudios observacionales, por lo cual, de acuerdo con el sistema GRADE son catalogados inicialmente como baja calidad de la evidencia. Ciertos aspectos considerados por este sistema aumentan o disminuyen el nivel de calidad definido por el diseño de estudio. No se pudo determinar la existencia de sesgo de publicación de los estudios ni la inconsistencia entre estos. Dada la naturaleza de los estudios realizados, es complejo el cegamiento, la aleatorización y obtener un gran tamaño muestral. De acuerdo con esto, los estudios fueron calificados con una baja calidad de la evidencia.
Tabla 3 Calidad de la evidencia de los estudios individuales según sistema GRADE
Criterios | Autor principal, año de publicación | |||
---|---|---|---|---|
Mejía, 2020 | Borrachi, 2019 | Lisboa, 2014 | Carosella, 2014 | |
Calidad de la evidencia* | Baja | Baja | Baja | Baja |
Diseño de estudio | Observacional | Observacional | Observacional | Observacional |
Riesgo de sesgo | - | - | - | - |
Inconsistencia | NE | NE | NE | NE |
Evidencia directa | - | - | - | - |
Imprecisión | - | - | - | - |
Sesgo de publicación | NE | NE | NE | NE |
Fuerte asociación | - | - | - | - |
Factores de confusión residual | - | - | - | - |
Dosis-respuesta | - | - | - | - |
Calidad de la evidencia | Baja | Baja | Baja | Baja |
*Nivel de calidad inicial definido por el diseño de estudio.
NE: no evaluado.
Discusión
En esta revisión se evaluaron cuatro estudios sobre el rendimiento de EuroSCORE II en países latinoamericanos, incluyendo dos estudios de Argentina15,18 y dos de Brasil16,17, con el objetivo de determinar el rendimiento de este modelo de riesgo en Latinoamérica.
Los resultados de nuestro estudio señalan que EuroSCORE II subestimó el riesgo de mortalidad hospitalaria asociado a cirugías cardíacas, con una relación mortalidad O/E general de 2,04, lo cual indica una baja calibración de este modelo a nivel local. Sin embargo, mostró un buen poder de discriminación con un AUC promedio de 0,77 (0,76-0,81), demostrando un desempeño adecuado, clasificándose como una prueba moderadamente precisa y con una capacidad aceptable de diferenciar a los pacientes de bajo riesgo frente a los de alto riesgo de mortalidad23.
Si bien, en términos generales, EuroSCORE II demostró un desempeño aceptable, la subestimación del riesgo de mortalidad hospitalaria en países latinoamericanos, refuerza la necesidad de validar este modelo a nivel local. Guida, y cols.23, desarrollaron un metaanálisis que incluyó 22 estudios con índole internacional, con un total de 145.592 procedimientos, el cual mostró una buena discriminación de EuroSCORE II, con un AUC de 0,792 (IC del 95%, 0,773-0,811) similar a la obtenida en nuestro estudio. Sin embargo, la precisión estimada mediante la relación mortalidad O/E fue de 1,019 (IC del 95%, 0,899-1,139), la cual varió significativamente de la relación obtenida en nuestra revisión de Latinoamérica.
EuroSCORE II fue desarrollado con una cohorte de 22.381 pacientes pertenecientes a 43 países. Si bien, es un modelo validado internacionalmente, con una sólida determinación del riesgo de mortalidad asociado con cirugías cardíacas en todo el mundo, solo tres países latinoamericanos fueron considerados dentro de la validación de este modelo a nivel mundial, entre ellos, Argentina, Brasil y Uruguay5. Es por esto, que la precisión de EuroSCORE II puede variar al implementar este modelo en población latinoamericana, lo cual recalca la importancia de validar y ajustar los modelos de riesgo en cada país a implementar.
Sumado a esto, se debe tomar en cuenta la variación de los resultados entre los diferentes centros y cirujanos. Por esta razón se ha sugerido adaptar el riesgo predicho por EuroSCORE II con el Risk-adjusted mortality ratio (RAMR)3,24, el cual es un índice específico para cada centro o cirujano, obtenido mediante la división de la mortalidad real (observada) por la mortalidad estimada por el modelo de riesgo. Al multiplicar la mortalidad estimada por EuroSCORE II por el RAMR de cada cirujano o unidad, se podría obtener un valor de riesgo más preciso.
Existen numerosas publicaciones a nivel mundial sobre rendimiento y validación de EuroSCORE II1,12–14,23, sin embargo, los estudios en Latinoamérica son escasos. Si bien, 8.372 pacientes es una cantidad considerable, los estudios incluidos son de tan solo dos países (Argentina y Brasil), lo cual limita nuestro estudio, siendo poco representativo y significativo dentro del total de población, no estando exento de sesgo.
Es por esto que, es complejo determinar la precisión de este modelo en población latinoamericana ya que, existen pocos estudios de la validación de este modelo a nivel local y la mayoría de los países latinoamericanos no están representados. En Chile, aún no existe evidencia sobre la validación de EuroSCORE II, por lo cual no se conoce el rendimiento de este modelo a nivel nacional. Esto podría significar el inicio de una línea investigativa que permita conocer resultados quirúrgicos de diferentes centros conformando una red nacional, e incluso latinoamericana.
Conclusiones
Los resultados de esta revisión señalan que EuroSCORE II subestima el riesgo de mortalidad en la población latinoamericana, lo cual refleja su bajo poder de calibración a nivel local. Si bien, en términos generales, la escala de riesgo presenta un desempeño aceptable, cuatro estudios de tan solo dos países son insuficientes para confirmarlo.
De acuerdo a lo anterior se concluye que se requieren más estudios, tanto a nivel local como latinoamericano, para evaluar el desempeño de EuroSCORE II en nuestra región.