Según las estimaciones del INE, para el 2050 la población mayor de 65 años se duplicará respecto al 2018, llegando a corresponder a 25% de la población1. El equipo médico se verá enfrentado, con mayor frecuencia, a otorgar cuidados perioperatorios en pacientes con condiciones particulares que puedan afectar sus resultados postquirúrgicos.
Dentro de este grupo etáreo, el diagnóstico de fragilidad ha tomado relevancia, ya que este estado de menor reserva fisiológica y menor capacidad de respuesta al estrés, quirúrgico en nuestro contexto, se asocia con peores resultados postoperatorios, con un aumento en la morbimortalidad2,3. Parece importante poder pesquisar tempranamente a estos pacientes y ofrecer un manejo integral multidisciplinario durante el perioperatorio para mejorar los resultados.
El estándar de oro en el diagnóstico de fragilidad es una evaluación geriátrica integral, que requiere tiempo y especialistas que no siempre están disponibles. Existen múltiples escalas para medición de fragilidad mundialmente conocidas: el fenotipo clínico de fragilidad desarrollada por Linda Fried2, evalúa sólo el dominio físico requiriendo medición de fuerza prensil y velocidad de marcha; el índice de fragilidad (IF) de Rockwood4 es multidimensional, pero consta de una valoración geriátrica integral; y la escala Edmonton Frail Scale (EFS)5–7 validada en el preoperatorio, considera la prueba “time up and go” (TUG). Todas las anteriores requieren de tiempo y condiciones que una proporción considerable de las evaluaciones preoperatorias no tienen.
Según Rockwood y su IF basado en la acumulación de déficit, un puntaje de corte de 0,3 o más demuestra asociación con fragilidad, considerando su valor como una proporción de déficit respecto al total de ítems evaluados8; originalmente descrito con el análisis de 92 ítems9, actualmente validado su uso con un mínimo de 30 ítems10.
La sarcopenia es otra característica habitual en pacientes frágiles. Hay distintas formas de evaluarla a través de asociaciones con pruebas únicas: fuerza prensil medida con dinamometría11, incorporada en el fenotipo clínico de fragilidad, validada en población chilena (< 15 kg en mujeres, < 27 kg en hombres)12; circunferencia de pantorrilla, estandarizada en población sudamericana con un punto de corte de < 31 cm13,14; y el TUG con un punto de corte mayor a 20 segundos15.
Una herramienta para evaluar fragilidad en el perioperatorio debe tener las siguientes características: validez, rapidez de ejecución, sencillez, capacidad de medir múltiples dimensiones y no depender de una prueba cognitiva o física que puede no ser factible previo a una cirugía. En este contexto destaca la escala Risk Analysis Index (RAI), una herramienta que posee las características deseables mencionadas. Fue desarrollada a partir de otra escala, la Minimum data set mortality index (MMRI)3, que se validó para predecir mortalidad en pacientes que ingresaban a instituciones de larga estadía. Posteriormente la escala RAI fue modificada y validada por otros investigadores observando asociación con mortalidad y morbilidad postoperatoria en pacientes frágiles16–18.
Nuestro objetivo es detectar fragilidad en AM de forma preoperatoria aproximándonos a la valoración geriátrica integral, con una herramienta fácil de realizar, para poder identificar dominios que evidencien al paciente vulnerable al estrés quirúrgico.
En el presente estudio evaluaremos en población chilena de un centro, el comportamiento de la EFS y la escala RAI-M (adaptada desde la escala RAI) en comparación al IF de Rockwood considerado como el estándar. Ambas escalas están compuestas de preguntas dicotómicas, sencillas y rápidas que interrogan distintas dimensiones para identificar el paciente frágil.
Material y Métodos
Se realizó la traducción y transculturación al español de la escala RAI por dos profesionales bilingües. Posteriormente se evaluó su validez de contenido mediante el criterio de jueces expertos con el fin de evaluar la claridad, relevancia y pertinencia de los ítems. Sobre ésta, se elaboró la escala RAI-M con un equipo multidisciplinario, adicionando preguntas que buscaban ampliar la evaluación de fragilidad desde su perspectiva multifactorial definiendo las dimensiones: Física, nutricional, social, afectiva, cognitiva y funcional, además de evaluar la carga de patología médica. Este instrumento posee 11 preguntas de antecedentes médicos, 25 de respuesta dicotómica y no requiere de pruebas físicas o cognitivas (Anexo 1).
Aprobado por Comité de Ética de la Investigación del Centro de Bioética de la Facultad de Medicina de Clínica Alemana - Universidad del Desarrollo se procedió a la prueba experimental. Se incluyeron AM de 65 años o más programados para un procedimiento electivo con anestesia, que acepte participar y que haya estado en condiciones de realizar la evaluación o hubiese un familiar o cuidador a cargo que pueda responder por él. Se excluyeron los pacientes hospitalizados para cirugía de emergencia, que se negaron a participar o que no estuvieron en condición de realizar la evaluación. Las escalas fueron realizadas por médicos, kinesiólogos y fonoaudiólogos.
Paralelamente se realizó la traducción, valoración por jueces expertos, muestra piloto, corrección y posterior evaluación en muestra experimental de EFS (Anexo 2).
Como estándar de oro se realizó un IF de Rockwood de 31 ítems (Anexo 3), incluyó preguntas del área cognitiva (test del reloj), nutricional, funcional, social y antecedentes médicos. Además, se midió Índice de Masa Corporal, circunferencia de pantorrilla, dinamometría y TUG, pruebas objetivas utilizadas como herramienta única para medir sarcopenia en estudios previos10 (Anexo 4).
Las respuestas obtenidas fueron almacenadas en formato digital (Redcap), a la cual solo tenía acceso el investigador principal para protección de datos.
Tamaño muestral
El tamaño de muestra experimental, según la recomendación más habitual, se empleó una muestra 10 veces mayor al número de variables (N = 10k, donde k es el número de ítems o variables)19,20. Sin embargo, otros autores creen suficiente una muestra menor21,22; dos o tres veces el número de ítems o variables (N = 2k o N = 3k), con la condición de que el número de sujetos no sea inferior a 200.
Se estimó un tamaño muestral experimental mínimo de 200 para RAI-M y 110 para EFS.
Análisis estadístico
Para caracterizar la muestra se obtuvieron medias y DS o medianas y percentiles según la distribución de los datos y para las variables categóricas se obtuvo frecuencias absolutas y relativas.
El puntaje de RAI-M se obtiene contando la cantidad de ítems positivos de las distintas dimensiones evaluadas, varía entre 0-25 puntos. El puntaje EFS se obtiene sumando las respuestas individuales de 11 ítems valorados de 0-2, este puntaje va de 0-17 puntos.
Se buscó evidencia de validez de RAI-M y EFS al evaluar su constructo, su capacidad de discriminación y predictiva.
Se evaluó la consistencia interna mediante alfa de Cronbach para todos los ítems, se realizó Análisis Factorial Exploratorio y confirmatorio para la validación de constructo según teoría clásica reportando índices de bondad de ajuste.
Para buscar evidencia de validez por convergencia se evaluó la capacidad de discriminación de EFS y RAI-M respecto de la condición de fragilidad como respuesta dicotómica de la escala de Rockwood con un IF de 0.3 mediante el área bajo la curva (AUC) ROC.
Se obtuvieron los días de hospitalización, rehospitalización, prolongación de hospitalización para evaluar la validez predictiva de estas herramientas a través de modelos de regresión logístico, múltiples y la capacidad de discriminación mediante el análisis del área bajo la curva (AUC) ROC.
Se evaluó el tiempo al evento de muerte a un seguimiento máximo de 9 meses con variable pronóstico el score RAI-M ajustado y luego dicotomizado según punto de discriminación con el Gold standard, mediante un modelo de riesgos proporcionales de Cox. También se evaluó el tiempo al evento de muerte a un seguimiento máximo de 9 meses con EFS como variable pronóstico en un modelo independiente.
Se utilizó una significación de 5%, intervalos de confianza de nivel 95%. Los datos fueron procesados en STATA 14.0.
Resultados
RAI-M
Muestra experimental de 201 pacientes, edad promedio fue de 73 +/- 7 años, distribución de 51% hombres y 49% mujeres, el porcentaje de pacientes clasificados como frágiles según Rockwood es de un 35%. Las patologías reportadas por los pacientes se observan en la Tabla 1.
Tabla 1 Grupo de validación RAI-M
Total de pacientes | 201 |
Edad | 73 ± 7 años |
Distribución por sexo | 51% hombre y 49% mujeres |
Fragilidad por Rockwood | 35% |
Comorbilidades | HTA: 54% |
DM: 19% | |
Cáncer: 39% | |
EPOC: 5% | |
IAM: 3,5% | |
Angina: 2,5% | |
Insuficiencia cardíaca: 6,6% | |
Asma: 2,5% | |
Artritis: 13,5% | |
ACV: 4,5% | |
ERC: 3,5% |
Al evaluar confiabilidad interna observamos los siguientes valores: 0,92 para dimensión físico-nutricional, 0,78 afectivo, 0,72 funcional y 0,64 social.
Se evaluó la estructura de la escala RAI-M donde el análisis factorial exploratorio arroja una estructura preliminar de 4 factores. Tras eliminar los ítems con pesos factoriales menores a 0,3 y los ítems que presentaban pesos factoriales significativos en más de una dimensión se obtuvo una estructura definida por 4 dimensiones: Físico-nutricional, afectiva, social y funcional con un total de 15 preguntas de las 25 iniciales. El análisis factorial confirmatorio arroja adecuados índices de bondad de ajuste: RMSEA = 0,028, TLI = 0,90 y CFT = 0,92, que se traduce en que los indicadores miden en conjunto cada una de estas dimensiones, y en total, el riesgo de fragilidad como fue definido teóricamente en la creación de la escala con algunas modificaciones, tales como la exclusión de la dimensión cognitiva y de algunas preguntas que interrogan aspectos físicos principalmente.
Al evaluar la escala RAI-M buscando validez por convergencia en relación al IF, se observó una asociación significativa en un modelo logístico con un OR de 1,88 (IC: 1,28-2,74) y un poder de discriminación de 87% (IC: 0,81-0,92) con una sensibilidad de 78% y una especificidad de 85% para un punto de corte de 3.
En cuanto a la validez predictiva se observó asociación con prolongación de hospitalización, con un OR ajustado por patologías médicas y edad de 1,45 (IC: 1,01-1,88). No se asoció con rehospitalización.
Al evaluar el score como pronóstico de muerte a 9 meses, ajustado por edad, género, riesgo quirúrgico y carga de patología médica se encontró que solo el score RAI-M era estadísticamente significativo, HR = 1,58 (p = 0,013 IC: 1,10-2,27); este riesgo de morir explicado a través del score RAI-M dicotomizado en 3 o más puntos fue de HR = 4,98 (p = 0,029 IC: 1,17-2,13).
EFS
Muestra experimental de 151 pacientes, edad promedio fue de 73 +/- 7 años, distribución de 51% hombres y 49% mujeres, el porcentaje de pacientes clasificados como frágiles según Rockwood es de un 41%. Patologías reportadas por los pacientes se observan en la Tabla 2.
Tabla 2 Grupo de validación EFS
Total de pacientes | 151 |
Edad | 73 ± 7 años |
Distribución por sexo | 51% hombre y 49% mujeres |
Fragilidad por Rockwood | 41% |
Comorbilidades | HTA: 54% |
DM: 18% | |
Cáncer: 38% | |
EPOC: 5,9% | |
IAM: 2,6% | |
Angina: 1,3% | |
Insuficiencia cardíaca: 6,6% | |
Asma: 3,3% | |
Artritis: 15,2% | |
ACV: 4,6% | |
ERC: 3,3% |
En el análisis de su constructo se observó una estructura de un factor con buenos índices de bondad de ajuste RMSEA = 0,01, CFI = 0,99 y TLI = 0,99. Se eliminaron los ítem 5 (¿Cuando usted necesita ayuda, puede contar con alguien que esté dispuesto y disponible para atender sus necesidades o problemas?), ítem 7 (En ocasiones, ¿se le olvida tomarse los medicamentos?) y el ítem 10 (¿Tiene algún problema con el control para orinar, es decir, puede contener la orina si así lo desea?) por tener bajo peso factorial menor de 0,3. Al evaluar el modelo sin retirar los 3 ítems mencionados para mantener la estructura original se conservan los buenos índices de bondad de ajuste.
La concordancia interna es de 0,66 para EFS con 8 ítems (y de 0,64 con 11 ítems originales).
Como evidencia de validez por convergencia para el EFS con 8 ítems se observó una asociación significativa en un modelo logístico con un OR de 2,3 (IC 95%: 1,7-3,0), con un poder de discriminación de un 88% (IC 95%: 0,82-0,93), y con una sensibilidad de 79% y especificidad de 81% para un punto de corte de 5 puntos o más.
En cuanto a la validez predictiva no se observó asociación con prolongación de hospitalización o con rehospitalización. Al evaluar el score EFS como variable pronóstico de muerte a 9 meses a través de un modelo de riesgos proporcionales de Cox se observó que EFS es estadísticamente significativa con un HR = 1,56 (p = 0,004 IC: 1,15-2,12).
Discusión
La fragilidad ha demostrado ser un importante factor predictor de desenlaces adversos en el ámbito del paciente quirúrgico. Se evaluaron distintas herramientas para determinar fragilidad en el contexto periquirúrgico, en busca de un instrumento que midiera las dimensiones de fragilidad en forma rápida, sencilla y sin pruebas físicas o cognitivas, tratando de acercarnos a la valoración geriátrica integral.
RAI-M muestra concordancia interna adecuada en las distintas dimensiones a evaluar; tiene evidencia de validez de constructo con la modificación a 4 dimensiones; validez por convergencia con el IF de Rockwood y con EFS. Muestra una asociación predictiva con desenlaces de interés como mortalidad y prolongación de la hospitalización.
EFS, cumple con las características deseables de una herramienta de evaluación en el contexto peri-quirúrgico, excepto por la necesidad de realizar pruebas físicas y cognitivas, obtuvo buenos resultados en su validez de constructo, pero 3 ítems se descartan en el análisis clásico. Muestra evidencia de validez por convergencia con el estándar de oro.
Las preguntas que evaluaron cognición fueron eliminadas porque no aportaba en la escala de fragilidad, esto nos llamó la atención por la correlación ya conocida entre fragilidad y deterioro cognitivo21, pensamos que puede deberse a que los pacientes no reconocen sus déficits cognitivos en etapas iniciales, por lo que la pregunta hecha al paciente tiene poca validez, en nuestro análisis secundario, hubo mejor correlación de las respuestas que evalúan este dominio cuando se hacía la pregunta al familiar/cuidador. Se evidenció que las fallas más complejas de las actividades instrumentales (apoyo en manejo de fármacos y dinero), son poco sensibles para detectar fragilidad, a diferencia de la afectación en las actividades básicas de la vida diaria. La única actividad básica que no se asoció a fragilidad fue la incontinencia urinaria, probablemente porque su frecuencia en AM es aproximadamente un 30%, principalmente mujeres y no reflejan necesariamente vulnerabilidad a menos que aparezca tardíamente en contexto de alguna enfermedad neurodegenerativa o por alteración funcional.
La fragilidad es un continuo entre el paciente robusto y el frágil, es probable que con las herramientas que estamos utilizando actualmente para medirla, así como los desenlaces que estamos evaluando, como son muerte y hospitalización, no logren detectar cambios menores en este continuo. Esto no significa que alteraciones de memoria y de funcionalidad no se asocien a fragilidad, simplemente que la forma en que la estamos midiendo permite detectar al paciente en un estado más avanzado de fragilidad cuando efectivamente está en riesgo de morir o de hospitalizarse.
Estos resultados, para el caso de una cirugía pueden ser adecuados en términos de pronóstico, sin embargo, no ha sido evaluada para el seguimiento tras una intervención de los pacientes que clasifica como frágiles.
Sabemos que fragilidad no es lo mismo que alteración funcional ni comorbilidad, aunque hay ocasiones en que pueden sobreponerse22, lo cual se corrobora en nuestros resultados, tal como muestra el modelo que evalúa mortalidad ajustado por patología médica, la fragilidad medida por nuestra escala se asocia significativamente con este desenlace en forma independiente.
Dentro de las limitaciones del estudio podemos mencionar que no se evaluó el posible deterioro funcional que podrían presentar los pacientes frágiles posterior a una cirugía, lo cual sería interesante analizar en estudios posteriores.
Actualmente estamos en proceso de evaluación de nuestra herramienta en distintas poblaciones y así poder dar más evidencia de validez externa.
En conclusión, la escala RAI-M es una herramienta corta y de fácil aplicación para detectar fragilidad en un contexto preoperatorio. Debe ser evaluado tanto su validez externa en otros centros, como la posibilidad de utilizarla en otros contextos clínicos.