Las demencias son una de las principales causas de disfuncionalidad y dependencia en la adultez mayor1–3. Se estima que, en Chile, del 51% de las personas mayores que presenta situación de discapacidad, el 38,8% corresponde a demencia4. En este escenario, las demencias han sido declaradas línea prioritaria de investigación, con foco en la prevención y el diagnóstico oportuno5.
Dado el carácter clínico del diagnóstico, los profesionales necesitan contar con diversas fuentes de información para establecer adecuadamente la presencia del cuadro. Es por ello que los tests de screening neuropsicológico resultan fundamentales, dado que juegan un rol importante en la detección del deterioro cognitivo, en la caracterización clínica de éste y en la planificación de las intervenciones6–10.
En Chile, el Ministerio de Salud ha establecido un sistema de diagnóstico y tratamiento de las demencias en la red asistencial. El sistema instruye el diseño y la actualización de los protocolos de psicodiagnóstico y evaluación neuropsicológica a nivel primario y secundario. En concreto, plantea la necesidad de ampliar la aplicación del examen de medicina preventivo del adulto mayor (EMPAM), mejorando su eficacia y eficiencia5,11.
El EMPAM, considera la aplicación del Mini Mental State Examination abreviado (MMSE) como evaluación de las habilidades cognitivas12 para la detección temprana de demencia. Diversos estudios dan cuenta de los problemas del MMSE como prueba de tamizaje cognitivo de las demencias. Dentro de estas dificultades se encuentran: baja sensibilidad para detectar etapas iniciales13–15; escasa utilidad diagnóstica en atención primaria13,14; dificultades para detectar demencias distintas a Alzheimer15; puntajes de corte imprecisos que llevan a clasificaciones diagnósticas inexactas16 y limitadas evidencias de validez de generalización, siendo afectada por elementos socioculturales17. En este escenario, y considerando la importancia del diagnóstico temprano, se hace necesaria la actualización de las guías clínicas del EMPAM, referidas a la evaluación cognitiva.
El Addenbrooke's Cognitive Examination (ACE) es la prueba que ha mostrado consistentemente mayor sensibilidad y valor predictivo para detectar demencias en etapa temprana, mostrando evidencias de validez en diversos contextos clínicos y socioculturales18–20. Su tercera versión (ACE-III) presenta diversas ventajas, de las que se destacan: propiedades psicométricas adecuadas para la detección de la disfunción cognitiva en dos de los trastornos demenciales de mayor prevalencia21; niveles de sensibilidad y especificidad superiores a MMSE, ACE-R, MoCA y RUDAS, incluso en poblaciones con diferentes niveles educativos22; mayor sensibilidad que MMSE y MoCA para detectar cambios en la actividad ocupacional23; mayor capacidad discriminativa que MMSE para detectar alteraciones de los sistemas de memoria24 y niveles de sensibilidad y especificidad adecuados para la detección de demencia de inicio temprano25,26.
A pesar de la evidencia acumulada, la mayoría de estos estudios han contado con tamaños muestrales reducidos y han evaluado su utilidad diagnóstica mediante la técnica Receiver Operating Characteristic (ROC) por lo que no han dado cuenta de su fiabilidad y su validez referida a la estructura interna.
La validez referida a la estructura interna es fundamental, ya que pone en relieve el grado en el que las relaciones entre los elementos de la prueba se corresponden con un constructo o habilidad latente. Las técnicas comúnmente utilizadas con este propósito corresponden al Análisis Factorial Confirmatorio (AFC), el cual estudia la dimensionalidad de un conjunto de ítems, o modelo de Teoría de Respuesta a los Ítems (TRI), que además de entregar indicadores de fiabilidad, es el paso previo para el Análisis de Funcionamiento Diferencial27,28. El presente estudio tuvo por objetivo evaluar las propiedades psicométricas del ACE-III desde un paradigma contemporáneo de validez29,30. Se analizó su estructura factorial, su fiabilidad desde un modelo TRI y su utilidad diagnóstica en el contexto de atención primaria en salud, en una amplia muestra de población general y clínica.
Materiales y Método
Diseño, procedimiento y participantes
El estudio fue aprobado por el Comité de Ética Científica de la Universidad Católica del Norte, bajo resolución 004/2018. Se obtuvo consentimiento y/o asentimiento informado de todos los participantes de la investigación.
La muestra estuvo compuesta por 1.164 personas de 60 o más años de edad. Todas ellas facultadas para leer y escribir. Se conformaron dos grupos: a) población general (n = 1.101): incluyó a personas sin diagnósticos médicos que pudiese afectar el rendimiento cognitivo, reclutadas por medio de los canales formales de comunicación del Servicio Nacional del Adulto Mayor y en agrupaciones de personas mayores. b) población clínica (n = 63): incluyó a personas diagnosticadas y tratadas por demencia, reclutadas en los Centros de Salud Familiar (CESFAM) de la región. El diagnóstico de la enfermedad debía estar confirmado en atención de especialidad (geriatría, neurología o psiquiatría) y adecuadamente registrado en la ficha clínica del CESFAM. Las derivaciones al equipo de investigación fueron realizadas por el personal médico de CESFAM. Las personas debían presentar puntuaciones iguales o superiores a 4 puntos en el Global Deterioration Scale (GDS). No se consideró el tiempo de evolución de la enfermedad, debido a la no equivalencia en el momento del diagnóstico y a la heterogeneidad inter-sujeto del curso del deterioro cognitivo.
Para ambos grupos, se consideraron como criterios de exclusión: la presencia de alteraciones de consciencia y/o alteraciones sensoriales severas (sin corrección), así como la presencia de alteraciones médicas, distintas de demencia, que podrían afectar el rendimiento cognitivo.
Se determinó como criterio de suspensión de la evaluación, la presencia de problemas en la comprensión lingüística, distintos a alteraciones de conciencia. Esta situación se presentó en tres ocasiones siendo excluidos de la muestra, considerando las medidas éticas pertinentes.
Instrumento
ACE-III es una prueba heteroaplicada de rendimiento óptimo. Se utilizó la versión chilena del test21 que consta de 81 ítems y está compuesta por cinco subescalas: atención (18 puntos), memoria (26 puntos), fluencias verbales (14 puntos), lenguaje (26 puntos) y habilidades visoespaciales (16 puntos), siendo 100 el puntaje máximo total. Según su último reporte (n = 240)21, el test presenta adecuada fiabilidad (α = 0,87) estableciendo 86 puntos (sensibilidad 98,5% y especificidad de 82%) como puntuación de corte para la detección de demencia21.
Análisis de datos
Los análisis fueron llevados a cabo mediante diversas técnicas. Para la caracterización de la muestra se utilizó estadística descriptiva. La estructura interna se evalúo mediante AFC utilizando el método de estimación Mínimos Cuadrados Ponderados Robustos (WLSMV), disponible en el software Mplus v.8. Este corresponde al método de estimación recomendado para variables dicotómicas.
Los análisis TRI fueron realizados mediante el software IRTPRO v.431, utilizando como métodos de estimación el de máxima verosimilitud conjunta. Para la calibración se ha utilizado el modelo TRI de 2 parámetros, estimando los parámetros de dificultad y discriminación. Para la evaluación del ajuste global de los modelos, se obtuvo el estadístico M232. Debido a que este estadístico ha mostrado ser liberal frente a ciertas condiciones33 se complementó el análisis con el estadístico RMSEA, el cual es calculado a partir de M2. Finalmente, se estimó la sensibilidad y especificidad de la prueba mediante curva ROC en SPSS v.25.
Resultados
Datos sociodemográficos
La Tabla 1 resume algunos datos demográficos de los participantes divididos entre el grupo general y el grupo clínico. No se encontraron diferencias significativas para edad (t1162 = 0,516; p > 0,05), pero si para años de escolaridad (t66,403 = 5.818; p < 0,05). Las medidas de asociación no mostraron relación entre diagnóstico de demencia con sexo
Tabla 1 Descriptivos para sexo, estado civil, edad y años de escolaridad
General | Clínica | Total | |||||
---|---|---|---|---|---|---|---|
n | % | n | % | n | % | ||
Sexo | Hombre | 288 | 26,2 | 19 | 30,2 | 307 | 26,4 |
Mujer | 810 | 73,8 | 44 | 69,8 | 854 | 73,6 | |
Estado civil | Soltero/a | 151 | 13,9 | 8 | 17,4 | 159 | 14,0 |
Casado/a | 496 | 45,5 | 15 | 32,6 | 511 | 45,0 | |
Viudo/a | 311 | 28,5 | 20 | 43,5 | 331 | 29,1 | |
Separado/a | 64 | 5,9 | 2 | 4,3 | 66 | 5,8 | |
Divorciado/a | 55 | 5,0 | 1 | 2,2 | 56 | 4,9 | |
Conviviente | 12 | 1,1 | 0 | 0,0 | 12 | 1,1 |
General | Clínica | Total | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
M | SD | Min | Max | M | SD | Min | Max | M | SD | Min | Max | |
Edad | 71,8 | 7,9 | 56 | 101 | 80,9 | 7,6 | 62 | 94 | 72,3 | 8,1 | 56 | 101 |
Años de escolaridad | 10,9 | 4,6 | 0 | 25 | 6,9 | 5,4 | 0 | 18 | 10,7 | 4,8 | 0 | 25 |
Análisis Factorial Confirmatorio (AFC)
Para este análisis no fue considerada la subescala de Fluencias verbales, ya que sólo consta de dos ítems. El ajuste de los modelos se realizó sobre la muestra total dada la naturaleza continua y progresiva de la variable latente34. Hemos especificado modelos unidimensionales, tanto para la prueba total como para cada subescalas. Las medidas de ajuste global de los modelos son presentadas en la Tabla 2.
Tabla 2 Índices de ajuste para los modelos AFC
Modelos | χ2 | gl | p | CFI | TLI | RMSEA | |
---|---|---|---|---|---|---|---|
1. ACE Global | 6966.780 | 3.402 | 0,000 | 0,945 | 0,944 | 0,030 | |
1.a. Orientación | 76.681 | 35 | 0,001 | 0,995 | 0,994 | 0,032 | |
1.b. Atención | 109.800 | 20 | 0,000 | 0,983 | 0,977 | 0,062 | |
1.c. Memoria | 1377.892 | 297 | 0,000 | 0,958 | 0,954 | 0,056 | |
1.d. Lenguaje | 783.545 | 252 | 0,000 | 0,968 | 0,964 | 0,043 | |
1.e. Visoespacial | 239.134 | 65 | 0,000 | 0,982 | 0,979 | 0,048 |
Como es posible observar, los índices de ajuste CFI y TLI muestran una falta de ajuste de la prueba global (< 0,95). Dado estos resultados, hemos ajustado modelos unidimensionales para cada subescala por separado. Para el caso de la subescala atención
Los resultados del ajuste para la subescala consideradas muestran un ajuste excelente (CFI > 0,95; TLI > 0,95 RMSEA < 0,06) para las subescalas orientación (1.a.), memoria (1.c.), lenguaje (1.d.) y habilidades visoespaciales (1.e.), y un ajuste no del todo adecuado (RMSEA < 0,06) para la subescala atención (1.b.).
Teoría de Respuesta al Ítem (TRI)
La Tabla 3 muestra que la subescala Atención es la única que presenta un claro desajuste (RMSEA > 0,08). El resto de las subescalas obtienen valores de RMSEA aceptables. El estadístico de ajuste local (S - χ2) muestra que Atención es la subescala que presenta mayor número de ítems con desajuste al modelo TRI (6 de 8). El resto de las subescalas presenta un número considerablemente reducido de ítem con desajuste (orientación = 1 de10; memoria = 4 de 26; lenguaje = 1 de 24 y habilidad viso-espacial = 4 de 13), los cuales no comprometen el ajuste global de cada subescala. Un reporte detallado de los análisis TRI son presentados en un artículo en elaboración por los autores.
Variables demográficas y rendimiento en el ACE-III
Para estudiar la relación entre el rendimiento de las personas en el ACE-III y algunas características demográficas, hemos estudiado la relación de las puntuaciones del test con el sexo, edad y años de escolaridad. Los resultados se presentan en las Tablas 4 y 5.
Tabla 4 Comparación entre por sexo en la puntuaciones de ACE-III
Hombre | Mujer | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
M | D.T. | Min. | Max. | M | D.T. | Min. | Max. | t | valor-p | |
ACE-III Total | 75,69 | 20,36 | 2 | 100 | 76,10 | 19,32 | 0 | 99 | -0,316 | 0,752 |
Orientación | 8,79 | 2,18 | 0 | 10 | 8,77 | 2,03 | 0 | 10 | 0,144 | 0,885 |
Memoria | 18,54 | 6,56 | 0 | 26 | 18,69 | 6,49 | 0 | 26 | -0,359 | 0,720 |
Atención | 5,95 | 1,88 | 0 | 8 | 5,51 | 1,89 | 0 | 8 | 3,437 | 0,001 |
Visoespacial | 12,16 | 3,48 | 0 | 15 | 12,44 | 3,00 | 0 | 15 | -1,235 | 0,217 |
Lenguaje | 21,26 | 5,46 | 0 | 26 | 21,39 | 5,29 | 0 | 26 | -0,364 | 0,716 |
Fluencias | 8,99 | 3,75 | 0 | 14 | 9,30 | 3,40 | 0 | 14 | -1,251 | 0,191 |
Tabla 5 Correlaciones entre ACE-III con escolaridad y edad
Escolaridad (años) | Edad | |
---|---|---|
ACE-III Total | 0,481* | -0,037 |
Orientación | 0,340* | -0,035 |
Memoria | 0,405* | -0,026 |
Atención | 0,417* | -0,029 |
Visoespacial | 0,388* | -0,042 |
Lenguaje | 0,462* | -0,022 |
Fluencias | 0,463* | -0,054 |
*p < 0,05.
El estadístico t de student muestra que no existen diferencias significativas de ninguna de las puntuaciones entre hombres y mujeres, a excepción de las puntuaciones de la subescala de atención (Tabla 4). Esta diferencia no es concluyente y debe ser interpretada con cautela debido al desajuste a la unidimensionalidad de esta subescala reportada anteriormente.
Respecto a la edad, años de escolaridad y las puntuaciones del ACE-III (Tabla 5), existen correlaciones significativas y moderadas entre años de escolaridad y las puntuaciones de ACE-III, lo cual es compatible con la hipótesis de reserva cognitiva. Por el contrario, no se encontraron correlaciones con edad.
Utilidad diagnóstica
La Tabla 6 y la Figura 1 presentan los resultados obtenidos a través del análisis de curva ROC. Para la variable estado, hemos considerado los grupos conformados por muestra general y clínica descritos en el apartado de Materiales y Método. La subescala de orientación y memoria, obtienen las mayores proporciones de área bajo la curva, en torno a 0,95. En contraparte, la subescala con proporción de área menor corresponde a atención, obteniendo una proporción sensiblemente por debajo de 0,90. En la Figura 1 es posible observar que las curvas que se encuentran más cercanas al vértice superior izquierdo corresponden a Orientación y Memoria (ACE M-O).
Tabla 6 Análisis con curvas ROC para el ACE-III
Área bajo la curva | Punto de corte | Sensibilidad | Especificidad | Intervalo de confianza al 95% | |
---|---|---|---|---|---|
Orientación | 0,945 | ≤ 8 (10) | 0,952 | 0,814 | 0,911; 0,979 |
Atención | 0,840 | ≤ 6 (8) | 0,952 | 0,414 | 0,794; 0,886 |
Memoria | 0,958 | ≤ 14 (26) | 0,968 | 0,832 | 0,943; 0,972 |
Lenguaje | 0,902 | ≤ 23 (26) | 0,952 | 0,483 | 0,861; 0,943 |
Visoespacial | 0,933 | ≤ 11 (16) | 0,952 | 0,770 | 0,909; 0,957 |
Fluencias | 0,916 | ≤ 9 (14) | 0,984 | 0,512 | 0,885; 0,947 |
Total ACE | 0,958 | ≤ 66 (100) | 0,968 | 0,814 | 0,943; 0,972 |
Memoria/Orientación | 0,964 | ≤ 22 (36) | 0,984 | 0,835 | 0,950; 0,978 |
Se han determinado puntos de corte para cada subescala priorizando la sensibilidad en desmedro de valores altos de especificidad, debido a que resulta menos grave en términos sociosanitarios la presencia de falsos positivos que de falsos negativos, fundamentalmente por la utilidad clínica de la prueba como screening en atención primaria de salud y la indicación técnica de que todo diagnóstico debe ser confirmado en atención de especialidad.
Debido a que las subescalas de orientación y memoria han obtenido excelentes resultados tanto en el análisis de estructura factorial, como en el análisis TRI, se presentan los resultados de curva ROC para la puntuación de ambas subescalas combinadas. La Figura 2 compara las curvas de la puntuación total de ACE-III con las subescalas de orientación y memoria combinadas.

Figura 2 Comparación entre las curvas COR de ACE-III total y la combinación de las subescalas Memoria y Orientación (ACE M-O).
Las dimensiones de orientación y memoria combinadas alcanzan mayores niveles de sensibilidad y especificidad en un importante segmento de las puntuaciones. Este resultado es apoyado por la proporción de área bajo la curva expuesta en la Tabla 5. Se propone, para la detección de demencia en APS, 66 puntos como puntaje de corte para el test total (sensibilidad = 0,968 y especificidad = 0,814) y 22 puntos como puntaje de corte para ACE M-O (sensibilidad = 0,984 y especificidad = 0,835).
Discusión
Los resultados apoyan la utilización de ACE-III como una medida válida, confiable y útil para la detección clínica de demencia, lo cual es coherente con estudios previos21,22,24–26. Así también lo es la relación encontrada entre niveles escolaridad, como medida de reserva cognitiva y la presencia/ausencia de diagnóstico38–40.
Se destacan algunas contribuciones novedosas, las que no han sido reportadas en estudios previos. Los resultados apoyan la presencia de dos factores para la subescala de atención, lo que sugiere dividir dicha dimensión separando los ítems de orientación y atención. Esto sería técnicamente más adecuado que la utilización de una puntuación única. El resto de las dimensiones, a excepción de atención, presentan un ajuste adecuado a la unidimensionalidad. Estos hallazgos apoyan la necesidad planteada en literatura previa41 de elaborar perfiles de puntuación que den cuenta de trayectorias diferenciales de deterioro según dominio cognitivo comprometido.
En cuanto a la utilidad diagnóstica, los indicadores de sensibilidad y especificidad muestran tazas de acierto adecuadas, similares o incluso mejores a estudios previos21,22,24,25. A diferencia de éstos, se propone la utilización de puntuaciones de corte que priorizan los niveles de sensibilidad de la prueba, considerando los lineamientos clínicos y técnicos para el diagnóstico presuntivo de demencia en APS.
Las diferencias en las puntuaciones de corte obtenidas en este estudio, comparadas con trabajos previos, pueden tener relación con las características de la muestra. El muestreo se llevó a cabo directamente en la comunidad, alcanzando un gran número de personas, obteniendo una tasa de prevalencia similar a la estimada para la enfermedad en población general, logrando capturar de mejor forma las características de la población que recibe atención por el diagnóstico presuntivo en APS. Esta validez externa pudo haber incorporado mayor variabilidad en el continuo de deterioro normal a patológico, lo cual es difícilmente diferenciable mientras no haya compromiso de funcionalidad instrumental y básica reportado y/o aparente. Estos resultados exponen la necesidad de reflexionar sobre la conformación de los grupos en estudios de validez clínica.
Adicionalmente, los resultados apoyan el uso combinado de las subescalas de Orientación y Memoria como un indicador alternativo del ACE-III. Éste sería una opción de screening más eficiente en la detección temprana de demencia, pudiendo ser aplicada por profesionales no especialistas en APS. Se sugiere que ACE M-O reemplace a MMSE como prueba de evaluación cognitiva en el diagnóstico funcional dentro del examen EMPAM. Esta propuesta concuerda con la evidencia previa acerca de los problemas de sensibilidad de MMSE para la detección temprana de demencia13–15.
Finalmente, los análisis TRI de todas las subescalas, plantean la necesidad de realizar análisis más detallados de los ítems con funcionamiento inadecuado. Esto permitiría elaborar propuestas de modificación del instrumento, lo que a su vez mejoraría las propiedades psicométricas globales. Se debe continuar el trabajo en una versión revisada, que considere los hallazgos psicométricos y las consideraciones clínicas obtenidas en el proyecto FONIS SA18I0014, aspectos que escapan del alcance de este manuscrito.