Según la encuesta nacional de salud de Chile, más de 12% de la población adulta tiene diabetes, porcentaje que aumenta a 25% en personas con menor educación1. La retinopatía diabética (RD) es una complicación frecuente de la diabetes, siendo una de las primeras causas de discapacidad visual en personas en edad laboral2.
En Latinoamérica, hasta 40% de los pacientes diabéticos tiene algún grado de RD y 17% requiere tratamiento3. Un centro de atención primaria en Chile reportó que 6% de los pacientes diabéticos tipo 2 tenía RD severa requiriendo tratamiento láser4. Entre los factores de riesgo de RD se encuentran la edad, duración de la diabetes, control glicémico, y comorbilidades cardiovasculares5. Importantemente, la historia de inasistencia al tamizaje es un predictor de lesiones severas que requieren derivación a oftalmólogo6.
El tamizaje de RD mediante fotografía digital ha logrado disminuir la incidencia de la discapacidad visual en aquellos países donde el diagnóstico oportuno y el tratamiento precoz de las lesiones detectadas están garantizados2,7. En Chile, la guía AUGE/GES de RD del Ministerio de Salud establece el examen anual de fondo de ojo con pupila dilatada por oftalmólogo a pacientes diabéticos tipo 1 a partir de los 12 años de edad o al 5° año del diagnóstico y a los con diabetes tipo 2 a partir del diagnóstico8. Sin embargo, considerando información recolectada en el Servicio de Salud Metropolitano Sur Oriente (SSMSO) el año 2014, la cobertura del tamizaje solo llegaba a 21%9. Similar a lo observado en otro estudio nacional10. La baja cobertura del tamizaje junto al aumento sostenido de diabetes en Chile y al envejecimiento poblacional, hacen imperativo la búsqueda de alternativas que aumenten el acceso y la cobertura del tamizaje.
En el sistema público de atención de salud chileno, las Unidades de Atención Primaria Oftalmológica (UAPOs) son responsables de realizar los controles oftalmológicos de pacientes con diabetes11. Tecnólogos médicos toman fotografías digitales de retina que luego son evaluadas y clasificadas por oftalmólogos mediante telemedicina12. Si bien las UAPOs facilitan el acceso a la toma de fotografía, esta estrategia de tamizaje aún depende de la disponibilidad de un oftalmólogo lo que dificulta su implementación y eleva sus costos13.
En el SSMSO, basado en programas de tamizaje de países desarrollados7,14, se ha implementado una estrategia de tamizaje en que tecnólogos médicos en oftalmología entrenados para este programa, realizan la toma de fotografías retinales, su evaluación inmediata y la derivación pertinente de los casos positivos a la confirmación diagnóstica y tratamiento por oftalmólogos9. Si bien la precisión de esta estrategia no ha sido evaluada9, la prevalencia y distribución de RD es similar a la reportada por estudios de tamizaje realizado por oftalmólogos por telemedicina10,15.
En el año 2018 se comenzó a implementar en algunos Servicios de Salud un sistema de clasificación inicial de las fotografías retinales mediante un software de inteligencia artificial llamado Diagnóstico Automatizado de Retinografías Telemáticas (DART) que clasifica las fotografías como alteradas o normales (positivas o negativas)16. Aquellas fotografías clasificadas inicialmente como alteradas por DART deben ser evaluadas por un oftalmólogo quien revisa las fotografías de forma telemática y decide la conducta a seguir de acuerdo al grado de RD observado en la fotografía. Esta estrategia de tamizaje, entonces, tiene dos etapas, un triage inicial (DART) que reduce la cantidad de fotografías a evaluar por el oftalmólogo a través de telemedicina, y una segunda etapa en la cual el oftalmólogo realiza el tamizaje propiamente tal16. El único artículo sobre DART reporta distintas precisiones a través del manuscrito, y no explicita los puntos de corte utilizados17.
El objetivo de este estudio fue estimar la exactitud diagnóstica de DART y de la estrategia utilizada en el SSMSO con tecnólogos médicos, para detectar RD y compararla con el diagnóstico establecido por oftalmólogos evaluando clínicamente a los participantes con lámpara de hendidura.
Pacientes y Método
Estudio observacional (no-experimental) de corte transversal que incluyó una muestra consecutiva de pacientes con diabetes que se realizaron el tamizaje de RD en el Centro de Diagnóstico y Tratamiento (CDT) del Hospital Dr. Sótero del Río (HSR) entre el 01 de julio y el 31 de agosto del 2019. El estudio se desarrolló de acuerdo con la Declaración de Helsinki y fue aprobado por el Comité de Ética del SSMSO. Los participantes firmaron un consentimiento informado.
El tamizaje de RD se realiza en el CDT del HSR en aquellos pacientes con diabetes de las comunas pertenecientes al SSMSO que no cuentan con UAPOs, pacientes que se controlan su diabetes en el nivel secundario de atención y pacientes que son derivados desde alguna UAPO de la red por una fotografía retinal con sospecha de RD. El tecnólogo médico no cuenta con las fotografías sospechosas en caso de ser pacientes derivados desde una UAPO. Todos los pacientes, independiente de su centro de referencia, son sometidos a la misma evaluación explicada más adelante.
A los participantes se les realizó una encuesta socio-demográfica y clínica. Luego se procedió a la toma de las fotografías con pupilas dilatadas (midriasis con tropicamida 1% y fenilefrina 2,5%) por tecnólogos médicos del CDT. Las fotografías fueron tomadas según las instrucciones del manual de DART que especifica la toma de al menos dos fotografías: una foto temporal, donde la papila quede lo más al costado posible y se alcance a ver completamente la emergencia de los vasos y una foto nasal, donde se sitúa la papila hacia el otro costado, pero dejando a lo menos un diámetro papilar desde el borde de la foto. El tecnólogo médico tuvo la libertad de tomar más fotografías si lo considerase necesario. Las fotos fueron tomadas usando el retinógrafo digital Polaroid 45° (Canon CR2).
Después de tomadas las fotos, el tecnólogo médico evaluó y clasificó las fotografías de cada ojo usando el sistema simplificado elaborado por la Academia Americana de Oftalmología (AAO)18 en sin RD, retinopatía diabética no proliferativa (RDNP) leve, RDNP moderada, RDNP severa y RD proliferativa. Luego, las fotografías fueron subidas a la plataforma DART para su evaluación centralizada. Si el tecnólogo medico tomó más de dos fotografías, éstas también fueron agregadas a la plataforma DART. Posteriormente, todos los participantes fueron evaluados por un oftalmólogo del HSR usando una lámpara de hendidura para examinar el fondo del ojo. El oftalmólogo se encontraba en una sala independiente, por lo que era ciego a la impresión diagnóstica del tecnólogo médico y de DART. Así mismo, ambos exámenes de tamizaje fueron ciegos al resultado de la confirmación diagnostica y al otro examen de tamizaje. Luego de la toma de fotografía los participantes debían permanecer en la sala de espera hasta ser llamados para su segunda evaluación. Aquellos participantes que se retiraron antes del examen de referencia fueron excluidos del análisis.
Se calculó la sensibilidad, y especificidad de cada examen de tamizaje con sus intervalos de confianza a 95%. Se utilizó un solo ojo por participante (el peor ojo) para graduar la severidad de la RD. Se consideró como punto de corte de la RD casos con RDNP severa según oftalmólogo. Esta definición se basó en que son estos pacientes a quienes se les ofrece una intervención oftalmológica para cambiar el curso natural de la enfermedad. El punto de corte para considerar ambos examenes de tamizaje como positivo fue RDNP moderada. Se evaluó también un punto de corte más sensible (RDNP leve) pero solo para la estrategia del SSMSO ya que DART no entrega la información necesaria para calcular este punto de corte. DART tampoco revela el porcentaje de fotografías clasificadas como no evaluables. Las fotografías no evaluables para ambas estrategias fueron incluidas dentro de la definición de “tamizaje positivo”.
Resultados
Durante el estudio, 510 participantes firmaron el consentimiento informado y contestaron la encuesta, de ellos 492 fueron evaluados por el TM y sus fotos subidas a la plataforma DART. El 75,4% (n = 371) de los participantes con fotografías, también fueron evaluadas con el estándar de referencia, el resto de los participantes no esperó la evaluación por el oftalmólogo por lo que fueron excluidos (Figura 1). No hubo diferencias significativas entre los participantes con o sin confirmación diagnóstica, excepto en la positividad de DART que fue menor en el grupo con confirmación diagnóstica (50% versus 64%, valor-p = 0,01).
El promedio de edad de la muestra fue 61 años y 60,9% de ellos fueron mujeres (Tabla 1). La mayoría de los participantes pertenecían a consultorios de la comuna de La Granja (n = 236; 63,6%), comuna que deriva a todos los pacientes al HSR para su tamizaje de RD. El 11% (n = 42) de los participantes eran controlados en el nivel secundario de atención. Solo 7,5% de la muestra (n = 28) fueron pacientes derivados por fotografía retinal alterada. Respecto a la información clínica, 29,6% de los participantes no sabía su tipo de diabetes. Entre los participantes que refirieron su tipo de diabetes, 77,4% dijo tener diabetes tipo 2. La mediana reportada de duración de la diabetes fue 6 años, con 58,4% de la muestra con una duración mayor de 5 años. Solo 17,5% (n = 65) recordaba su última HbA1c con un promedio de 7,8%.
Tabla 1 Características socio-demográfica de la muestra con confirmación diagnóstica
Característica | Participantes (n = 371) | |||
---|---|---|---|---|
Mujeres, si | n (%) | 226 | (60,9) | |
Edad en años | promedio ± de | 61,0 | ± 13,9 | |
Comuna de residencia | ||||
La Granja | n (%) | 236 | (63,6) | |
Puente Alto | n (%) | 69 | (18,6) | |
San José de Maipo | n (%) | 23 | (6,2) | |
Pirque | n (%) | 20 | (5,4) | |
La Florida | n (%) | 9 | (2,4) | |
La Pintana | n (%) | 7 | (1,9) | |
San Ramón | n (%) | 7 | (1,9) | |
Duración diabetes en años (n = 353) | mediana [IQR] | 6,0 | [2,0-12,0] | |
HbA1c(%) (n = 65) | promedio ± de | 7,8 | ± 2,1 | |
Uso insulina, si | n (%) | 111 | (29,9) | |
Hipertensión, si | n (%) | 246 | (66,3) | |
Dislipidemia, si | n (%) | 198 | (53,4) | |
Tabaco, si | n (%) | 82 | (22,1) | |
Complicaciones crónicas diabetes | ||||
Diálisis | n (%) | 13 | (3,5) | |
Amputación | n (%) | 9 | (2,4) | |
Retinopatía tratada con láser | n (%) | 11 | (3,0) |
de: desviación estándar; IQR: rango intercuartil.
La Figura 2 muestra la distribución de RD según severidad en el peor ojo. El 75,9% (n = 281) de la muestra no tenía signos de RD en ninguno de sus ojos mientras que 9,2% (n = 34) de la muestra tenía al menos signos de RDNP severa. Si se excluyen los participantes con RD panfotocoagulada, el porcentaje de pacientes con RDNP severa o RD proliferativa fue de 5,1% (18/354).

Figura 2 Distribución de retinopatía diabética según evaluación por oftalmólogo (n = 370, un participante con opacidad de medios bilateral no pudo ser clasificado). RD: retinopatía diabética; RDNP: retinopatía diabética no proliferativa; RDP: retinopatía diabética proliferativa.
De los 371 participantes con confirmación diagnóstica, DART clasificó a 185 participantes (49,9%) como alterados en su evaluación automatizada. Estos 185 participantes se consideraron positivos para DART. Las fotografías de estos pacientes requerían una segunda evaluación por oftalmólogo por telemedicina para decidir la pertinencia de su derivación a confirmación diagnóstica. Sin embargo, estas evaluaciones no estuvieron disponibles hasta la escritura de este manuscrito, que fue 11 meses después. Por su parte, los tecnólogos médicos clasificaron como positivos a 62 (16,7%) participantes incluyendo 47 (12,7%) participantes con al menos RDNP moderada en un ojo y 15 (4,0%) participantes con fotografías no evaluables.
La Tabla 2 muestra la clasificación de los participantes según el oftalmólogo y ambos exámenes de tamizaje utilizando como punto de corte RDNP moderada. DART mostró una sensibilidad de 100% (IC95%: 90-100%) y una especificidad de 55,4% (IC95%: 50-61%) para detectar casos con al menos RDNP severa. Los tecnólogos médicos tuvieron una sensibilidad de 97,1% (IC95%: 85-100%) y una especificidad de 91,7% (IC95%: 88-94%) para detectar estos casos. El valor predictivo positivo de DART y los tecnólogos médicos fue de 18,5% y 54,1%, respectivamente. El valor predictivo negativo de DART y los tecnólogos médicos fue de 100% y 99,7%, respectivamente. El único caso de RD no identificado por los tecnólogos médicos fue un participante con una RD panfotocoagulada unilateral. Considerando un punto de corte más sensible para los tecnólogos médicos (al menos RDNP leve), su sensibilidad aumentó a 100% (IC95%: 90-100%) y su especificidad disminuyó a 74,4% (IC95%: 69-79%) para detectar casos de al menos RDNP severa.
Tabla 2 Rendimiento de exámenes de tamizaje para detectar RDNP severa o casos más graves según oftalmólogo
Examen de tamizaje (RDNP moderada o peor + fotografía no evaluable) | Examen de referencia: oftalmólogo (RDNP severa o peor) n = 370* | ||
---|---|---|---|
Positivo | Negativo | ||
DART | Positivo | 34 | 150 |
Negativo | 0 | 186 | |
Tecnólogo médico | Positivo | 33 | 28 |
Negativo | 1 | 308 |
*1 paciente fue clasificado como no evaluable en ambos ojos por el oftalmólogo (n=370). RDNP: retinopatía diabética no proliferativa.
Discusión
El uso de inteligencia artificial para automatizar el tamizaje de RD ha surgido como una estrategia para disminuir los costos y aumentar el acceso de los pacientes a los programas de tamizaje19. Sin embargo, como cualquier intervención, debe asegurar su seguridad, efectividad y reproducibilidad antes de ser utilizada en pacientes20. El objetivo de este estudio fue comparar los resultados de dos estrategias de tamizaje de RD actualmente utilizadas en el sistema público de salud en Chile, una de las cuales utiliza inteligencia artificial.
Las estrategias evaluadas en este estudio demostraron una alta sensibilidad para identificar casos de al menos RDNP severa. Sin embargo, la especificidad del tecnólogo medico fue significativamente superior a DART (92% vs. 55%), incluso cuando se utilizó el punto de corte de positividad más sensible (y menos especifico) del tecnólogo medico (74% vs. 55%). La baja especificidad de DART puede ser explicada por la ausencia de la segunda evaluación de las fotografías por oftalmólogos a través de telemedicina. Esta segunda evaluación podría haber disminuido el número de casos positivos que requerían confirmación diagnóstica, lo que mejoraría su especificidad. Sin embargo, este segundo filtro de derivación pudiera haber generado también una disminución de la sensibilidad de la estrategia. La demora en la entrega de resultados al igual que la falta de especificidad de DART -que se traduce en un alto número de falsos positivos - puede tener un impacto psicológico deletéreo en las personas disminuyendo la adherencia al tamizaje.
Una ventaja de la estrategia DART es que reduciría a 50,4% la carga de los oftalmólogos como tamizadores por telemedicina. Es decir, tendrían que mirar la mitad de las fotografías de fondo de ojo. Sin embargo, aún depende fuertemente de ellos. Considerando cifras del censo 201721, cada año habría más de 1,7 millones de personas de 15 años o más que requieren tamizaje de RD. Reducir la evaluación por oftalmólogos a 850.000 pacientes, si bien significativa, no es suficiente. Actualmente, existen otras estrategias de inteligencia artificial con mejor rendimiento que el demostrado por DART22, que podrían reducir la necesidad de evaluación oftalmológica sin transar la detección de casos de RD.
El sistema actualmente implementado en el HSR, no depende de oftalmólogos como tamizadores, entrega resultados inmediatos y deriva solo a 16,7% de los participantes a confirmación diagnostica. A diferencia de DART, no requiere que el tecnólogo medico traspase las fotografías desde la cámara retinal a un computador para luego subir las fotos a una plataforma, lo cual disminuye la eficiencia del tamizaje. El entrenamiento recibido por los tecnólogos médicos que clasifican las fotografías en el SSMSO es mayor al requerido por los tecnólogos médicos que solo toman fotografías en la estrategia DART. Sin embargo, es probable que el rendimiento de DART sea replicable por tecnólogos médicos con menor entrenamiento que los que realizan el tamizaje en el HSR.
Una limitación de este estudio fue que 24,6% de la muestra se retiró del hospital antes de realizarse la confirmación diagnóstica debiendo ser excluidos. Esta limitación pudo incidir en la estimación de la prevalencia de la RD en esta muestra, pero no en la estimación de la sensibilidad y especificidad ya que éstas son independientes a la prevalencia de la enfermedad.
La selección de un examen de tamizaje no solo depende de su capacidad de diferenciar población sana de la posiblemente enferma, sino que debe considerar el contexto donde se implementará, estando inserto en un programa que considere los principios básicos del tamizaje7. Un programa de tamizaje debe tener un objetivo y una población clara (qué queremos detectar y en quiénes), debe garantizar el acceso universal al examen de tamizaje, confirmación diagnóstica y tratamiento, y debe monitorizar periódicamente la calidad y el cumplimiento de metas para asegurar su costo-efectividad. Nos unimos al llamado de levantar datos locales acerca de la prevalencia de RD y cobertura del tamizaje23, para informar el desarrollo de un programa de tamizaje siguiendo las recomendaciones de la Asociación Panamericana de Oftalmología3. En la creación de este programa deben participar pacientes y personal de salud de todos los niveles de atención de salud reflejando el cuidado multidisciplinario que requieren las personas con diabetes.