Dyslexia detection using 3D convolutional neural networks and functional magnetic resonance imaging
Computer Methods and Programs in Biomedicine journal homepage: www.elsevier.com/locate/cmpb
Sofia Zahiaa,∗ , Begonya Garcia-Zapiraina , Ibone Saralegui b , Begoña Fernandez-Ruanovac
a eVida research laboratory, University of Deusto, Bilbao 48007, Spain b Department of Neuroradiology, Osatek, Biocruces-Bizkaia; Galdakao-Usansolo Hospital / Osakidetza, Galdakao 48960, Spain c Research and innovation Department, Osatek, Biocruces-Bizkaia; Osakidetza, Bilbao 48011, Spain
Resumen
Antecedentes y objetivos:
La dislexia es un trastorno de origen neurológico que afecta el aprendizaje de quienes la padecen, principalmente niños, y causa dificultades en la lectura y la escritura. Cuando no se diagnostica, la dislexia lleva a la intimidación y frustración de los niños afectados y también de sus círculos familiares.
En caso de que no se intervenga de manera temprana, los niños pueden llegar a la escuela secundaria con serias brechas de logros. Por lo tanto, los servicios de detección e intervención temprana para estudiantes disléxicos son altamente importantes y recomendados para apoyar a los niños en el desarrollo de una autoestima positiva y alcanzar su máxima capacidad académica.
Este artículo presenta un nuevo enfoque para el reconocimiento automático de niños con dislexia utilizando imágenes de resonancia magnética funcional.
Métodos: Nuestro sistema propuesto se compone de una secuencia de pasos de preprocesamiento para obtener las áreas de activación cerebral durante tres tareas de lectura diferentes. Se realizaron conversiones a volúmenes Nifti (Neuroimaging Informatics Technology Initiative: formato de archivo abierto comúnmente utilizado para almacenar datos de imágenes cerebrales obtenidos mediante métodos de Imágenes por Resonancia Magnética.), ajuste de movimiento de la cabeza, normalización y transformaciones de suavizado en las exploraciones de fMRI para llevar todos los cerebros de los sujetos a un único modelo que permitirá la comparación de vóxeles (El vóxel es la unidad cúbica que compone un objeto tridimensional. Constituye la unidad mínima procesable de una matriz tridimensional y es, por tanto, el equivalente del píxel en un objeto 2D) entre cada sujeto. Posteriormente, usando Mapas Paramétricos Estadísticos (SPMs), se crearon un total de 165 volúmenes 3D que contienen la activación cerebral de 55 niños. La clasificación de estos volúmenes se manejó utilizando tres Redes Neuronales Convolucionales 3D (3D CNN) paralelas, cada una correspondiente a una activación cerebral durante una tarea de lectura, y se concatenaron en las dos últimas capas densas, formando una única arquitectura dedicada a realizar una detección optimizada de la activación cerebral disléxica. Además, utilizamos el método de validación cruzada de 4 pliegues para evaluar la generalización de nuestro modelo y controlar el sobreajuste.
Resultados:Nuestro enfoque ha logrado una precisión promedio de clasificación del 72.73%, una sensibilidad del 75%, una especificidad del 71.43%, una precisión del 60% y una puntuación F1 del 67% en la detección de dislexia. **
Conclusiones: El sistema propuesto ha demostrado que el reconocimiento de niños disléxicos es factible utilizando el aprendizaje profundo y la resonancia magnética funcional al realizar tareas de lectura fonológica y ortográfica.
Introducción
La dislexia es una condición basada en el cerebro que impacta la lectura, escritura y ortografía. Es la discapacidad de aprendizaje más prevalente. La dislexia está definida por la clasificación internacional ICD-10 como “un trastorno cognitivo caracterizado por una capacidad deteriorada para comprender palabras o frases escritas e impresas a pesar de una visión intacta”. Desafortunadamente, la dislexia es un problema genético de por vida que tiende a repetirse en los miembros de la familia y puede llevar a la exclusión social de la persona afectada si no se aborda adecuadamente. Es necesario afirmar que la dislexia no tiene que ver con la inteligencia. Los niños con dislexia son tan inteligentes como otros niños con habilidades funcionales de lectura y escritura.
Investigaciones relacionadas han demostrado que la dificultad central de la dislexia indica un déficit en el sistema del lenguaje (teoría fonológica). Sin embargo, otras fuentes teóricas siguen siendo convincentes, como la teoría cerebelosa, la teoría del déficit visual magnocelular de la dislexia, la teoría del déficit de procesamiento temporal auditivo, y la teoría del déficit de atención visual.
Medir las habilidades fonológicas no distingue eficientemente a los disléxicos, que tienen dificultades para aprender a leer y traducir letras en fonemas, de todos los demás niños que no pueden leer por otras razones, como una enseñanza deficiente, estrés familiar general y falta de apoyo. Además, el seguimiento ocular anormal también ha sido sospechado erróneamente como una causa de los problemas de lectura. De hecho, las personas con poca o ninguna capacidad para mover los ojos aún pueden demostrar habilidades de lectura normales. Por lo tanto, se han realizado estudios para observar más de cerca las diferencias funcionales en la activación cerebral durante las tareas de lectura.
La resonancia magnética funcional (fMRI) ha sido utilizada extensamente para investigar las bases neurobiológicas de la dislexia. Diferentes estudios han demostrado que las personas con dislexia muestran patrones de activación cerebral anómalos en regiones que incluyen la corteza temporoparietal izquierda, la corteza occipitotemporal y la corteza frontal inferior izquierda durante tareas de lectura. Estas regiones se asocian con el procesamiento fonológico, la integración visuo-ortográfica y el reconocimiento de palabras, respectivamente. Estudios han confirmado consistentemente la reducción de la activación en estas áreas en individuos disléxicos en comparación con lectores típicos.
Metodología
Participantes
El estudio incluyó a 55 niños, de los cuales 27 fueron diagnosticados con dislexia y 28 fueron clasificados como lectores típicos. Todos los participantes eran hablantes nativos de inglés y no presentaban ninguna otra condición neurológica o psiquiátrica.
Adquisición de datos
Las imágenes de fMRI fueron adquiridas utilizando un escáner de 3T. Los niños realizaron tres tareas de lectura diferentes diseñadas para activar regiones cerebrales implicadas en el procesamiento fonológico y ortográfico. Las tareas consistían en la lectura de palabras reales, palabras no reales y una tarea de decisión léxica.
Preprocesamiento de datos
Las imágenes de fMRI fueron preprocesadas utilizando el software SPM12. Este proceso incluyó la conversión a volúmenes Nifti, la corrección por movimiento, la normalización y el suavizado espacial. Se generaron mapas de activación cerebral para cada tarea de lectura y para cada participante.
Clasificación utilizando Redes Neuronales Convolucionales 3D
Se diseñó una arquitectura de Red Neuronal Convolucional 3D (3D CNN) para clasificar los volúmenes de activación cerebral. La red consistía en múltiples capas convolucionales seguidas de capas densas, con una capa de salida que utilizaba una función de activación softmax para la clasificación binaria (disléxico vs. lector típico). Se implementaron tres redes paralelas, cada una correspondiente a una de las tareas de lectura, y sus salidas se concatenaron antes de la capa de salida final.
Validación cruzada
Se utilizó una validación cruzada de 4 pliegues para evaluar el rendimiento del modelo y controlar el sobreajuste. Los datos se dividieron en cuatro subconjuntos, y en cada iteración, tres subconjuntos se usaron para el entrenamiento y uno para la prueba.
Resultados
El modelo propuesto logró una precisión promedio del 72.73% en la clasificación de niños con dislexia. La sensibilidad, especificidad, precisión y puntuación F1 fueron del 75%, 71.43%, 60% y 67%, respectivamente. Estos resultados indican que la combinación de fMRI y técnicas de aprendizaje profundo puede ser efectiva para la detección de dislexia.
Discusión
La detección temprana y la intervención son cruciales para mitigar los efectos de la dislexia en el rendimiento académico y el bienestar emocional de los niños afectados. Este estudio proporciona una base para el desarrollo de sistemas de diagnóstico asistido por computadora que puedan apoyar a los profesionales en la identificación de la dislexia.
Conclusiones
El enfoque propuesto ha demostrado ser prometedor para la detección automática de la dislexia utilizando imágenes de fMRI y técnicas de aprendizaje profundo. La precisión de nuestro modelo sugiere que esta combinación puede proporcionar una herramienta efectiva para el diagnóstico temprano de la dislexia. Futuras investigaciones deberían centrarse en mejorar la precisión del modelo y en la validación de estos hallazgos en cohortes más grandes y diversas.
Materiales y Métodos
Participantes
Se incluyeron 55 niños, de los cuales 27 fueron diagnosticados con dislexia y 28 eran lectores típicos. Todos los participantes eran hablantes nativos de inglés, diestros, y no presentaban ninguna otra condición neurológica o psiquiátrica. Los niños con dislexia fueron diagnosticados por profesionales basándose en criterios establecidos, y se confirmó que tenían dificultades significativas en la lectura en comparación con sus compañeros.
Tareas de Lectura
Se diseñaron tres tareas de lectura diferentes para activar regiones cerebrales específicas implicadas en el procesamiento fonológico y ortográfico:
1.Lectura de Palabras Reales (RW): Los participantes leyeron palabras reales.
2. Lectura de Pseudopalabras (PW): Los participantes leyeron palabras no reales o pseudopalabras, que requieren procesamiento fonológico sin el apoyo de la familiaridad ortográfica.
3. Decisión Léxica (LD): Los participantes realizaron una tarea de decisión léxica, decidiendo si una cadena de letras formaba una palabra real o una pseudopalabra.
Adquisición de Imágenes
Las imágenes de fMRI fueron adquiridas utilizando un escáner de resonancia magnética de 3T (Siemens Magnetom Trio). Las secuencias utilizadas para adquirir las imágenes fueron:
- Secuencia estructural: Imágenes de alta resolución anatómica T1.
- Secuencia funcional: Imágenes fMRI sensibles a BOLD (Blood Oxygen Level Dependent) mientras los participantes realizaban las tareas de lectura.
Preprocesamiento de Imágenes
Las imágenes de fMRI fueron preprocesadas utilizando el software SPM12. Los pasos de preprocesamiento incluyeron:
1. Conversión a Nifti: Las imágenes fueron convertidas a formato Nifti.
2. Corrección de Movimiento: Se aplicó una corrección de movimiento para compensar los movimientos de la cabeza durante la adquisición.
3. Normalización: Las imágenes fueron normalizadas al espacio MNI (Montreal Neurological Institute).
4. Suavizado Espacial: Se aplicó un filtro de suavizado gaussiano para mejorar la relación señal-ruido.
Mapas de Activación
Se generaron mapas de activación cerebral para cada tarea de lectura utilizando Mapas Paramétricos Estadísticos (SPMs). Estos mapas representaban las áreas del cerebro que mostraban una activación significativa durante la tarea.
Clasificación con Redes Neuronales Convolucionales 3D
Para clasificar los volúmenes de activación cerebral, se diseñó una arquitectura de Red Neuronal Convolucional 3D (3D CNN). La red consistía en múltiples capas convolucionales, capas de agrupamiento y capas densas. La arquitectura detallada es la siguiente:
- Capas Convolucionales: Varias capas convolucionales 3D para extraer características espaciales.
- Capas de Agrupamiento: Capas de agrupamiento para reducir la dimensionalidad.
- Capas Densas: Capas densas completamente conectadas para la clasificación.
- Concatenación: Las salidas de tres redes paralelas (una para cada tarea de lectura) se concatenaron antes de la capa de salida.
- Capa de Salida: Una capa softmax para la clasificación binaria (disléxico vs. lector típico).
Validación Cruzada
Para evaluar el rendimiento del modelo y controlar el sobreajuste, se utilizó un enfoque de validación cruzada de 4 pliegues. Los datos se dividieron en cuatro subconjuntos, y en cada iteración, tres subconjuntos se usaron para el entrenamiento y uno para la prueba.
Resultados
El modelo de 3D CNN propuesto logró los siguientes resultados en la clasificación de niños con dislexia:
- **Precisión Promedio**: 72.73%
- **Sensibilidad**: 75%
- **Especificidad**: 71.43%
- **Precisión**: 60%
- **Puntuación F1**: 67%
Estos resultados indican que el enfoque es prometedor para la detección automática de la dislexia utilizando fMRI y técnicas de aprendizaje profundo.
Otros Artículos sobre Dislexia



No hay comentarios:
Publicar un comentario