Saltar al contenido
Ciencia y medicina Explicado Psicología y comportamiento 18 min de lectura

Procesamiento del lenguaje en el cerebro: cómo las redes distribuidas decodifican las palabras

Su cerebro decodifica el lenguaje a través de redes distribuidas que transforman el sonido y el texto en significado en cuestión de cientos de milisegundos. Nuevas investigaciones muestran que este sistema se extiende al cerebelo y puede seguir procesando el lenguaje incluso durante la anestesia.

Este artículo fue traducido automáticamente del inglés por IA. Leer la versión original en inglés →
Illustration of brain language processing with glowing neural networks
Modo de lectura

Muchas señales léxicas y semánticas en el procesamiento del lenguaje se despliegan en cuestión de cientos de milisegundos. Su cerebro no procesa el lenguaje en una sola ubicación; distribuye la tarea entre una red de regiones especializadas, cada una aportando algo distinto a la comprensión final. Y, como revelan investigaciones publicadas en 2025 y 2026, este sistema es más distribuido y sofisticado de lo que los neurocientíficos creían, extendiéndose incluso al cerebelo y continuando en formas limitadas cuando usted está inconsciente.

El giro temporal superior: donde el sonido se convierte en habla

Para el lenguaje oral, un centro cortical clave en las primeras etapas es el giro temporal superior (GTS), una franja de corteza que recorre el lateral del cerebro, justo encima del oído. Un estudio de 2025 publicado en Nature utilizó registros de electrodos de alta densidad en hablantes de español, inglés y mandarín para demostrar que, ya fuera el idioma familiar o extranjero, el GTS respondía de manera similar a sonidos básicos del habla, como vocales y consonantes.[s]

Esta codificación compartida tiene sentido desde el punto de vista evolutivo. Todos los idiomas humanos utilizan el mismo aparato vocal, lo que limita los sonidos posibles que podemos producir. El GTS parece estar sintonizado con estas características acústicas universales, representando una capa fundamental del procesamiento cerebral del lenguaje que funciona independientemente de su trasfondo lingüístico.

Pero la historia cambia en niveles superiores de organización. El mismo estudio descubrió que «solo al escuchar el idioma nativo observamos una codificación neural mejorada en el GTS para los límites de las palabras, la frecuencia léxica y las estadísticas de secuencias de sonidos específicas del idioma».[s] Cuando usted escucha su idioma materno, su GTS no solo procesa sonidos; los segmenta en palabras en tiempo real, algo que no puede hacer con idiomas desconocidos. Esto explica la experiencia subjetiva de escuchar un idioma extranjero como un flujo indiferenciado de sílabas, mientras que el propio parece llegar ya dividido en unidades discretas.

El área de Broca: del control motor a la sintaxis

El giro frontal inferior izquierdo, que incluye la famosa área de Broca, se encuentra en el lóbulo frontal, cerca de las regiones que controlan los movimientos de la boca y la lengua. Una revisión de enero de 2026 en Frontiers in Human Neuroscience sintetizó décadas de investigación comparativa para rastrear cómo esta región desarrolló sus funciones lingüísticas.

La revisión describe el GFII como conectado a la corteza temporoparietal a través de vías ventrales y dorsales, conexiones que permiten a los humanos combinar un conjunto limitado de elementos vocales en secuencias estructuradas jerárquicamente.[s] Esto es lo que le permite entender oraciones anidadas como «el gato que persiguió al ratón que robó el queso está durmiendo», donde el significado depende de seguir múltiples cláusulas incrustadas.

La revisión encontró especialización funcional dentro del área de Broca: el área 44 está principalmente involucrada en la codificación sintáctica y los gestos articulatorios, mientras que las áreas 45 y 47 apoyan la recuperación selectiva y el acceso controlado a la información semántica.[s] Diferentes subregiones manejan la gramática y el significado, incluso dentro de esta pequeña porción de corteza.

Es crucial que «el lenguaje no surgió de áreas corticales nuevas, sino a través de la reutilización, expansión y optimización gradual de circuitos fronto-temporales preexistentes».[s] Los monos tienen regiones cerebrales homólogas que controlan la vocalización; el procesamiento cerebral del lenguaje humano surgió al expandir y reconfigurar circuitos que ya existían para el control vocal y motor.

La red semántica: cómo se construye el significado

Entender una palabra requiere más que analizar sus sonidos y gramática; usted necesita acceder a su significado. El procesamiento cerebral del lenguaje debe transformar símbolos en conceptos. Un estudio de marzo de 2026 en PLOS Biology utilizó registros intracraneales de 19 pacientes con epilepsia para mapear cómo el cerebro procesa palabras concretas como «martillo» frente a palabras abstractas como «justicia».

Los investigadores descubrieron que «los conceptos concretos mostraban una mayor activación de alta frecuencia en una red frontoventrotemporal, mientras que una mayor activación para las palabras abstractas se encontró en la corteza temporal media posterior lateral».[s] El cerebro dirige diferentes tipos de conceptos a través de vías distintas.

La dinámica temporal fue reveladora: «la información semántica se codifica mediante un sistema causal de cascadas corticales bidireccionales: la integración temprana visuo-lingüística en la corteza ventrotemporal inicia el flujo de información dirigido hacia los centros frontales».[s] Cuando usted lee una palabra, las primeras diferencias relacionadas con la concreción observadas en este estudio aparecen en el giro parahipocampal y la corteza fusiforme media aproximadamente 250 milisegundos después de que aparece la palabra; los efectos frontales surgen hacia los 400 milisegundos, con retroalimentación que regresa a las regiones temporales. Es una conversación entre regiones cerebrales, no un proceso unidireccional.

El estudio estableció causalidad mediante estimulación cerebral directa: «la estimulación cortical de la corteza ventrotemporal y la corteza frontal inferior alteró la capacidad de realizar juicios de concreción».[s] Alterar cualquiera de estas regiones afectó el procesamiento semántico, demostrando que ambas son necesarias.

El procesamiento cerebral del lenguaje involucra una red de control

Recuperar el significado no es automático; requiere control cognitivo, especialmente cuando el contexto es ambiguo o hay que suprimir significados en competencia. Un estudio de diciembre de 2025 que combinó resonancia magnética funcional (fMRI) y estimulación magnética transcraneal (EMT) destacó una red semántica de control lateralizada en el hemisferio izquierdo, que incluye el giro frontal inferior, el giro temporal medio posterior y la corteza prefrontal medial dorsal.[s]

El estudio informa que las tres regiones están causalmente involucradas en el control semántico. También descubrió que la actividad combinada en estas regiones predijo el desempeño semántico mejor que la actividad en cualquier región individual.[s] La comprensión del lenguaje no está localizada; surge de la actividad coordinada de una red.

El cerebelo: un especialista lingüístico inesperado

El cerebelo, esa estructura con forma de nuez en la base del cráneo, tradicionalmente se ha asociado con la coordinación motora, no con la cognición. Pero un estudio de enero de 2026 que analizó 16 años de datos de imágenes cerebrales del laboratorio Fedorenko del MIT encontró algo inesperado.

Cuatro regiones cerebelosas responden a tareas lingüísticas. Una de ellas, llamada LangCereb3, es notablemente selectiva. «Esta es la primera vez que observamos un área fuera de las zonas lingüísticas principales del hemisferio izquierdo que se comporta de manera tan similar a esas áreas centrales», dijo la investigadora principal, Ev Fedorenko.[s]

Esta región cerebelosa «se activa tanto durante la comprensión como durante la producción del lenguaje, algo que antes se creía exclusivo de las áreas neocorticales».[s] Más intrigante aún: «la región cerebelosa está más selectivamente sintonizada con oraciones con significado que las áreas lingüísticas neocorticales».[s] Responde con fuerza a oraciones reales, pero débilmente a sinsentidos gramaticalmente correctos, lo que sugiere que realiza un procesamiento que va más allá de la sintaxis.

La escala potencial de la contribución cerebelosa es significativa: «aunque el cerebelo representa solo alrededor del 10% del tamaño del cerebro, soporta una carga desproporcionada, ya que contiene casi el 80% de todas las neuronas del cerebro».[s]

Procesamiento del lenguaje sin conciencia

Un informe de mayo de 2026 del Baylor College of Medicine describió cómo los investigadores utilizaron sondas Neuropixels para registrar la actividad de neuronas individuales en el hipocampo de pacientes bajo anestesia general. Incluso mientras estaban anestesiados, los cerebros de estos pacientes mostraron un procesamiento sofisticado de sonidos y lenguaje.[s]

«La actividad neural mostró la capacidad del cerebro para diferenciar partes del habla, como sustantivos, verbos y adjetivos, basándose en patrones de disparo neuronal».[s] El cerebro inconsciente aún puede distinguir categorías gramaticales.

Aún más notable, los investigadores encontraron actividad predictiva durante la escucha de historias: «El cerebro parece anticipar lo que viene a continuación en una historia, incluso sin conciencia», dijo el Dr. Sameer Sheth.[s]

«Este tipo de codificación predictiva es algo que asociamos con estar despierto y atento, pero aquí ocurre en un estado inconsciente», señaló el Dr. Benjamin Hayden.[s] El cerebro puede generar predicciones sobre las palabras siguientes incluso sin conciencia.

Los modelos de IA muestran alineación con el cerebro

Una conexión intrigante entre los sistemas biológicos y artificiales surgió de un preprint de mayo de 2026 que analizó cómo los modelos de lenguaje grandes (LLM) codifican la información. Los investigadores descubrieron que «las capas intermedias de los modelos de lenguaje grandes predicen mejor las respuestas cerebrales humanas al lenguaje, uno de los hallazgos más sólidos en neurolingüística computacional».[s]

Al utilizar autoencoders dispersos para descomponer lo que aprenden los LLM, los investigadores encontraron que «las características semánticas por sí solas recuperan el 94% del rendimiento máximo de codificación».[s] Tanto el cerebro como los modelos de lenguaje parecen codificar la información semántica de maneras que coinciden a nivel abstracto. Esta convergencia sugiere que el procesamiento cerebral del lenguaje y los modelos de lenguaje artificial comparten algunas presiones computacionales derivadas de la tarea de predecir lo que viene a continuación.

El sistema distribuido

El procesamiento cerebral del lenguaje no es una facultad única ubicada en un solo lugar. Es un cálculo distribuido que recluta el GTS para el análisis fonético, el área de Broca para la sintaxis y la articulación, el lóbulo temporal para el significado semántico, la corteza prefrontal para el control cognitivo, el cerebelo para una contribución aún misteriosa a las oraciones con significado, y los circuitos hipocampales para la predicción inconsciente.

Estos sistemas aportan diferentes piezas al cálculo. Los estudios de estimulación citados muestran que varios nodos son causalmente necesarios para tareas semánticas específicas, y juntos pueden transformar la entrada lingüística en significado en cuestión de cientos de milisegundos.

Muchas señales léxicas y semánticas en el procesamiento del lenguaje se despliegan en cuestión de cientos de milisegundos. Su cerebro no procesa el lenguaje en una sola ubicación; distribuye la tarea entre una red de regiones especializadas, cada una aportando algo distinto a la comprensión final. Y, como revelan investigaciones publicadas en 2025 y 2026, este sistema es más distribuido y sofisticado de lo que los neurocientíficos creían, extendiéndose incluso al cerebelo y continuando en formas limitadas cuando usted está inconsciente.

El giro temporal superior: acústica compartida, léxico específico

Para el lenguaje oral, un centro cortical clave en las primeras etapas es el giro temporal superior (GTS), una franja de corteza auditiva no primaria que recorre la superficie lateral del lóbulo temporal. Un estudio de 2025 publicado en Nature utilizó electrocorticografía de alta densidad (ECoG) en una cohorte de hablantes de español, inglés y mandarín para disociar las representaciones del habla dependientes de la experiencia de las independientes de esta.

El hallazgo clave fue que los idiomas nativos y extranjeros elicitaron respuestas similares en el GTS asociadas con el procesamiento acústico-fonético compartido de características fundamentales del habla, incluyendo vocales y consonantes.[s] Los modelos de campo receptivo temporal (TRF) entrenados con habla nativa predijeron las respuestas al habla extranjera con alta fidelidad (Pearson r = 0,86), lo que indica una sintonización fonética conservada.

Pero la disociación crítica surgió en niveles superiores de representación: «solo al escuchar el idioma nativo observamos una codificación neural mejorada en el GTS para los límites de las palabras, la frecuencia léxica y las estadísticas de secuencias de sonidos específicas del idioma».[s] La codificación dependiente de la experiencia de la estructura fonotáctica y la segmentación léxica ocurrió en las mismas poblaciones neuronales que codifican las características acústicas universales, lo que sugiere un modelo de dos niveles en el que las representaciones de bajo y alto nivel coexisten en poblaciones superpuestas del GTS.

En participantes bilingües, ambos idiomas familiares mostraron codificación a nivel de palabra en las mismas poblaciones del GTS, y la competencia modulaba la precisión de la decodificación, estableciendo un vínculo directo entre la fluidez conductual y la representación neural. Esta arquitectura de dos niveles representa un principio fundamental del procesamiento cerebral del lenguaje: características universales en niveles inferiores, representaciones moldeadas por la experiencia en niveles superiores.

El giro frontal inferior izquierdo: sintaxis jerárquica y recuperación semántica

El giro frontal inferior izquierdo (GFII), que abarca las áreas de Brodmann 44, 45 y 47, constituye la clásica región de Broca. Una revisión de enero de 2026 en Frontiers in Human Neuroscience integró evidencia anatómica, funcional y de conectividad comparativa para caracterizar su evolución.

La revisión describe el GFII como conectado a la corteza temporoparietal a través de vías ventrales y dorsales, conexiones que permiten a los humanos combinar un conjunto limitado de elementos vocales en secuencias estructuradas jerárquicamente.[s] La vía dorsal (fascículo arqueado) soporta la sintaxis jerárquica; la vía ventral (incluyendo el fascículo uncinado) contribuye al mapeo semántico.

Existen disociaciones funcionales dentro de las subregiones del GFII: el área 44 está principalmente involucrada en la codificación sintáctica y los gestos articulatorios, mientras que las áreas 45 y 47 apoyan la recuperación selectiva y el acceso controlado a la información semántica.[s] La AB44 soporta funciones sintácticas y articulatorias; la AB45/47 maneja la recuperación léxica controlada en condiciones de competencia o ambigüedad.

Las comparaciones entre especies revelan estructuras homólogas en primates no humanos, pero con diferencias críticas: «el lenguaje no surgió de áreas corticales nuevas, sino a través de la reutilización, expansión y optimización gradual de circuitos fronto-temporales preexistentes».[s] Las adaptaciones específicas humanas incluyen la expansión volumétrica de la AB44, el fortalecimiento de la conectividad del fascículo arqueado y un cambio funcional de la secuenciación motora al cálculo sintáctico jerárquico. Estas modificaciones permitieron la forma exclusivamente humana de procesamiento cerebral del lenguaje que soporta combinaciones recursivas y abiertas.

Cascadas frontotemporales en el procesamiento semántico

Un estudio de marzo de 2026 en PLOS Biology utilizó registros intracraneales de 19 pacientes con epilepsia durante juicios de concreción de palabras individuales, midiendo la actividad gamma de banda ancha (70-150 Hz) como indicador del procesamiento cortical local.

El patrón espacio-temporal reveló disociaciones sistemáticas entre concreto y abstracto: «los conceptos concretos mostraron una mayor activación de alta frecuencia en una red frontoventrotemporal, mientras que una mayor activación para las palabras abstractas se encontró en la corteza temporal media posterior lateral».[s]

La dinámica temporal mostró una arquitectura en cascada: «la información semántica se codifica mediante un sistema causal de cascadas corticales bidireccionales: la integración temprana visuo-lingüística en la corteza ventrotemporal inicia el flujo de información dirigido hacia los centros frontales».[s] Los primeros efectos de concreción aparecieron en el giro parahipocampal y la corteza fusiforme media aproximadamente 250 ms después del estímulo; los efectos frontales surgieron a los 400 ms; la retroalimentación a las regiones temporales ocurrió a los 500 ms. El análisis de coherencia dirigida parcial confirmó el flujo bidireccional de información.

La necesidad causal se estableció mediante estimulación cortical directa: «la estimulación cortical de la corteza ventrotemporal y la corteza frontal inferior alteró la capacidad de realizar juicios de concreción».[s] Ambos centros son causalmente necesarios para el procesamiento léxico-semántico.

El procesamiento cerebral del lenguaje requiere control semántico distribuido

Un estudio de diciembre de 2025 combinó resonancia magnética funcional (fMRI) con estimulación magnética transcraneal (EMT) para caracterizar la red de control semántico. El estudio destacó una red lateralizada en el hemisferio izquierdo que incluye el giro frontal inferior, el giro temporal medio posterior y la corteza prefrontal medial dorsal.[s]

El estudio informa que las tres regiones están causalmente involucradas en el control semántico. Pero la perspectiva de red fue crítica: la actividad combinada en estas regiones predijo el desempeño semántico mejor que la actividad en cualquier región individual.[s]

El modelado causal dinámico reveló una modulación de la conectividad dependiente de la demanda: las altas demandas de control semántico aumentaron tanto la autoinhibición local como el acoplamiento interregional. Los efectos de la estimulación en la corteza frontal se correlacionaron con la fuerza del campo eléctrico en los tiempos de activación local; los efectos en la corteza temporal se correlacionaron con la conectividad de red dependiente de la tarea. La red de control semántico opera como un sistema integrado, no como una colección de módulos independientes.

Contribuciones cerebelosas: LangCereb3 como especialista lingüístico

Un estudio de enero de 2026 publicado en Neuron analizó 1.033 sesiones de fMRI de 846 participantes a lo largo de 16 años de recolección de datos.[s] Cuatro regiones en el cerebelo posterior derecho mostraron activación consistente relacionada con el lenguaje. Una de ellas, denominada LangCereb3, exhibió propiedades similares a las regiones lingüísticas neocorticales.

«Esta es la primera vez que observamos un área fuera de las zonas lingüísticas principales del hemisferio izquierdo que se comporta de manera tan similar a esas áreas centrales», informó Ev Fedorenko.[s]

LangCereb3 mostró propiedades críticas: «la región selectiva del lenguaje en el cerebelo se activa tanto durante la comprensión como durante la producción del lenguaje, algo que antes se creía exclusivo de las áreas neocorticales».[s] Además, «la región cerebelosa está más selectivamente sintonizada con oraciones con significado que las áreas lingüísticas neocorticales».[s] Las oraciones sin sentido gramaticalmente válidas (como el «Jabberwocky») produjeron respuestas más débiles que las oraciones reales, lo que sugiere un cálculo sensible al significado más allá de la sintaxis.

La capacidad computacional es sustancial: «aunque el cerebelo representa solo alrededor del 10% del tamaño del cerebro, soporta una carga desproporcionada, ya que contiene casi el 80% de todas las neuronas del cerebro».[s] El papel del cerebelo en el lenguaje podría extenderse más allá de la coordinación motora del habla hacia el procesamiento semántico a nivel de oración.

Codificación predictiva inconsciente en el hipocampo

Un estudio de mayo de 2026 del Baylor College of Medicine utilizó sondas Neuropixels, que según Baylor no se habían utilizado antes en esta parte del cerebro, para registrar neuronas individuales del hipocampo en pacientes bajo anestesia general. Los pacientes escucharon tonos y narraciones mientras estaban completamente anestesiados.[s]

Los hallazgos desafiaron supuestos sobre la necesidad de la conciencia para el procesamiento cerebral del lenguaje: la actividad neural diferenció partes del habla, como sustantivos, verbos y adjetivos, basándose en patrones de disparo neuronal.[s] Las distinciones de categoría gramatical surgieron de la actividad de conjuntos neuronales incluso sin conciencia.

Más notable aún, los investigadores encontraron actividad predictiva durante la escucha de historias: «El cerebro parece anticipar lo que viene a continuación en una historia, incluso sin conciencia», dijo Sameer Sheth.[s]

Benjamin Hayden describió el resultado como una codificación predictiva que suele asociarse con el estado de vigilia y la atención, pero que aquí apareció en un estado inconsciente.[s] El hipocampo mantuvo la predicción de la siguiente palabra durante la anestesia, lo que sugiere que el procesamiento predictivo del lenguaje puede operar sin acceso consciente.

Alineación cerebro-LLM: dominan las características semánticas

Un preprint de mayo de 2026 que conecta la interpretabilidad mecánica y la codificación neural utilizó autoencoders dispersos para descomponer las representaciones de GPT-2 XL y Llama-3.1-8B, y luego las mapeó a respuestas cerebrales de fMRI durante la comprensión del lenguaje natural.

El preprint describe la ventaja de las capas intermedias como uno de los hallazgos más sólidos en neurolingüística computacional: las capas intermedias de los modelos de lenguaje grandes predicen mejor las respuestas cerebrales humanas al lenguaje.[s] Pero la descomposición a nivel de características reveló qué impulsa esta alineación.

Las características semánticas fueron el contribuyente dominante: «las características semánticas por sí solas recuperan el 94% del rendimiento máximo de codificación, superando sustancialmente las líneas de base emparejadas en varianza».[s] Las características sintácticas, léxicas y predictivas contribuyeron menos que las semánticas en la descomposición reportada. Las subcategorías semánticas descubiertas por los SAE se mapearon a la topografía cortical predicha por programas independientes de neurociencia (Huth et al., Binder et al.), demostrando validez convergente entre los métodos de interpretabilidad de IA y la neuroimagen humana. Estos resultados sugieren que el procesamiento cerebral del lenguaje y los cálculos de los LLM pueden converger en soluciones similares para el mismo problema fundamental.

Integración: el sistema lingüístico distribuido

El procesamiento cerebral del lenguaje surge de la actividad coordinada entre múltiples sistemas especializados: el GTS para la transformación fonética-léxica, el GFII para la sintaxis jerárquica y la recuperación controlada, la red ventrotemporal-frontal para las cascadas semánticas, la red de control semántico para el acceso flexible al conocimiento, el cerebelo para el procesamiento semántico a nivel de oración y los circuitos hipocampales para la predicción inconsciente. Cada uno aporta cálculos distintos; ninguno de los trabajos citados respalda la existencia de un centro único suficiente para el lenguaje.

En el estudio de lectura semántica, la dinámica temporal medida abarcó aproximadamente 250-500 ms desde el inicio del estímulo hasta los efectos de red posteriores, con cascadas bidireccionales y coordinación a nivel de red. Parte del procesamiento predictivo del lenguaje continuó durante la anestesia, y los estudios con LLM muestran una alineación medible con las respuestas cerebrales humanas a nivel de representación de características semánticas.

¿Qué te ha parecido este artículo?
Compartir este artículo

¿Has visto un error? Avísanos

Fuentes