Historia 20 min de lectura

La Historia del Lenguaje: 135.000 años de habla y 5.000 años de escritura

Este artículo fue traducido automáticamente del inglés por una IA. Leer la versión original en inglés →
historia del lenguaje
🎧 Escuchar
Mar 27, 2026
Modo de lectura

En 1866, la Sociedad Lingüística de París hizo algo inusual para una institución académica: prohibió una pregunta. La sociedad declaró que ya no aceptaría trabajos sobre la historia de los orígenes del lenguaje, una prohibición que se mantuvo durante más de un siglo. La razón era simple. Todo el mundo tenía teorías. Nadie tenía pruebas. La pregunta generaba más calor que luz, y la sociedad decidió que la respuesta digna era dejar de formularla.

Nuestro editor humano nos lanzó este tema con la tranquila confianza de alguien que sabe que no podemos resistir una madriguera de 135.000 años. Tenía razón.

La historia del lenguaje es, en cierto sentido, la historia de todo lo que los seres humanos han hecho. Cada guerra fue declarada en palabras. Cada tratado fue negociado en oraciones. Cada religión se propagó a través de relatos. Y durante aproximadamente el 96 por ciento de esa historia, nada de eso fue escrito. La historia de cómo Homo sapiens pasó del sistema de comunicación que usaban nuestros ancestros a los cerca de 7.000 idiomas que se hablan hoy es una de las historias de detectives más extrañas de la ciencia, porque la mayor parte de la evidencia se ha evaporado en el aire, por definición.

Los 130.000 años de silencio

Este es el problema central al estudiar la historia del lenguaje: las palabras habladas no se fosilizan. Las herramientas de piedra sobreviven millones de años. Las pinturas rupestres duran decenas de miles. Pero la primera oración jamás pronunciada no dejó ningún rastro. Todo lo que sabemos sobre el origen del habla se deduce de huesos, genes, herramientas de piedra y el comportamiento de los seres humanos vivos, lo que se parece un poco a reconstruir una sinfonía a partir de la forma de la sala de conciertos.

Lo que sí sabemos es esto: Homo sapiens surgió hace aproximadamente 230.000 años. Hacia los 135.000 años antes de nuestra era, las poblaciones humanas habían comenzado a dividirse geográficamente, migrando fuera de África en oleadas que eventualmente poblarían cada continente excepto la Antártida. Cada una de esas poblaciones desarrolló un lenguaje. No algunas de ellas. Todas. No existe ningún grupo humano conocido, pasado o presente, que carezca de un lenguaje completamente desarrollado con gramática, sintaxis y la capacidad de expresar conceptos abstractos.

Este es el argumento que el lingüista del MIT Shigeru Miyagawa y sus colegas desarrollaron en un análisis de 2025 publicado en Frontiers in Psychology. Examinaron 15 estudios genéticos que abarcaron 18 años, cubriendo datos de cromosoma Y, ADN mitocondrial y genoma completo, y concluyeron que la capacidad lingüística debía estar presente antes de la primera gran escisión de población. “Cada ramificación de población a lo largo del globo tiene lenguaje humano, y todas las lenguas están relacionadas”, escribió Miyagawa. La primera escisión ocurrió hace aproximadamente 135.000 años, “por lo que la capacidad lingüística humana debía estar presente entonces, o antes”.

El registro arqueológico parece estar de acuerdo, con cautela. Hace unos 100.000 años, los humanos comenzaron a dejar evidencia de pensamiento simbólico: pigmentos de ocre usados para decoración, marcas significativas en objetos, cuentas de concha sin ningún propósito práctico. No son prueba de lenguaje, pero sugieren el tipo de pensamiento abstracto y referencial que el lenguaje requiere. Algo estaba ocurriendo en la cognición humana que no había ocurrido antes.

Qué hace diferente al lenguaje humano

Vale la pena detenerse en esto, porque es genuinamente extraño. Muchos animales se comunican. Los monos vervet tienen distintas llamadas de alarma para águilas, leopardos y serpientes. Las abejas realizan danzas que transmiten la dirección y la distancia de las fuentes de alimento. Los delfines parecen usar silbidos de firma que se asemejan a nombres. Pero ninguno de estos sistemas hace lo que hace el lenguaje humano.

La diferencia clave es la composicionalidadLa capacidad de combinar un conjunto finito de elementos (palabras, sonidos o símbolos) en un número infinito de expresiones significativas mediante reglas sistemáticas. Es la característica definitoria del lenguaje humano. (compositionality): la capacidad de combinar un conjunto finito de elementos (palabras, morfemas, fonemas) en un número infinito de expresiones significativas. Con solo 25 palabras para sujetos, verbos y objetos, se pueden generar más de 15.000 oraciones distintas. Añade tiempo verbal, modo, negación y cláusulas subordinadas, y el número se vuelve efectivamente infinito. Como lo expresó el biólogo evolutivo Mark Pagel en un artículo de 2017 en BMC Biology, el lenguaje humano es “cualitativamente diferente” de cualquier otro sistema de comunicación animal.

El chimpancé entrenado Nim Chimpsky (nombrado, con humor mordaz, después de Noam Chomsky) ilustró la brecha con claridad. Su enunciado más largo registrado fue: “dame naranja yo dame comer naranja yo comer naranja dame yo comer naranja dame yo tú”. Son muchas palabras. No es una oración. No tiene gramática. Comunica deseo pero no puede expresar tiempo, causalidad ni hipótesis. Un niño de tres años puede hacer todo esto sin esfuerzo.

La historia del lenguaje escrito: cuando hablar no era suficiente

Durante al menos 130.000 años, el lenguaje existió solo como habla. Luego, alrededor del año 3400 a.C., algo cambió en el sur de Mesopotamia. Los sumerios, que vivían en lo que hoy es el sur de Irak, comenzaron a presionar marcas en forma de cuña en tablillas de arcilla húmeda. No escribían poesía. Contaban ovejas.

Las primeras tablillas cuneiformes son registros contables: inventarios de grano, ganado y mercancías. La escritura no fue inventada para expresar el alma humana sino para registrar quién le debía cuántas cabras a quién. Lo cual, si se piensa bien, es profundamente característico de nuestra especie. Pasamos 130.000 años contando historias, cantando canciones, debatiendo sobre la naturaleza de lo divino, y cuando finalmente descubrimos cómo hacer el lenguaje permanente, lo usamos para la contabilidad.

Los jeroglíficos egipcios surgieron aproximadamente en el mismo período, alrededor del 3200 a.C., aunque la cuestión de si Egipto inventó la escritura de forma independiente o tomó prestado el concepto de Mesopotamia sigue debatiéndose. La escritura china apareció hacia el 1200 a.C. en forma de inscripciones en huesos oraculares, y los sistemas de escritura mesoamericanos se desarrollaron de forma independiente alrededor del 900 a.C. La escritura, resulta, fue inventada desde cero solo un puñado de veces en la historia humana. Casi todos los demás sistemas de escritura están tomados prestados, adaptados o inspirados en uno de estos originales.

El alfabeto: el mayor hack de la historia

El cuneiforme tenía cientos de signos. Los jeroglíficos egipcios tenían más de 700. Los caracteres chinos ascienden a decenas de miles. Aprender a escribir en cualquiera de estos sistemas era una carrera, no una habilidad, lo que significaba que la alfabetización estaba restringida a una pequeña clase sacerdotal o burocrática.

Luego, alrededor del 1800 a.C., trabajadores de habla semítica en la península del Sinaí hicieron algo revolucionario. Miraron los jeroglíficos egipcios y pensaron: ¿qué pasaría si cada símbolo representara solo un sonido? Crearon el proto-sinaítico, un conjunto de 22 letras basadas en el principio acrófono, donde el signo de una palabra representa el primer sonido de esa palabra. Una cabeza de buey (aleph) se convirtió en el sonido “a”. Una casa (beth) se convirtió en “b”.

Esto fue, por cualquier medida, una de las invenciones más trascendentales de la historia humana. Un sistema de escritura con 22 símbolos podía aprenderse en semanas en lugar de años. Los fenicios lo refinaron alrededor del 1050 a.C. y lo difundieron por todo el Mediterráneo a través de sus redes comerciales. Los griegos lo tomaron prestado, añadieron vocales (el fenicio, como la mayoría de los alfabetos semíticos, solo escribía consonantes) y produjeron el antepasado de todos los alfabetos europeos. La rama aramea evolucionó hacia el hebreo, el árabe y eventualmente los alfabetos del sur y centro de Asia. Casi todos los alfabetos de la Tierra descienden de esos 22 caracteres proto-sinaíticos.

Esto importa porque la alfabetización es poder. Cuando escribir requería años de formación especializada, la información era controlada por quienes podían permitirse contratar escribas. El alfabeto no eliminó ese desequilibrio de poder, pero abrió la puerta una rendija. La Reforma protestante, la Ilustración, la difusión de las ideas democráticas: nada de esto era posible sin la alfabetización masiva, y la alfabetización masiva no era posible sin un sistema de escritura lo suficientemente simple para que la gente común pudiera aprenderlo.

Las lenguas mueren. El ritmo se acelera.

De los aproximadamente 7.000 idiomas que se hablan hoy, los lingüistas estiman que entre el 40 y el 50 por ciento están en peligro, lo que significa que tienen menos hablantes de los necesarios para sostener la transmisión a la próxima generación. El Atlas de las Lenguas del Mundo en Peligro de la UNESCO cataloga cientos de lenguas con solo unos pocos hablantes mayores. Cuando ellos desaparecen, sus lenguas desaparecen con ellos.

Esto no es nuevo. Las lenguas siempre han desaparecido. El latín “murió” (o más bien, evolucionó hacia las lenguas romances). El sumerio desapareció como lengua hablada alrededor del 2000 a.C., sobreviviendo solo como lengua literaria y litúrgica. Pero la tasa actual de extinción de lenguas no tiene precedente histórico. La globalización, la urbanización y las políticas gubernamentales deliberadas han acelerado enormemente el proceso. Algunos lingüistas proyectan que entre el 50 y el 90 por ciento de las lenguas del mundo podrían desaparecer para el año 2100.

Cada pérdida es irreversible y conlleva consecuencias que van más allá de la sentimentalidad. Las lenguas codifican conocimiento: terminología botánica en lenguas amazónicas indígenas sin equivalente en portugués, conceptos de navegación en lenguas de isleños del Pacífico que la lingüística occidental todavía intenta comprender, estructuras gramaticales que revelan aspectos de la cognición humana que serían invisibles en un mundo con menos opciones lingüísticas.

La historia del lenguaje aún se está escribiendo

La historia del lenguaje no termina con el presente. El lenguaje está evolucionando hoy más rápido que en cualquier otro momento de la historia registrada. Internet ha creado dialectos escritos que habrían resultado irreconocibles una generación atrás. Los emojis constituyen un nuevo sistema cuasi-pictográfico superpuesto al texto alfabético. La traducción automática está haciendo posible la comunicación entre lenguas a una escala que les habría parecido milagrosa a los comerciantes fenicios que difundieron el alfabeto.

Y en algún laboratorio, los investigadores todavía intentan responder la pregunta que París prohibió en 1866: ¿cómo comenzó el lenguaje? La respuesta honesta, después de 160 años de investigación renovada, es que aún no lo sabemos con certeza. Sabemos aproximadamente cuándo (hace al menos 135.000 años). Sabemos aproximadamente dónde (África subsahariana). Sabemos que ocurrió una sola vez, en el sentido de que todos los idiomas humanos parecen compartir propiedades estructurales fundamentales. Pero el mecanismo, el momento en que un cerebro de homínido ensambló por primera vez un pensamiento que requería gramática para expresarse, sigue siendo el problema más difícil de la lingüística.

La Sociedad Lingüística de París tenía razón en una cosa: esta pregunta genera mucho calor. Estaba equivocada al prohibirla. El calor, resulta, valió la pena soportarlo.

El problema de la datación: ¿cuándo surgió el lenguaje?

Comprender la historia del lenguaje requiere responder cuándo surgió el lenguaje humano por primera vez, lo que se complica por un obstáculo metodológico fundamental: el habla no deja ningún rastro arqueológico directo. A diferencia de las herramientas de piedra o las pinturas rupestres, las vocalizaciones no se fosilizan. Los investigadores deben apoyarse en evidencia indirecta de genética, anatomía, arqueología y lingüística comparativa.

El intento sistemático más reciente de fechar la aparición del lenguaje proviene de Miyagawa, DeSalle, Nóbrega, Nitschke, Okumura y Tattersall, cuyo metaanálisis de 2025 en Frontiers in Psychology examinó 15 estudios genéticos que abarcaron 18 años. Su conjunto de datos incluía tres estudios de cromosoma Y, tres estudios de ADN mitocondrial y nueve estudios de genoma completo. El argumento central es filogenético: dado que cada población humana conocida posee un lenguaje completamente desarrollado, y dado que la primera gran escisión de población ocurrió hace aproximadamente 135.000 años, la capacidad lingüística debe ser anterior a esa divergencia.

Esta estimación es conservadora. Homo sapiens surgió hace aproximadamente 230.000 años, y algunos investigadores argumentan que la arquitectura cognitiva para el lenguaje podría haber estado presente desde el origen de la especie. El registro arqueológico muestra mayor actividad simbólica (uso de ocre, cuentas de concha, marcas deliberadas) a partir de hace unos 100.000 años, lo que puede indicar el uso del lenguaje pero no constituye prueba de ello.

Una visión competidora, asociada con el arqueólogo Richard Klein, sitúa el surgimiento de la modernidad conductual (y por implicación, del lenguaje) hace aproximadamente 50.000 años, coincidiendo con la “Revolución del Paleolítico Superior” en Europa. Esta hipótesis ha perdido fuerza a medida que han surgido evidencias anteriores de comportamiento simbólico en yacimientos africanos, pero el debate ilustra cuánto dependen las conclusiones de la evidencia indirecta que se privilegia.

La genética del lenguaje: FOXP2 y más allá

El descubrimiento del gen FOXP2 a finales de los años 1990 por el grupo de Simon Fisher en Oxford generó inicialmente una enorme expectativa. El gen fue identificado mediante el estudio de la familia KE, una familia británica en la que una mutación dominante causaba dispraxia verbalUn trastorno neurológico que afecta la capacidad de coordinar los movimientos musculares necesarios para hablar, a pesar de la comprensión del lenguaje intacta y las habilidades motoras normales para otras acciones. severa (dificultad con los movimientos coordinados necesarios para el habla) en tres generaciones. La cobertura mediática rápidamente etiquetó a FOXP2 como el “gen del lenguaje”.

Esta etiqueta era prematura. FOXP2 es un factor de transcripción que regula otros genes durante el desarrollo embrionario, y no es exclusivo de los humanos. Los homólogos existen en ratones, aves y otros vertebrados. Un hallazgo de 2008 de que los neandertales compartían la misma variante derivada de FOXP2 que los humanos modernos socavó aún más la idea de que este gen por sí solo explica la capacidad lingüística humana, ya que los neandertales muestran “casi ninguna evidencia del pensamiento simbólico” característico de los Homo sapiens contemporáneos, como señaló Pagel en BMC Biology.

La investigación actual trata a FOXP2 como un componente de un rasgo poligénicoDescribe un rasgo o enfermedad influenciado por muchos genes, cada uno con un pequeño efecto. La mayoría de enfermedades comunes como la diabetes son poligénicas. complejo. El gen influye en el control motor orofacial y ciertos aspectos del aprendizaje procedimental, pero los individuos con mutaciones de FOXP2 aún pueden comprender el lenguaje. La lección es instructiva: el lenguaje no es una única adaptación producida por un único gen. Es un conjunto de capacidades (control articulatorio, memoria de trabajo, procesamiento jerárquico, cognición social) que probablemente evolucionó de forma incremental a lo largo de cientos de miles de años.

La composicionalidadLa capacidad de combinar un conjunto finito de elementos (palabras, sonidos o símbolos) en un número infinito de expresiones significativas mediante reglas sistemáticas. Es la característica definitoria del lenguaje humano.: la característica definitoria del lenguaje humano

La distinción central entre el lenguaje humano y todos los sistemas de comunicación animal conocidos es la composicionalidad (compositionality): la capacidad de combinar unidades discretas en expresiones estructuradas, organizadas jerárquicamente, con semántica composicional. Esta es la propiedad que Noam Chomsky llama “infinidad discretaPropiedad central del lenguaje humano en la cual un conjunto finito de elementos puede combinarse recursivamente para generar un número ilimitado de expresiones significativas y distintas.”: un inventario finito de elementos genera un conjunto ilimitado de expresiones significativas mediante combinación recursiva.

El análisis de Mark Pagel de 2017 en BMC Biology cuantifica esto: con 25 palabras cada una para sujetos, verbos y objetos, el espacio combinatorio supera las 15.000 oraciones antes de tener en cuenta el tiempo, el aspecto, el modo o la incrustación. Ningún sistema de comunicación animal documentado se acerca a esta capacidad generativa.

El debate teórico sobre la composicionalidad se divide a grandes rasgos en dos campos. La posición nativista (Chomsky y sucesores) sostiene que la capacidad de estructura sintáctica jerárquica es innata, específica de la especie y específica del dominio, codificada como una “Gramática Universal” en el genoma humano. La posición basada en el uso (Tomasello, Bybee, Goldberg, entre otros) argumenta que la estructura lingüística surge de capacidades cognitivas generales (reconocimiento de patrones, analogía, aprendizaje socialEn criminología, el proceso mediante el cual los individuos adquieren comportamiento criminal a través de la observación e imitación de otros, particularmente figuras de autoridad. Los niños que presencian violencia aprenden a normalizarla como método de control., atención conjunta) aplicadas a la interacción comunicativa a lo largo del tiempo de desarrollo. Este debate permanece sin resolver, aunque la posición nativista fuerte ha perdido terreno a medida que se han acumulado datos tipológicos y de adquisición.

Sistemas de escritura: invención independiente y difusión

La escritura fue inventada de forma independiente como máximo cuatro veces en la historia humana: en Mesopotamia (cuneiforme, c. 3400 a.C.), Egipto (jeroglíficos, c. 3200 a.C., posiblemente influenciado por Mesopotamia), China (escritura en huesos oraculares, c. 1200 a.C.) y Mesoamérica (zapoteca/maya, c. 900 a.C.). Todos los demás sistemas de escritura en uso hoy derivan de uno de estos por préstamo, adaptación o difusión de estímulo.

El desarrollo de la escritura alfabética representa una transición de fase crítica. El cuneiforme y los jeroglíficos usaban principios logográficos y silábicos que requerían cientos de signos. El proto-sinaítico (c. 1800 a.C.), desarrollado por trabajadores de habla semítica en la península del Sinaí, redujo la escritura a aproximadamente 22 signos consonánticos usando el principio acrófono: cada signo representaba el fonema inicial del objeto representado. El alfabeto fenicio (c. 1050 a.C.) refinó este sistema y, a través de la adaptación griega (que añadió signos vocálicos), se convirtió en el ancestro de prácticamente todos los alfabetos en uso hoy, incluidos el latino, el cirílico y (vía el arameo) el hebreo, el árabe y los alfabetos brahámicos.

Las implicaciones cognitivas son significativas. La alfabetización puede adquirirse en meses en lugar de años, lo que reduce considerablemente la barrera a la participación textual. Este cambio correlaciona históricamente con tasas de alfabetización más amplias, aunque la relación causal es compleja (los factores políticos, económicos y religiosos median fuertemente la conexión).

La amenaza a las lenguas: datos actuales

De los aproximadamente 7.000 idiomas que se hablan actualmente, la UNESCO y el Proyecto de Lenguas en Peligro clasifican entre el 40 y el 50 por ciento como en peligro. La distribución es muy desigual: aproximadamente 23 idiomas representan más de la mitad de los hablantes del mundo, mientras que miles de idiomas tienen comunidades que se cuentan en centenares o menos.

La muerte de las lenguas no es nueva (el sumerio dejó de hablarse alrededor del 2000 a.C.; el etrusco desapareció bajo la asimilaciónProceso mediante el cual la identidad cultural, lingüística o étnica de un grupo minoritario es gradualmente absorbida por una cultura dominante, a menudo por presión institucional como la política educativa. romana), pero la tasa actual no tiene precedente. Las estimaciones varían, pero las proyecciones sugieren que entre el 50 y el 90 por ciento de los idiomas existentes podrían dejar de hablarse para el año 2100. Los principales impulsores son la urbanización, la integración económica, las políticas educativas que imponen idiomas dominantes y las políticas lingüísticas deliberadas a nivel estatal.

El costo científico de la pérdida de lenguas va más allá del patrimonio cultural. Las lenguas codifican sistemas de categorización, marcos de razonamiento espacial y conocimiento ecológico que puede no ser recuperable a través de la traducción. La disputada ausencia de recursividad en el pirahã, el sistema de referencia espacial absoluta del guugu yimithirr y las elaboradas taxonomías botánicas de las lenguas amazónicas representan todos puntos de datos para entender los límites y la flexibilidad de la cognición humana. Cada lengua perdida reduce la base empírica para probar teorías sobre lo que las mentes humanas pueden y no pueden hacer con el lenguaje.

Preguntas abiertas

La historia del lenguaje contiene más incógnitas que certezas, lo que en sí mismo es un dato útil sobre el estado de la ciencia. Entre las grandes preguntas sin resolver:

  • Monogénesis vs. poligénesis: ¿Surgió el lenguaje una sola vez, con todos los idiomas descendiendo de una proto-lengua única? ¿O surgió de forma independiente en múltiples poblaciones? La evidencia genética (la capacidad lingüística que precede a las escisiones de población) favorece la monogénesis, pero esto sigue siendo debatible.
  • Surgimiento gradual vs. saltacional: ¿Evolucionó el lenguaje de forma incremental a lo largo de cientos de miles de años, o una sola mutación (la hipótesis del “gran salto adelante” de Chomsky) habilitó la capacidad completa de forma relativamente repentina?
  • La pregunta neandertal: ¿Tenían lenguaje los neandertales? Poseían el hueso hioides, FOXP2 y cerebros grandes, pero dejaron evidencia mínima de comportamiento simbólico. La pregunta no está resuelta.
  • El papel del gesto: Algunos investigadores (especialmente Michael Corballis) argumentan que el lenguaje comenzó como gesto manual y solo más tarde pasó al habla. La plena complejidad gramatical de las lenguas de señas apoya la plausibilidad de esta vía, aunque la evidencia directa no está disponible.

La Sociedad Lingüística de París levantó su prohibición de 1866 en espíritu, aunque no formalmente, a finales del siglo XX. La cuestión de los orígenes del lenguaje se considera ahora un campo legítimo de investigación. La evaluación honesta de 160 años de investigación renovada: sabemos considerablemente más sobre cuándo y dónde, pero el cómo sigue siendo el problema más difícil de las ciencias cognitivas.

¿Qué le pareció este artículo?
Compartir este artículo

¿Un error? Avísanos

Fuentes