Toutes les langues humaines documentées partagent une caractéristique absente dans les systèmes de communication animale : la capacité d’imbriquer des idées les unes dans les autres, à l’infini. Un enfant capable de dire « le chat s’est assis » peut aussi dire « je pense que le chat s’est assis », puis « maman sait que je pense que le chat s’est assis », et ainsi de suite sans limite. Cette capacité d’évolution de la syntaxe récursive représente la frontière cognitive la plus marquée entre l’esprit humain et celui de nos plus proches parents primates[s].
Le mystère de l’évolution de la syntaxe récursive
Les scientifiques ont passé des décennies à tenter de comprendre ce qui distingue fondamentalement le langage humain des cris, gestes et signaux utilisés par les autres espèces. La réponse, selon un article influent publié en 2002 par Marc Hauser, Noam Chomsky et W. Tecumseh Fitch, se résume à une seule chose : la récursivitéCapacité à imbriquer une structure grammaticale dans une autre du même type, produisant des phrases d'une profondeur et complexité illimitées.[s].
La récursivité consiste à imbriquer une structure dans une autre du même type. Quand vous dites « le chien qui a poursuivi le chat qui a mangé la souris », vous avez enchâssé une proposition relative dans une autre. Cette capacité à empiler des structures crée une puissance expressive infinie à partir d’éléments finis.
La théorie propose que les humains possèdent une « faculté étroite du langage » contenant une seule opération unique : la capacité de prendre deux éléments et de les combiner en une nouvelle unité. Les linguistes appellent cette opération « Fusion » (Merge)[s]. Le mot « le » fusionne avec « pomme » pour créer « la pomme ». Cette expression peut ensuite fusionner avec « a mangé » pour former « a mangé la pomme ». Crucialement, la Fusion peut s’appliquer à son propre résultat, créant des hiérarchies d’une profondeur illimitée. C’est cette évolution de la syntaxe récursive qui a tout changé.
Ce que les primates ne peuvent pas faire
Pour vérifier si l’évolution de la syntaxe récursive est vraiment unique à l’humain, les chercheurs ont mené des expériences minutieuses avec nos plus proches parents. Les résultats montrent systématiquement une limite que les primates ne peuvent franchir.
Dans une étude marquante, des tamarins à crête blanche ont été entraînés à reconnaître des séquences suivant des règles simples comme ABAB. Ils ont appris ce motif sans difficulté. Mais lorsque les chercheurs ont tenté de leur enseigner des séquences nécessitant un traitement hiérarchique, comme AABB où les éléments doivent être mentalement imbriqués, les tamarins ont échoué complètement[s].
Les études sur le langage des grands singes racontent une histoire similaire. Kanzi, un bonobo ayant appris à communiquer à l’aide de symboles visuels, a démontré des capacités impressionnantes. Une analyse statistique a confirmé qu’il comprenait l’ordre des mots en anglais suffisamment bien pour distinguer « verse le Coca dans la limonade » de « verse la limonade dans le Coca »[s]. Pourtant, même Kanzi a atteint un plafond. Alors que les enfants humains passent rapidement des énoncés de deux mots à des phrases complexes vers l’âge de trois ou quatre ans, les chimpanzés entraînés pendant des années n’ont jamais appris à combiner des symboles en véritables structures multi-éléments[s].
Quand cette capacité est-elle apparue ?
De nouvelles preuves génomiques suggèrent que notre capacité langagière unique existait déjà il y a au moins cent trente-cinq mille ans[s]. Les chercheurs ont analysé quinze études génétiques retraçant le moment où les populations humaines ont commencé à se répandre à travers le globe. Puisque toutes les langues humaines semblent apparentées et que toutes les populations possèdent le langage, cette capacité devait exister avant la première grande séparation géographique.
Les archives archéologiques confirment cette chronologie. Il y a environ cent mille ans, des comportements symboliques apparaissent soudainement : des marques significatives sur des objets, des pigments décoratifs, des activités organisées suggérant une communication coordonnée. Le langage a probablement déclenché cette explosion de la pensée symbolique[s].
La faculté de langage est apparue quelque part entre soixante-dix mille et cent mille ans, et elle est restée stable depuis[s]. Les langues individuelles changent constamment, mais l’évolution de la syntaxe récursive sous-jacente n’a pas été modifiée. Un enfant de n’importe quelle population peut apprendre n’importe quelle langue avec la même facilité.
Où réside la récursivité dans le cerveau ?
L’imagerie cérébrale a localisé cette capacité récursive dans l’aire de Brodmann 44, une sous-région de l’aire de Broca dans le cortex frontal gauche[s]. Cette région s’active spécifiquement lors du traitement de structures hiérarchiques, que ce soit dans des phrases à enchâssements complexes ou dans d’autres séquences régies par des règles.
Un faisceau de fibres de substance blanche appelé faisceau arquéFaisceau de fibres nerveuses reliant l'aire de Broca au cortex temporal; sa robustesse est liée à la capacité à traiter des phrases complexes. relie cette zone au cortex temporal. Les études montrent que la force de cette connexion est corrélée à la capacité des individus à traiter des phrases syntaxiquement complexes. Critiquement, ce faisceau particulier n’est pas bien développé à la naissance, mais il mûrit tout au long de l’enfance sous l’influence des entrées langagières.
Les indices génétiques
Le gène FOXP2 a suscité une attention considérable en tant que « gène du langage » potentiel après que des chercheurs ont découvert que des mutations dans ce gène provoquent des troubles sévères de la parole. Cependant, le tableau s’est complexifié. Les deux changements d’acides aminés dans le FOXP2 humain étaient déjà présents chez notre ancêtre commun avec les Néandertaliens, ce qui signifie qu’ils sont apparus avant l’émergence des humains modernes[s].
Les chercheurs reconnaissent désormais que FOXP2 est davantage lié à la coordination motrice de la parole qu’à la syntaxe elle-même. La recherche se poursuit pour identifier les gènes sous-jacents à notre capacité récursive, avec des travaux récents identifiant des candidats supplémentaires comme CHD3, SETD1A et WDR5, qui jouent un rôle dans le développement cérébral[s].
Implications pour la compréhension de nous-mêmes
L’histoire de l’évolution de la syntaxe récursive dépasse le cadre de la linguistique. La même capacité qui nous permet d’imbriquer des propositions les unes dans les autres pourrait sous-tendre notre aptitude à raisonner sur des croyances imbriquées (« je pense qu’elle sait qu’il soupçonne »), à planifier des futurs en plusieurs étapes et à construire des preuves mathématiques. L’unicité humaine pourrait provenir d’une seule innovation computationnelle que la nature n’a trouvée qu’une fois.
Comprendre cet écart a aussi des implications pratiques. Si le langage humain dépend d’une capacité computationnelle spécifique plutôt que d’une intelligence générale, alors les systèmes artificiels tentant de traiter le langage naturel pourraient avoir besoin d’architectures qui supportent explicitement la structure récursive.
Comme le dit le linguiste du MIT Shigeru Miyagawa : « Le langage humain est qualitativement différent parce qu’il y a deux choses, les mots et la syntaxe, qui travaillent ensemble pour créer ce système très complexe. Aucune autre espèce animale ne possède une structure parallèle dans son système de communication. »[s]
Les propriétés computationnelles qui distinguent le langage humain de tous les systèmes de communication animale connus reposent sur une seule opération récursive. Selon la Thèse Minimaliste Forte, la Fusion (Merge) prend deux objets syntaxiques a et b et les assemble en l’ensemble {a, b}[s]. Cette opération s’applique à son propre résultat, générant des structures hiérarchiques d’une profondeur illimitée. Comprendre l’évolution de la syntaxe récursive exige d’examiner ce que fait cette opération, pourquoi les primates non humains en sont dépourvus, et quand elle est apparue dans notre lignée.
La faculté étroite du langage et l’évolution de la syntaxe récursive
Hauser, Chomsky et Fitch (2002) ont distingué entre une faculté large du langage (FLB), comprenant des systèmes cognitifs partagés entre espèces et domaines, et une faculté étroite du langage (FLN) contenant des mécanismes uniques au langage humain[s]. Leur hypothèse : la FLN ne contient que la récursivitéCapacité à imbriquer une structure grammaticale dans une autre du même type, produisant des phrases d'une profondeur et complexité illimitées..
La Fusion opère selon deux modes. La Fusion Externe (FE) combine deux éléments distincts : {le} et {livre} donnent {le, livre}. La Fusion Interne (FI) prend un élément déjà présent dans une structure et le refusionne, créant des effets de déplacement : {quoi} et {garçons, {mangent, quoi}} donnent {quoi, {garçons, {mangent, quoi}}}[s]. Les deux sont des sous-cas de la même opération primitive.
Berwick et Chomsky soutiennent que la Fusion est apparue en une seule étape, plutôt que par des précurseurs incrémentiels. Les propositions décomposant la Fusion en étapes évolutives distinctes, affirment-ils, méconnaissent la simplicité computationnelle de cette opération[s]. Une capacité combinatoire récursive existe ou n’existe pas ; une demi-Fusion est incohérente. C’est cette évolution de la syntaxe récursive qui a tout changé.
Tests empiriques avec les primates non humains
L’hypothèse de la récursivité génère des prédictions vérifiables. Si la FLN ne contient que la récursivité, les primates non humains devraient acquérir des grammaires à états finis, mais échouer face à des grammaires de structure syntagmatique nécessitant un enchâssement hiérarchique.
Fitch et Hauser (2004) ont exposé des tamarins à crête blanche à des séquences de syllabes générées soit par des grammaires à états finis ((AB)n), soit par des grammaires de structure syntagmatique (AnBn, où chaque A doit s’apparier à un B correspondant par enchâssement). Les tamarins habitués aux séquences à états finis ont réagi plus longtemps aux violations, indiquant un apprentissage. Mais ils n’ont montré aucune réaction différentielle aux violations de structure syntagmatique[s].
Des études avec des étourneaux européens ont initialement suggéré que les oiseaux pouvaient discriminer des motifs de structure syntagmatique. Cependant, une analyse ultérieure a révélé que leur succès reposait sur des heuristiquesRaccourci mental ou règle empirique utilisée pour simplifier les décisions, pouvant mener à des erreurs si mal appliquée. plus simples, comme le comptage des transitions, plutôt que sur un véritable traitement hiérarchique. Les diamants mandarins traitant les chaînes « agrammaticales » comme grammaticales ont confirmé cette interprétation[s].
Les études sur le langage des grands singes éclairent cette frontière différemment. Kanzi, le bonobo, a démontré une compréhension statistiquement significative de l’ordre des mots en anglais dans des phrases réversibles, distinguant correctement « fais mordre le chien par le serpent » de « fais mordre le serpent par le chien »[s]. Cela montre une sensibilité aux indices d’ordre linéaire. Pourtant, en comparant les trajectoires développementales, les enfants humains étendent rapidement la longueur de leurs énoncés entre deux et quatre ans, tandis que les chimpanzés entraînés stagnent indéfiniment à des combinaisons d’un ou deux symboles[s].
Le défi du pirahã
Les affirmations de Daniel Everett concernant le pirahã ont suscité une controverse en suggérant l’existence d’une langue humaine sans enchâssement récursif. L’analyse du corpus de discours pirahã naturel n’a trouvé aucune preuve non ambiguë d’enchâssement central, de compléments phrastiques, de possesseurs enchâssés ou de conjonctions[s]. Les données sont plausiblement compatibles avec une grammaire régulière (non récursive).
Cependant, cela ne réfute pas l’hypothèse de la récursivité. Nevins et al. ont noté que la Fusion s’applique dès que plus de deux mots se combinent ; la question est de savoir si l’enchâssement constitue une faculté distincte. Les phrases pirahãs contenant trois mots ou plus démontrent l’application de la Fusion. Que la langue manque de certains types d’enchâssement reflète des facteurs culturels ou cognitifs orthogonaux à la question de savoir si les locuteurs possèdent une capacité récursive.
L’hypothèse de l’intégration
L’hypothèse de l’intégration propose que le langage est apparu rapidement en reliant deux systèmes préexistants : un système expressif (E) ressemblant à la syntaxe du chant des oiseaux (motifs sans signification référentielle) et un système lexical (L) ressemblant aux cris d’alarme des primates (unités référentielles dépourvues de combinatoire)[s].
La Fusion a déclenché l’intégration de ces systèmes, produisant un langage pleinement développé sans étapes protolinguistiques transitoires[s]. Les mots émergent lorsque les racines se combinent avec des traits catégoriels et grammaticaux par la Fusion. Cette hypothèse remet en question les récits gradualistes postulant des opérations proto-Fusion sans structure, générant des composés plats.
Implémentation neuronale
La neuroimagerie localise systématiquement le traitement syntaxique hiérarchique dans l’aire de Brodmann 44 du gyrus frontal inférieur gauche[s]. BA 44 se connecte aux régions temporales supérieures postérieures via le faisceau arquéFaisceau de fibres nerveuses reliant l'aire de Broca au cortex temporal; sa robustesse est liée à la capacité à traiter des phrases complexes. dorsal/faisceau longitudinal supérieur. Les études de connectivité fonctionnelle confirment une activation coopérative lors du traitement de phrases complexes.
Les études développementales montrent que la maturation de la voie dorsale est corrélée à la précision de la compréhension syntaxique. Les études sur les patients confirment que les lésions de ce faisceau altèrent sélectivement le traitement des phrases hiérarchiquement complexes, tout en épargnant les structures plus simples traitées via les voies ventrales.
Les comparaisons interespèces de la substance blanche révèlent que, bien que les primates non humains possèdent des connexions fronto-temporales analogues, la voie spécifique reliant BA 44 au cortex temporal présente une élaboration propre à l’humain. Cette différence structurelle pourrait sous-tendre la différence de capacité computationnelle, et donc l’évolution de la syntaxe récursive. Cette capacité unique marque un tournant dans l’histoire évolutive, illustrant comment l’évolution de la syntaxe récursive a façonné notre cognition.
Chronologie évolutive
Une méta-analyseUne méthode de recherche qui combine et analyse les données de plusieurs études indépendantes pour identifier des modèles ou effets globaux. des données génomiques situe la capacité langagière il y a au moins cent trente-cinq mille ans, avant la première grande séparation des populations d’Homo sapiens[s]. Les preuves archéologiques de comportements symboliques il y a environ cent mille ans suggèrent que le langage est entré en usage communicatif à cette époque.
D’autres estimations placent l’évolution de la syntaxe récursive entre soixante-dix mille et cent mille ans[s]. La faculté ne montre aucun signe de modification depuis son émergence : aucune différence populationnelle dans la capacité d’acquisition du langage n’existe, malgré la divergence génétique pour d’autres traits.
L’histoire de FOXP2 illustre la complexité de l’analyse génétique. Les premières découvertes suggéraient une sélection positive récente sur deux substitutions d’acides aminés. Cependant, l’ADN ancien a montré que ces changements précédaient la séparation humain-Néandertal, étant déjà présents chez notre ancêtre commun[s]. FOXP2 est principalement lié aux aspects moteurs de la parole plutôt qu’à la syntaxe en soi. L’identification des gènes sous-jacents à la capacité récursive reste une frontière active de la recherche.
Implications théoriques
La récente apparition et la stabilité de la faculté langagière soutiennent la Thèse Minimaliste Forte. Si la Fusion était apparue par accumulation graduelle de capacités précurseures, nous nous attendrions à observer une variation détectable de la capacité syntaxique entre les populations ou des preuves d’étapes intermédiaires dans les archives archéologiques. Rien de tel n’apparaît.
L’unicité de l’évolution de la syntaxe récursive parmi les capacités cognitives soulève des questions sur la spécificité de domaine. La musique, les mathématiques et la théorie de l’esprit impliquent toutes un traitement hiérarchique. La question de savoir si ces activités recrutent le même substrat neuronal que la Fusion syntaxique, ou représentent des implémentations parallèles d’un principe computationnel plus général, reste débattue. Les preuves actuelles suggèrent des réseaux sélectifs à un domaine plutôt que des réseaux généraux[s].



