Une découverte qui contribue à un tournant de l’islamologie

Walter_codes Interview de l'auteur:
Walter Jean-Jacques,
Le Coran révélé par la Théorie des Codes, éditions de Paris, juillet 2014, 28 €, 296 p.

      Les mathématiques sont un outil permettant d’analyser des textes. Elles y concourent bien davantage que par de simples études statistiques de mots ou de suites de mots, qui mettent en lumière les thématiques présentes dans le texte mais ne parviennent pas à définir des caractéristiques stylistiques rigoureusement propres à tel auteur, et cela d’autant moins que son style littéraire ou ses préoccupations peuvent évoluer. La Théorie des Codes, qui peut s’appliquer aux textes écrits comme au séquençage du génome humain, va beaucoup plus loin en effet. Sous sa forme d’analyse des données textuelles, elle a permis de montrer qu’une pièce mineure de Shakespeare, dont l’authenticité était discutée du fait des différences de style par rapport à ses autres œuvres, était bien de lui (T. Merriam, 2002).

      Chaque auteur présente une signature stylistique dont il n’a pas conscience et qui ne change que très peu. L’outil mathématique va parvenir à la mettre en lumière en comparant des ensembles textuels par groupe de 500 caractères (au minimum) en fonction de n hypothèses à vérifier – ce qui génère des calculs à n dimensions. Ces opérations peuvent occuper un ordinateur durant des heures, mais les résultats sont probants : un auteur pourra être identifié avec une certitude qui peut dépasser 999 999 chances sur un million.

      L’un des atouts du livre est de présenter les résultats de manière systématique, sobre et ramassée, notamment en recourant à la représentation suggestive des nuages de résultats, comme le font les mathématiciens. Passionné de mathématiques et familier du Proche-Orient depuis plus de quarante ans, Jean-Jacques Walter a bénéficié du concours d’un spécialiste, et ce livre découle du doctorat en islamologie qu’il a soutenu en décembre 2013 à l’Institut Catholique de Toulouse, en présence d’éminents mathématiciens. L’énorme défi de la recherche consistait à optimiser l’outil d’analyse mathématique aux caractéristiques du texte coranique qui, chacun le sait, compte 114 sourates de longueur extrêmement inégales, et dont les plus longues paraissent rarement faites d’une seule pièce.

      Le regroupement par thèmes permit déjà de mieux classifier le matériel textuel en 26 ensembles consistants – l’outil mathématique ne peut pas fonctionner sur un ensemble inférieur à 1000 caractères (les plus petites sourates en ont beaucoup moins). À partir de là, l’analyse des données a permis de mettre en lumière 19 signatures correspondant à 9 auteurs uniques et à 10 auteurs multiples.

      Au terme des calculs, il apparaît qu’au minimum 30 auteurs ont œuvré au texte coranique tel qu’il se présente aujourd’hui, mais mathématiquement moins de 100, le chiffre le plus probable selon une courbe de Gauss étant celui de 50. Et, bien sûr, ces auteurs s’étalent sur de nombreuses années. Ces résultats n’ont pas vraiment surpris le chercheur chiite qui participait au jury.

      Il va falloir du temps à l’ensemble des chercheurs pour assimiler cette approche qui renouvelle complètement l’exégèse coranique. Une petite synthèse communiquée en 2012 permettait d’esquisser un tableau – par nature incomplet – de versets coraniques suspectés de comporter ou de constituer une manipulation ; leur nombre s’élevait alors à 46 et il s’agissait presque toujours d’interpolations. Rien ne permettait d’affirmer que chaque altération apportée correspondait à un auteur différent : seule une différence évidente d’époque l’assurerait. L’analyse des données textuelles élargit cette question : l’histoire du texte coranique est certainement plus complexe que celle de simples interpolations successives (et de quelques soustractions). On est amené par exemple à poser l’hypothèse de l’intervention, à un moment donné au moins, d’une commission de scribes produisant du texte coranique.

      Prenons un exemple simple de ce qu’apporte l’analyse statistique textuelle. Selon la légende islamique, Mahomet aurait « émis » ses sourates dans le contexte paisible de La Mecque, puis d’autres beaucoup plus guerrières à Médine. On aurait donc deux gros ensembles de sourates, supposées présenter des différences identifiables. Or, quels que soient les outils de comparaisons utilisés (ou composantes stylistiques assurées), aucune différence stylistique n’apparaît globalement (p.218). Déjà, à une lecture attentive et libre des interprétations islamiques, cette répartition apparaissait clairement arbitraire. C’est démontré aujourd’hui mathématiquement : la répartition du Coran en sourates mecquoises et médinoises est sans valeur. Elle a été inventée en vue d’accommoder la « lecture » du Coran au récit légendaire sur Mahomet.

      L’un des intérêts de l’outil mathématique appliqué aux données textuelles, c’est qu’on peut le faire tourner avec de nouvelles requêtes, en vue d’affiner et de préciser sans cesse les résultats. Par exemple, on peut refaire les calculs en enlevant du texte coranique tel(s) groupe(s) de petites interpolations identifiées grâce à l’analyse historico-critique, et voir si le nombre global de signatures stylistiques différentes en serait affecté. Etc.

      L’islamologie a pris un tournant décisif.

  Page d'accueil