L’intelligence artificielle s’attaque aux données non structurées, et parmi celles-ci, au langage : vaste chantier, car ce dernier ne se code et ne se décode pas comme les informations digitales qui circulent sur la toile.
Ainsi, si après avoir lu cet article, vous vous écriez : « Vraiment génial », cela ne signifiera pas pour autant que vous avez particulièrement apprécié ; peut-être même qu’au contraire, vous maniez la rhétorique et parlez par antiphrase – figure de style consistant à dire le contraire de ce que l’on pense.
Bref, tout dépend de la personne qui s’exprime, du degré de complicité qu’elle entretient avec son interlocuteur, du contexte, etc. : tout cela se situe bien loin du célèbre modèle de Shannon et Weaver, qui régit les télécommunications.
Dans La Pertinence, Dan Sperber et Deidre Wilson précisent : « D’Aristote aux sémioticiens modernes, toutes les théories de la communication ont été fondées sur un seul et même modèle, que nous appellerons le modèle du code. Selon ce modèle, communiquer, c’est coder et décoder des messages. Récemment, plusieurs philosophes, dont Paul Grice et David Lewis, ont proposé un modèle tout à fait différent, que nous appellerons le modèle inférentiel. Selon le modèle inférentiel, communiquer, c’est produire et interpréter des indices ».
« Patrick a acheté Libération » peut tant signifier : « Patrick a acheté un exemplaire de Libération » que : « Patrick a acheté l’entreprise qui publie Libération ». Des lecteurs lambdas n’ont aucun mal à choisir le premier sens ; mais pour des amis de Patrick Drahi, c’est le second qui s’impose.
Selon Umberto Eco dans Lector in fabula, « un texte, tel qu’il apparaît dans sa surface (ou manifestation) linguistique, représente une chaîne d’artifices expressifs qui doivent être actualisés par le destinataire ».
Cette actualisation d’artifices expressifs, proche de l’inférence de Grice, s’effectue à quatre niveaux, ce que nous illustrerons au travers du drame d’Œdipe :
- Celui des structures discursives, très proche du texte dans sa linéarité, dont il conserve décalages temporels, digressions et autres parenthèses : ignorant que le vieillard assassiné par Oedipe est son père Laïos, le spectateur demeure en haleine.
- Celui des structures narratives redistribue le discours en schémas fondamentaux, rétablit la logique temporelle des opérations : désormais convaincu de l’horreur du parricide, le spectateur accède au tragique d’un Oedipe maudit par les dieux.
- Celui des structures actancielles, où dépouillés de leur individualité, les acteurs n’existent qu’au travers de leurs actes : Oedipe occupe successivement les rôles de parricide, de héros triomphant, puis de héros maudit, et Laïos devient l’instrument de cette malédiction.
- Celui des structures idéologiques, où la « charpente actancielle est investie de jugements de valeurs et (où) les rôles véhiculent des oppositions axiologiques » : là où le lecteur contemporain réprouvera le parricide, et l’analyste freudien diagnostiquera quelque complexe, Sophocle condamnait l’ubricité du héros triomphant.
Pour prendre un exemple plus récent, Stars War prend une nouvelle dimension dramatique au passage des structures discursives et narratives quand on découvre que Dark Vador est le père de Luke Skywalker et la princesse Leia ; quant à l’idéologie sous-jacente, elle diffère d’un spectateur à l’autre, selon que la dimension symbolique que l’on cherche – ou non – à y lire.
Dans le Système de la Mode, dépouillant Elle et le Jardin des Modes, Roland Barthes évoquait la « phraséologie du journal (qui) constitue un message connotant, destiné à transmettre une certaine vison du monde », phraséologie qui procède des structures idéologiques d’Eco.
Cet ultime niveau d’analyse se superposait à ceux de la dénotation, la connotation et des métalangages, participant des systèmes rhétorique : impossible d’y accéder sans tenir compte des précédents, sans s’appuyer sur leur sens.
Tout cet article peut paraître bien complexe … mais c’est en fait le langage humain qui se révèle d’un complexité extraordinaire – échappant ainsi aux codages et décodages basiques de Shannon et Weaver, qui encombrent pourtant bien des ouvrages de marketing et de publicité.
La multiplication des « langues », ou plutôt des « parlers » actuels ne facilite pas l’analyse : entre prosélytisme ou refus de l’écriture inclusive, utilisation intensive de smileys, divers argots, chacun ajoute sa petite touche personnelle pour marquer sa différence ou au contraire, affirmer son appartenance à un groupe social.
Récemment, un ami répond à un de mes mails en capitales ; quelques jours plus tard, je lui demande ce qui l’a énervé : « En colère ? Pas du tout, le clavier de mon smartphone était en majuscule, je n’ai pas changé », me répond-il : comment une AI l’interprétera-t-elle ?
Le langage constitue un réel défi pour les AI : très longtemps, elles en ignoreront les subtilités – réception approximative – et ne répondront à nous demandes que par des discours accessibles au plus grand nombre – création d’un nouveau et nème parler, celui de la robotique.