Un logiciel prix Goncourt ?

Brouillon du texte paru en octobre 2007 au Passager Clandestin  
en supplément documentaire à la deuxième édition de Romanesque2.0
cf http://romanesque.fr 

Pour se procurer l’ouvrage imprimé, on peut le commander à l’éditeur  , l’acheter sur le web  ou encore l’acheter à Alapage, FNAC, Amazon …Olivier Las Vergnas, 12 septembre 2007

1. Ne pas confondre « automate romancier » et « hypertexte »

La question des automates écrivains n’est pas nouvelle. Déjà J. Swift, dans ses Voyages de Gulliver, édités en 1726, mettait en scène un générateur de phrases, à base de cylindres et de dés sur lesquels étaient écrits des mots qui s’inter changeaient grâce à avec des manivelles.

“Sur chaque face des dés  étaient collés des papiers, et sur ces papiers on avait écrit tous les mots de la langue dans leurs différents modes, temps et déclinaisons, mais sans ordre. Le maître m’invita à regarder, parce qu’il allait mettre la machine en mouvement. À son commandement, les élèves prirent chacun une des manivelles de fer, au nombre de quarante, qui étaient fixées le long du métier, et, faisant tourner ces manivelles, ils firent changer totalement la disposition des mots. Le professeur commanda alors à trente-six de ses élèves de lire tout bas les lignes à mesure qu’elles paraissaient sur le métier, et quand il se trouvait trois ou quatre mots de suite qui pouvaient faire partie d’une phrase, il la dictait aux quatre autres jeunes gens qui servaient de secrétaires.”

Jonathan Swift, Les Voyages de Gulliver, 1726.

Ce dispositif ingénieux préfigurait la littérature combinatoire, qui allait devenir la thématique clef des surréalistes comme Raymond Queneau. Ils s’ingénièrent à explorer comment le travail de l’écrivain peut être singé ou caricaturé, voire dépassé par des variations systématiques. Ainsi, des textes emblématiques, comme les “Exercices de style”[1] proposant quatre-vingt dix neuf versions de la même anecdote ou les “Cent milliards de poèmes”[2] ont eu une influence déterminante sur la création littéraire durant tout le vingtième siècle. Il en va de même avec la « Bibliothèque de Babel »[3] qui, selon Jorge Luis Borgès, son auteur, aurait hébergé dans ses rayonnages tous les livres de 410 pages (voir encadré 1).

Généralisant l’idée de la poésie dans celle de la littérature à contrainte[4], Raymond Queneau et le mathématicien François Le Lyonnais fondèrent en 1960 l’Ouvroir de Littérature Potentielle, l’OuLiPo[5] avec un double projet. Il s’agissait d’une part d’imaginer et d’expérimenter des contraintes littéraires nouvelles et d’autre part d’étudier les œuvres passées à la lumière de ces nouveaux moyens. Plus récemment, l’Alamo (Atelier de Littérature Assisté par la Mathématique et les Ordinateurs) fondé par Paul Braffort et Jacques Roubaud en a prolongé les travaux en animant de fertiles réflexions sur les effets de l’accouplement chimérique de la littérature et de l’informatique.Encadré 1: la littérature combinatoire, de l’armée des douze millions de singes à la bibliothèque de Babel en passant par la fin du monde Dans “la bibliothèque de Babel“, Borgès met en scène une gigantesque bibliothèque universelle contenant tous les ouvrages du monde de 410 pages. L’idée fondatrice de cette bibliothèque est qu’il suffit de recueillir toutes les combinatoires possibles de toutes les lettres pour arriver à former si l’on dispose de suffisamment de temps tous les mots possibles, puis avec encore plus de temps tous les paragraphes… et tous les textes de 410 pages. 

Voilà qui renvoie au « miracle des singes dactylographes» inventée en 1913 par Émile Borel dans son ouvrage « Le hasard » [6] pour estimer la probabilité d’un événement. Il propose l’expérience suivante : « Concevons que l’on ait dressé un million de singes à frapper au hasard sur les touches d’une machine à écrire et que sous la surveillance de contremaîtres illettrés, ces singes dactylographes travaillent avec ardeur dix heures par jour avec un million de machines à écrire de types variés. Les contremaîtres illettrés rassembleraient les feuilles noircies et les relieraient en volumes. »  Dans son livre, Borel conclut qu’au bout d’un an le résultat serait dérisoire… et qu’il faudrait un temps presque infini pour produire tout le « contenu des plus riches bibliothèques du monde ». Cette conjecture mathématico-littéraire a généré de multiples clins d’œil à la littérature combinatoire dans de nombreuses œuvres au XXe siècle.

A signaler aussi dans la même veine, « les neuf milliards de noms de Dieu »[7], une nouvelle d’Arthur C. Clarke où cet auteur de science-fiction met en scène un ingénieur, lui plus efficace que les singes dactylographes : il installe un ordinateur dont le but est de réaliser la mission ultime de l’humanité qui est de coucher par écrit tous les noms de Dieu… Quand cette mission sera accomplie, l’univers s’éteindra, prévoit la croyance. Alors qu’il quitte le monastère où il vient de lancer le programme en charge de réaliser cette prophétie, il lève les yeux au ciel et découvre que les étoiles commencent à s’éteindre une à une.

La machine de Swift parait simple avec sa logique combinatoire. De fait, elle permet déjà de distinguer deux finalités différentes chez les auteurs qui inventent des littératures informatiques. D’un côté, certains créateurs d’hypertextes[8] proposent des générateurs d’œuvres variables offrant à chaque lecteur le moyen d’accéder en fonction de ses choix à autant de versions de l’œuvre qu’il le souhaite[9]. De l’autre, une seconde tendance essaie d’automatiser la production d’un roman au sens classique du terme.  Cette seconde tendance tente ainsi de seconder l’écrivain par un cerveau électronique, qui produit comme l’humain un texte à lire linéairement.

Le premier groupe connait aujourd’hui de grands développements au sein de la communauté des passionnés de la fiction interactive, qui produit de multiples œuvres diffusées gratuitement sur Internet[10]. Avec les évolutions techniques, il a aussi donné naissance à une autre série de productions destinés à être consultés uniquement sur écran. Ces œuvres se proposent d’utiliser les médias pour produire de nouveaux types d’œuvres qui sont des expériences “transitoires observables” pour reprendre la dénomination d’un des sites de référence en la matière[11]. Philippe Bootz, un de ses animateurs, précise que “La terminologie « transitoire observable » tient à son mode de production. Ce qui apparaît à l’écran est […un ] événement éphémère et transitoire qui n’est jamais fixé de façon définitive sur un support. »

Jean-Pierre Balpe, un des chefs de file de ce groupe, caractérise quant à lui ces trajectoires de la manière suivante : “Ce qui se manifeste dans toutes ces tentatives est une redéfinition de quelques-unes  des notions qui semblaient orienter la littérarité. Au texte, jusque-là installé et immobilisé dans la matérialité du livre comme un produit figé, définitif, vérifiable, quasi sacralisé et intouchable, se substitue une spectacularisation du processus et un « espace de textes » permettant un ensemble de jeux dans lesquels le « lecteur » – comment l’appeler autrement ?- se trouve changé en joueur …”[12]

2. Un cadavre exquis ne fait pas Romanesque

 

Aujourd’hui de multiples œuvres hypertextuelles et surtout hyper médiatiques -c’est-à-dire ne se limitant pas à de la « matière textuelle »[13] – sont disponibles sur Internet et témoignent de l’insatiable fertilité de l’activité artistique humaine ainsi que de sa capacité à s’approprier tout ce qui peut ressembler de près ou de loin à des médias d’expression. En revanche peu de chercheurs travaillent encore sur la génération de récits “classiques” de fiction. Certes, quelques enfants de l’Oulipo ou de l’Alamo ont développé des “générateurs littéraires” de différentes natures, mais de fait, ils ont surtout produit des logiciels qui inventent quelques phrases poétiques ou humoristiques. Malgré la grande richesse d’Internet, force est de constater que l’on ne trouve aujourd’hui en ligne que des réminiscences de telle ou telle expérience de roman auto-généré comme ceux de J.-P. Balbe, mais aucun réel générateur automatique de roman classique au sens de celui exposé dans Romanesque 2.0.

Pour se poser la question de la vraisemblance d’un logiciel comme Romanesque, essayons de préciser ses spécificités. Sa finalité est de produire une œuvre romanesque classique, destinée à être lu comme n’importe quel autre roman, même s’il peut, dans les phases de conception du texte, produire de multiples récits composés de fragments dont l’agencement est variable. Romanesque peut ainsi par moment s’appuyer sur des stratégies qui font penser à un “cadavre exquis”, processus de production aléatoire (comme celui inventé par J. Swift) ou collectif (comme celui rendu célèbre par les surréalistes, où chacun écrit à son tour un mot d’une phrase, sans avoir connaissance des mots précédents). Historiquement,  le processus en question s’utilise au niveau d’une phrase, mais il peut aussi s’imaginer à d’autres échelles (juxtaposition de phrases normalement non liées pour créer automatiquement des paragraphes). Il a connu récemment une nouvelle jeunesse avec la mode des Haïkus dont la compacité et l’apparente simplicité syntaxique peut laisser croire qu’ils pourraient être facilement automatisables.

Ce processus des « cadavres exquis » peut ainsi servir à générer une ou plusieurs phrases pour le plaisir ou la curiosité. C’était le cas pour les surréalistes qui l’associaient à l’idée de l’écriture automatique. C’est un jeu, mais il flirte avec une sorte de défi prométhéen  dont l’objet est la création d’un automate écrivain. Ses phrases autogénérées ont même un sens et c’est d’ailleurs pour cela que les cadavres exquis émeuvent le lecteur. Bien qu’ils produisent des phrases absurdes, il semble néanmoins s’en dégager un embryon de sens. En fait, ils laissent pressentir que la séparation apprise à l’école entre syntaxe creuse et sémantique portant le sens n’est pas pertinente. Cela est d’autant plus perceptible avec des cadavres exquis à contraintes, qui puisent leur mots dans un réservoir spécifique à un univers (culinaires, mythologiques, astronomiques… ) Ainsi peut-on produire des phrases qui non seulement sont correctes syntaxiquement mais qui de plus semblent véhiculer un sens précis à chaque coup, car tous les mots employés résonnent entre eux en étant partie prenante d’univers partagés.

Bien évidemment, on peut toujours imaginer sa mise en œuvre à l’échelle d’un roman. On générerait des phrases aléatoires que l’on assemblerait dans des paragraphes aléatoires, eux-mêmes tirés au sort pour se retrouver mis en brochette par une gigantesque loterie apparemment créatrice. Il est aussi facile de comprendre qu’un tel procédé ne pourrait prétendre à produire un récit narratif véhiculant une histoire porteuse d’un sens[14] et ne peut donc à lui seul alimenter un logiciel comme Romanesque.

 

3. Acheter un logiciel pour jouer à l’écrivain

 

Poursuivons notre exploration des possibles en nous demandant ce qui existe d’autre qui pourrait ressembler à Romanesque. De fait, il existe d’ores et déjà aujourd’hui dans le commerce plusieurs outils informatiques qui se présentent comme des moyens de faire de vous un romancier sans trop d’effort[15].

On peut les regrouper en trois catégories selon les rôles qu’ils remplissent, sachant qu’aucun de ces outils ne peut vraiment être qualifié de “générateur” de roman car ils n’utilisent en rien une capacité proprement inventive de l’ordinateur. En fait, il s’agit d’abord de logiciels de bureautiques plus ou moins sophistiqués incluant éventuellement des aides mémoires, des fiches sur les personnages, des accessoires “cosmétiques” (pour mieux mettre en page les dialogues par exemple), ensuite d’outils pédagogiques qui vous proposent un didacticiel pour mieux écrire votre roman et enfin de « romans personnalisables ».

* Les outils bureautiques

Les outils bureautiques sont les plus connus. Bien sûr, un traitement de texte comme Word ou Open Office ne peut pas vraiment prétendre faire de vous un romancier (pas plus que la possession d’un stylo et un cahier), mais il vous facilite déjà la vie. De fait, il existe des outils plus spécialisés, comme “Phraseo“[16], qui  prétend regrouper tous les outils permettant d’organiser et de développer un projet d’écriture : « Notez des idées, écrivez la biographie de vos personnages, la bible d’une série, un synopsis ou une phrase clef » . Il est distribué par Movie Soft, spécialiste des outils bureautiques ou cosmétiques pour écrire des scénarios ou des pièces de théâtre. De fait, un tel logiciel aide à s’organiser, mais ne franchit jamais la frontière « sacrée » entre assistance technique et réel travail d’auteur. Il ne touche au texte que pour en proposer des corrections orthographiques ou de maladroites améliorations de la syntaxe, mais n’a en rien les moyens de s’essayer à écrire par lui-même.

* Les outils pédagogiques

Un pas plus loin dans l’aide au romancier, mais toujours sans aucune capacité d’invention, se trouvent les logiciels qui se disent « pédagogiques » : un premier exemple francophone est le logiciel ”j’écris un roman“[17]. A en croire sa présentation publicitaire  bien alléchante, aucun doute, tout le monde peut se lancer. “Avec J’écris un roman®, vous disposez de tous les outils pour vous guider dans l’écriture de votre livre depuis la première idée jusqu’à la mise en forme de la version finale. Si vous avez toujours rêvé d’écrire un livre mais repoussé le moment de vous lancer alors “j’écris un roman”® est conçu pour vous. Véritable partenaire artistique, il vous guidera dans toutes les étapes de l’écriture de la première à la dernière page. Roman policier ou d’aventure, comédie sentimentale ou autobiographie ! N’ayez plus peur de la page blanche !” Concrètement ce logiciel propose un traitement de texte auquel s’ajoutent des outils d’apprentissage : une méthode, des exercices, des aides contextuelles, des fiches pour mieux définir ses personnages et ses décors.

 

Encadré 2 : une pédagogie particulière, celle du logiciel hypnotiseur

On trouve de tout sur le web et même un outil destiné à faciliter l’écriture grâce à l’hypnose. En résumé, l’écran est coupé en deux zones verticales. Dans la partie droite une roue hypnotique qui tourne soit disant pour faciliter votre créativité et dans la partie gauche, la zone où votre talent devrait s’exprimer sans retenue… Quelques extraits de l’argumentaire proposé par le Dr Joe Vitale, son créateur : “Quelle est aujourd’hui la plus simple façon d’écrire ? .Qui est le  magicien de l’écriture sous hypnose ? Vous, quand vous utilisez ce nouveau logiciel incroyable !”.

En fait il s’agit tout simplement d’un traitement de texte classique, couplé à la roue hypnotique qui réussit peut être, dans le meilleur des cas, à vous déstresser en prétendant faire disparaitre l’angoisse de la page blanche. Le tout pour un prix de 99 $ en promotion. La publicité de cet étonnant produit est à découvrir par curiosité à http://www.hypnoticwritingwizard.com/

* Les romans personnalisables

Un peu plus sophistiqués, ces outils s’appuient sur une histoire déjà pré-écrite dont ils adaptent quelques paramètres selon les souhaits ou les caractéristiques de la personne qui va les utiliser et à qui l’on va faire croire qu’elle devient “co-auteur”. Dans cette catégorie, on trouve en France, une série de romans à personnaliser, comme la série “monroman”, à découvrir à http://www.monroman.com dont la formule d’accroche est : “Vous avez toujours eu envie d’écrire, mais vous ne trouvez ni le temps, ni le courage ? Devenez co-auteur du roman dont vous êtes le héros”. Un roman écrit selon vos instructions pour vous ou la personne de votre choix. Pour écrire vos aventures, rien de plus simple : choisissez votre intrigue, vos personnages, leurs traits de caractères, le lieu, le style et de nombreux détails qui feront de ce livre le vôtre… et nous nous chargeons de la narration selon vos instructions (jusqu’à 1000 zones de personnalisation pour un roman de 180 pages)…”

 

Encadré 3 : Chimère, l’un des sept romans personnalisables des éditions Comédia

 Voilà comment fonctionne sur un exemple, un des sept romans personnalisables de la série « monroman »[18]: « Chimère » qui sera écrit finalement par Pascal Leby et vous-même propose une intrigue à suspense : “L’amitié c’est sacré ! Alors, quand une de vos amies disparaît et se retrouve en danger de mort, vous êtes prêt(e) à remuer ciel et terre pour voler à son secours. Une course contre la montre commence, qui vous mènera de Paris aux routes escarpées du Morvan. De votre intuition et de votre rapidité d’action dépendra… son salut. Une mécanique implacable est en route : à vous de la stopper !  Attention, ça va être à vous”.  

Sont personnalisables : le personnage principal (qui se trouve plongé dans une aventure trépidante), le tueur à gage (qui n’aura de cesse de remplir sa mission), le gentil moine et la concierge.” 

Avec un tel outil, on pourrait imaginer que le logiciel nous fait passer de l’autre côté de la frontière de la création. En fait, avec un système uniquement informatique[19], le prétendu « co-auteur » n’a d’autre possibilité que de s’approprier par des minuscules ajustements un récit entièrement préexistant. Il n’y a d’ailleurs pas là de bien grandes prouesses informatiques. En effet, il est facile de définir quelques paramètres interchangeables comme les noms de personnages, des détails vestimentaires (couleurs, tissu, style), de physionomie (silhouette, visage, maquillage…) ou encore des éléments du décor (meubles, monuments, paysage ou météorologie). Le choix en est laissé au soi disant “écrivain”. Pour cela pas besoin d’intelligence artificielle : il suffit de se prémunir contre trois niveaux de difficultés. D’une part il faut prendre garde aux pièges syntaxiques ou grammaticaux, comme par exemple des problèmes d’accord ou de liaisons, ensuite aux problèmes de cohérence sémantique (éviter les assemblages improbables qui ont fait les beaux jours des cadavres exquis parce qu’absurdes comme … “cadavres exquis” ou a contrario redondant comme “un chat félin”) et enfin éviter des incohérences de sens qui résulteraient de contradictions, par exemple entre une météo détestable et une description inappropriée d’un « maquillage impeccable » et « une pluie battante sous laquelle courrait la jeune femme ». Il se peut aussi que surviennent quelques problèmes phonétiques ou de répétition, mais rien d’insurmontable, si l’on s’autorise une relecture attentive.

Dans cette gamme des outils de personnalisation, peuvent aussi s’imaginer des fonctions plus évoluées. Ainsi, une option pourrait amplifier à volonté la dimension descriptive du texte, en ajoutant des adjectifs, des adverbes et des compléments de circonstance. Bien sûr, il faudrait choisir des registres homogènes ou au moins compatibles[20]. Là encore, ce genre d’outil est loin d’être vraiment créatif  et, de fait, on en trouve d’ailleurs un embryon dans les fonctions de synonymie que proposent maintenant certains traitements de texte.

Dans tous ces outils, « l’intelligence » de l’ordinateur n’est jamais mobilisée au service de la création, mais seulement de la gestion des mots en réalisant des substitutions ou de fiches pédagogiques,

4. Manipuler des émotions pour inventer une intrigue

Quelques chercheurs travaillent sur la « générativit頻, c’est à dire la capacité à générer de nouveaux récits. Par « nouveaux », ils entendent des récits ni directement puisés dans un texte préexistant, ni rédigés par un humain. La plupart de ces travaux sont liés à des recherches conduites par des universitaires intéressés par la théorie de la création littéraire et par les mystérieux mécanismes qui pourraient définir le genre romanesque »[21].

Malheureusement, même s’ils s’aventurent de l’autre côté de la frontière sacrée de la création, ces logiciels n’écrivent pas des romans de plusieurs centaines de pages, mais travaillent soit sur des textes courts (quelques pages maximum) ou sur des synopsis (enchainement des scènes dans un récit). Les premiers cherchent à générer du « langage naturel »[22], proche de ce qui est utile à la traduction automatique, aux créateurs de dialogues pour jeux interactifs ou aux logiciels d’écriture automatisée de petites notices techniques. Les seconds s’intéressent à la théorie de la narration, surtout dans le but de mieux comprendre les ressorts de la dramatisation.

Mexica, un logiciel pour dramatiser des récits en gérant les rythmes émotionnels.

“Utiliser les émotions pour piloter la génération de l’intrigue dans un logiciel de création d’histoire“, le dernier article[23] de Rafael Perez y Perez[24] paru dans “Cognitive systems research 8 (2007)″ s’inscrit dans cette seconde famille. L’auteur y expose que : “les émotions sont partie intégrante du processus créatif ; cependant, il n’est pas courant de trouver des modèles informatiques de création où les émotions jouent un rôle fondamental.” A contrario, dans ses travaux[25], Perez y Perez a justement créé un modèle de génération informatique qui s’appuie sur les émotions et les tensions entre les personnages. Son logiciel intitulé « Mexica » produit des synopsis de courtes nouvelles reliées à la mythologie que les occidentaux qualifient d’”Aztèque”. L’idée principale est qu’une histoire peut être représentée par un groupe de liens émotionnels et de tensions qui évoluent entre les personnages ; les actions qui se déroulent modifient ces liens, créant des sentiments de trahison, ou au contraire d’amour, de désir ou de confiance, voire des situations paradoxales, capables de pousser au crime (c’est la cas lorsque l’on découvre que l’on a été trahi par celui dont on était fou amoureux).

Les histoires proposées par Mexica sont des intrigues simples : une princesse est sauvée par un chevalier dont elle tombe amoureuse, mais elle devra le tuer et se suicider après avoir découvert qu’il faisait partie de la bande qui a assassiné son père. Le logiciel cherche dans un premier temps à maximaliser les chocs émotionnels en créant de telles tensions (à partir d’une base de données de situations très fortes) puis dans une seconde phase à raconter les faits dans l’ordre qui met le mieux en valeurs ces paradoxes affectifs.

Mexica peut se comparer à d’autres logiciels explor    atoires qui visent à étudier la question de la générativité[26]. Les applications Gester et Minstrel, tout deux orientés sur le création de chanson de gestes et de récits de ménestrels s’inscrivent dans cette famille. Brutus est quant à lui spécialisé dans les histoires de trahisons. Tous ces logiciels ont un ancêtre commun, intitulé Tale-Spin qui a marqué une des étapes clefs des travaux universitaires sur la génération d’intrigue. L’idée principale est de considérer que les personnages d’un roman peuvent utiliser des algorithmes identiques à ceux développé par les chercheurs en intelligence artificielle pour la résolution de problèmes.

5. Passer du squelette aux paragraphes.

Mettons nous maintenant à la place d’Abdel et essayons d’imaginer comment pourrait fonctionner le logiciel Romanesque 2.0. Créer un roman, c’est enchainer trois étapes : déterminer l’intrigue que l’on veut raconter, décider du scénario et enfin écrire le texte. Dans le cas de Romanesque 2.0, on part du principe qu’il s’agit d’une histoire policière, avec des meurtres, plus ou moins liés à des gares et imaginer que le logiciel fonctionne en partant d’un premier squelette standard : “un mobile pousse un coupable à commettre un crime dans une gare et on va chercher des indices qui permettront de le découvrir”.

A partir d’un fil conducteur de ce type, comment peut procéder un logiciel pour effectuer les trois étapes citées plus haut ? La première consiste à transformer ce squelette caricatural en une intrigue spécifique. Pour cela, l’humain qui utilise le logiciel entre des paramètres (c’est ce qui se passe avec Pierre dans la première scène du roman Romanesque 2.0). Il choisit ainsi le mobile, le coupable, les indices et leur mode de révélation. Il précise aussi le nombre de meurtres et les caractéristiques des personnages principaux. Le logiciel adapte le squelette pour qu’il tienne compte de ces spécificités. A la fin de cette première étape, l’ordinateur a produit une chronologie des faits et a en mémoire un agenda des événements qui servent d’intrigue, sous la forme d’un tableau de données.

La deuxième étape est celle de la production du scénario, c’est-à-dire celle de la  détermination détaillée de la narration et du découpage. Elle est liée au choix d’un narrateur et d’un type de récit. “je” raconte l’histoire ou au contraire, le narrateur est partout et tout le temps là (narrateur omnipotent et omniscient). Le récit est chronologique ou au contraire, il autorise les flash back… Il peut être introspectif ou non, pensé du point de vue de tel ou tel personnage (le meurtrier, l’enquêteur, son comparse, un animal domestique, un perroquet). Une fois ces choix faits, le logiciel propose un synopsis détaillé, c’est-à-dire un découpage en scènes successives, précisant à chaque fois les personnages en jeu.

Enfin, la troisième étape est celle de l’écriture du texte. Le logiciel doit passer de ce découpage des actions et du sens à la production de paragraphes composés de phrases. Il choisit des mots et des formes syntaxiques pour ce faire. Le mécanisme peut être assez simple. Scène par scène, il s’agit de passer d’une description schématique de ce qui doit survenir à un ensemble de propositions textuelles dont la lecture permet de se représenter l’action prévue, tout en suscitant autant que faire se peut curiosité, intérêt et émotions.

Romanesque doit donc travailler à trois échelles complémentaires : générer une intrigue (en définissant des personnages et un problème à résoudre, générer un scénario narratif (en proposant une succession d’événements et d’émotions rythmés dans le temps) et générer phrases et paragraphes (en produisant du sens, de l’action, de l’émotion et de l’effet de réel avec des mots). En ce sens, un générateur de roman ressemblerait aux logiciels représentant des animations de personnages dans des mondes virtuels en 3D. Ceux-ci doivent aussi fonctionner à de multiples niveaux et créer des formes squelettiques à base de vecteurs, les recouvrir de chairs, peaux et de textures sans oublier de les doter d’ombres et surtout les mettre en mouvement pour donner un semblant de vie par des interactions entre eux. 

6. Générer des histoires en chassant les stéréotypes

A priori, aucune de ces trois étapes ne devrait poser de problème de principe. Pour la première et la deuxième étape, il n’y a pas de difficulté insurmontable à imaginer s’appuyer sur un squelette standard pour le modifier en fonction de quelques paramètres donnés par un humain, ni a choisir une narration et à optimiser l’ordre des séquences. En revanche, les intrigues ne seront pas très différentes les unes des autres, ne révélant aucune réelle créativité. De même, la deuxième étape ne soulève pas de problème particulier, c’est l’humain qui fait  l’essentiel du travail en choisissant des lieux, des personnages… Pour la troisième étape, la complexité réside dans la génération d’un texte qui ne soit ni “mécanique” ni “désincarné”. Par exemple, si le scénario prévoit une scène où sera présenté le personnage d’un policier distrait dont on va apprendre qu’il est amoureux d’un perroquet, on attend de l’écriture littéraire d’autre chose que : “cette scène présente Mr X, un flic qui est amoureux  d’un perroquet”. On préférerait quelque chose comme : “Mr X chercha son perroquet toute la nuit. Au petit matin, il le découvrit installé dans le four à micro ondes, heureusement éteint, et fondit en larmes.”

Ainsi, la difficulté des automates littéraires réside dans leur capacité à surprendre le lecteur, voire même l’auteur du logiciel. A contrario des romans à personnaliser, on attend d’eux qu’ils génèrent autre chose que du convenu ou du monotone.

De fait, la même difficulté est déjà présente dans la première étape, celle de la création de l’intrigue. Dans le cas de Romanesque nous acceptons que le point de départ soit toujours un squelette stéréotypé. Mais, si ce logiciel existait vraiment et que nous nous retrouvions fréquemment à lire des productions dues à Romanesque, nous serions vite saturés d’histoire de crime dans des gares… Bien sûr, pour remédier à cela il est possible d’enregistrer plusieurs squelettes initiaux, parmi lesquels on donnera le choix à l’humain. On pourrait pour cela partir d’une arborescence de tous les types d’intrigues possibles, inspirée des travaux de l’OuLiPoPo[27], une branche spécialisée de l’Oulipo qui, sous l’impulsion de François Le Lyonnais s’était fixée la mission « de recenser aussi exhaustivement que possible et de classer rationnellement les situations, les mécanismes et leurs combinaisons exploités par le roman policier d’énigme et plus largement toutes les situations et les mécanismes potentiels inutilisés, voire inutilisables »[28]. De même, il est facile d’imaginer étendre le choix du lieu entre des gares, des aéroports, des basses cours ou des clairières en forêt… Le reste n’est qu’une affaire de combinatoire et de temps pour charger à l’avance dans les tables de l’ordinateur tous les cas possibles[29]. Certes, il n’y aura là qu’une pirouette et aucune imagination, mais les hasards des combinatoires pourront avoir pour résultat que l’humain au clavier choisira de faire créer la toute première histoire de suicide d’une femme policier après le meurtre de son perroquet dans une station service.

En la matière, le logiciel Mexica cité plus haut fonctionne différemment, utilisant pas à pas des méthodes de résolution de problème pour “laisser se développer par elle-même” une histoire, de manière heuristique. Le point de départ n’est donc pas une intrigue pré-écrite, mais quelques données de base sur les personnages principaux, un peu comme c’est le cas dans des séries de récits policiers de Conan Doyle avec Sherlock Holmes ou d’Agatha Christie avec Hercule Poirot. L’auteur va soumettre ces héros récurrents à des circonstances particulières posant problème, puis demander au logiciel d’examiner comment les faire agir au mieux selon des règles de résolution de problème.[30]

Ainsi, une princesse va être mise en danger par la chute d’un pont de liane traversant une rivière. Parmi de multiples possibilités de s’en sortir, elle va obtenir de l’aide du chevalier Jaguar qui se trouve aussi sur le pont. Cet enchaînement aura été choisi par le logiciel Mexica comme le plus efficace pour la sauver (meilleure résolution de problème pour ne pas la voir mourir noyée). Ensuite, l’ordinateur fera le bilan de cette première action et interprètera (d’après une table de situations affectives) que ce genre d’entraide conduit à un sentiment de gratitude, qui peut se transformer en amour.

Après quoi, la suite de l’intrigue se construira pas à pas, par l’enchaînement des processus qui découlent des tensions affectives entre les personnages. Au final, ces tensions se dénoueront en général par un ou plusieurs meurtres ou suicides. En effet, dans Mexica, les personnages récurrents sont d’entrée de jeu en danger, marqués par des conflits familiaux.

Pour incarner[31] ces personnages (la princesse, son père ou le chevalier Jaguar), pour mémoriser leurs comportements selon les différents contextes (que fait d’habitude un chevalier dans une forêt touffue?) et pour enchainer les scènes, Mexica a été alimenté d’abord par une toute première série d’histoires modèles introduites par ses programmeurs. Ensuite, pour diversifier les rebondissements, Mexica peut s’inspirer de ce qu’il a déjà “inventé” pour de précédentes histoires.

Mais ce n’est pas tout ! Une autre spécificité de Mexica est que, une fois l’histoire formalisée, le logiciel va évaluer sa cohérence et son intérêt dramatique pour pouvoir le cas échéant l’améliorer. Concrètement, une note de tension affective est  attribuée à l’histoire en fonction de l’intensité des sentiments évoqués (rencontrer le prince charmant, tuer son amant ou se suicider de désespoir !) et de leurs bouleversements (découvrir tout à coup que le chevalier dont on est amoureux porte à la cuisse le tatouage caractéristique de ceux qui ont tué son père !) Et alors, s’entame une phase de d’optimisation du récit conduite automatiquement par le logiciel, qui consiste à changer l’ordre des scènes, voire à en modifier certaines caractéristiques pour donner au scénario la meilleure note dramatique.

Dans cette mission, la supériorité de l’ordinateur est indiscutable : il peut relire autant de fois que nécessaire les variantes de l’histoire et leur donner des notes sans aucun problème de lassitude, ce qui n’est en rien le cas de l’auteur humain. Tous ceux qui se sont essayé à relire plus de trois ou quatre fois un texte qu’ils viennent d’écrire, ne peuvent que se souvenir à quel point c’est pénible et combien il devient vite impossible de comparer différentes versions tant les effets de la lecture actuelle se mélangent aux souvenirs de la précédente.

Encadré 4 : apprendre à écrire en lisant des romans existants

L’idée d’utiliser la logique des systèmes experts est tentante. Dans un premier temps, on fournit à ce type de logiciel des « règles » pour décortiquer les styles et stratégies d’écriture, puis on leur fournit autant d’exemples que l’on peut trouver pour qu’ils remplissent à partir de là une base de données. Ensuite en bon systèmes apprenants, ils les réutilisent au gré de leurs besoins pour « fabriquer » de l’écriture « bonifiée ». Une forme de travail qu’Abdel l’informaticien de Romanesque appelait « faire du foie gras ».

Hélas, faire « lire un roman » à un ordinateur , c’est-à-dire lui faire décrypter un texte écrit pour en extraire du sens qu’il pourra réutiliser pour écrire un autre morceau de texte est largement plus difficile que de générer des paragraphes de textes à partir de lexiques classiques. Dans le second cas, il suffit de trouver juste une solution pour exprimer ce que l’on veut faire comprendre. Au contraire, dans le premier cas, il faudrait disposer d’une machine qui sache tout lire, c’est-à-dire de s’adapter et de décoder toute forme d’écriture, tout style qu’il soit symbolique, descriptif, suggestif.

En résumé, pour qu’un système expert génère de l’écriture à partir de multiples lectures qu’on lui donnera, il doit d’abord être capable de les digérer toutes.

7. Faire ressentir au lieu de raconter ce que l’on doit ressentir

Une fois le scénario produit, le problème est celui de l’écriture du texte lui-même en langage naturel (c’est-à-dire en « français courant »). La référence francophone en la matière est Jean-Pierre Balpe qui conçut et mit en œuvre dans les années quatre-vingt dix de nombreux générateurs de romans[32]. Il suffit de se référer à l’analyse qui est faite de ses travaux par Phillipe Bootz[33] pour se rendre compte que des automates (comme ceux de Trajectoires ou Romans) ont été jugés, voici plus d’une décennie, capables de produire des textes à la fois signifiants et émouvants.

Bien sûr, ce genre de travail nécessite de disposer d’un générateur sophistiqué de phrases, maîtrisant des règles syntaxiques complexes, mais aussi de dictionnaires sémantiques complets, thématisés pour pouvoir choisir des mots dans des registres compatibles. Au-delà de cela, les deux principales difficultés résident dans la nécessité de faire ressentir et non d’expliquer (comme plus haut notre policier amoureux de son perroquet), de suggérer et non de « tout dire ». Là encore, il s’agit de choisir la manière dont on va suggérer ce qui se passe “entre les lignes” et de choisir ce que ‘l’on va explicitement décrire au lecteur et ce qu’on va lui laisser deviner[34]. De fait, il s’agit de donner au générateur la capacité de maitriser ce que Bertrand Gervais appelle le niveau « endo-narratif »[35] : « Lire un récit est une activité double, elle demande au lecteur, d’une part, d’identifier les actions représentées et, d’autre part, de les intégrer à une narration. Or, l’endo-narratif, […] est cette frange théorique étroite qui permet de rendre compte des processus d’identification des actions représentées, avant leur intégration à une narration ».  

Pour être tout à fait exact, nous n’en sommes pas encore là au niveau de l’écriture des mots des phrases. Nous travaillons au niveau intermédiaire de la structure d’exposition de chaque scène, sur la façon de « planter le décor » et de faire entrer en action les personnages. La solution ne peut venir que par l’utilisation par l’ordinateur de règles que son programmeur lui aura préalablement fournies. On demandera par exemple à l’ordinateur d’utiliser pour chaque début de chapitre un squelette comme « première phrase : précision de décor, – 2eme phrase : position du personnage principal : 3eme phrase : indication révélatrice de son humeur 4eme phrase : début d’une action … ». Ces différents éléments peuvent être mis en place dans un ordre tiré au sort pour éviter la monotonie d’un chapitre à l’autre. On peut aussi chercher à laisser transparaître « un style » commun pour se prémunir d’une désagréable impression de patchwork .

Une clef importante dans l’élaboration du style est celle de l’usage de la fractalité ou de « la mise en abyme » de la narration. La même règle peut être utilisée pour écrire des phrases qui détaillent de plus en plus les précédentes, ce qui permet un luxe de détail avec une économie de programmation informatique : « Face à lui, trônait l’invraisemblable château de Tremblay sur Cure. Au centre de la façade, s’ouvrait une porte au chambranle ouvragé. Dans l’entrebâillement, apparaissait un perroquet majestueux… ». Ici nous répétons le même schéma (où ? – verbe d’action – objet avec adjectif) à trois niveaux enchâssés[36]. Avec de tels outils à sa disposition et quelques principes de “bonne écriture romanesque”, Jean Pierre Balbe et ses disciples ont prouvé qu’il n’était pas impossible de produire automatiquement des paragraphes descriptifs quasiment humains. 

________________________________________

Encadré 5 : prototypes, génération spontanée et langage naturel

Pour illustrer le genre d’outil que peut utiliser un générateur en langage naturel, citons un extrait de “fiction et écriture générative” publié[37] sur le site de transitoire observable en 2005 où J.-P. Balpe décrit un des aspects du fonctionnement de son roman génératif “un roman inachev锔 :  Par exemple, le prototype défini de [salle] comporte ici : un nom ; une vue d’ensemble ; des ouvertures : fenêtres, rideaux, portes… ; des objets d’art : sculptures, meubles précieux, objets… ; des meubles : fauteuils, chaises, tables, etc ; un buffet : plats, nourritures, serveurs… ; des escaliers : rampes, marches… ; des personnes présentes… ; un extérieur avec tout ce que cela implique : ciel, météo, etc ; des murs : murs, tableaux, écrans vidéo… Une description de « salle » peut donc épuiser le prototype en décrivant tour à tour, dans un ordre non prédéfini, l’ensemble des éléments qui la composent ou puiser dans le prototype en n’ayant recours qu’à un nombre limité de composants du prototype.[Et cela]… peut donner naissance au texte suivant : « Les cadres des tableaux rivalisent de richesse dorée ; de lourdes colonnades soulignent la rigueur des murs ; d’épais rideaux de velours rouges, soutenus par de larges embrases, enferment les fenêtres ; de nombreuses portes s’ouvrent dans les murs ; des meubles précieux rythment de loin en loin le salon. » Selon le principe de la mise en abîme, chaque spécification d’un prototype peut, à son tour, constituer un prototype : [Meuble [localisation-meuble] [caractéristique-meuble]], prototype dont la spécification peut générer des phrases telles : « Près d’une des portes d’entrée, un guéridon à mosaïque de marbre… », « Entre deux colonnes de marbre, une armoire de style Louis XVI…”  

La seule limite théorique est celle de n’importe quelle description du réel : jusqu’où aller dans le détail des spécifications ? Pour l’essentiel, les choix de l’auteur du générateur se limitent à cela : définition du monde, des sous-mondes, des prototypes et des spécifications disponibles de prototypes. A partir de là, le générateur possède un grand degré de liberté puisqu’il peut, dans l’espace qui lui a été défini, sélectionner le point d’entrée dans le monde possible et développer ou non ce point d’entrée avec une profondeur plus ou moins grande. ”

Aujourd’hui, les informaticiens qui travaillent sur le langage ne s’intéressent plus vraiment aux générateurs de romans. D’une part les ex-spécialistes (comme Jean-Pierre Balpe lui-même) se préoccupent surtout maintenant d’étranges créations multimédia mélangeant texte, image et installation artistique ; D’autre part, en raison du marché grandissant des systèmes communiquant en langage naturel, les technologies progressent à grande vitesse mais servent à créer des traducteurs automatiques ou des rédacteurs de dialogue pour des jeux vidéos… et nullement des romans !

En termes de langage on sait donc améliorer ce que l’on savait déjà faire voici quinze ans. Des logiciels du type de Romanesque sont sans doute plausibles dès aujourd’hui ou au moins à court terme. Mais dans quel but ? Serait-il rentable de développer un automate littéraire ? Aujourd’hui le problème de la littérature est plutôt la surproduction. Alors que faire d’un automate romancier ? A ce propos, “Exemplaire de démonstration”, un roman de Phillipe Vasset paru chez Pocket, est édifiant[38]. Il met en scène le “ScriptGénérator” qui n’est pas exactement un automate au sens où Romanesque 2.0 l’est, mais un outil qui recycle de la “littérature” comme n’importe quel autre bien industriel à partir de matières premières textuelles (histoires brutes, romans et scénarios achetés au poids). Et d’ailleurs c’est bien la morale de Romanesque : à quoi servirait t-il de disposer d’un automate générateur de roman ? Dans l’écriture, le plus intéressant, c’est l’écriture !

8. Trouver de l’intérêt à la génération spontanée

En fait, ce qui n’est pas réellement précisé dans le roman Romanesque 2.0 c’est le niveau de responsabilité respective du logiciel et de l’auteur. De fait, un projet de roman n’existe pas seulement par la dimension de l’écriture, mais aussi le travail que représente sa conception en termes d’édition. Un roman est un ouvrage qui n’existe que parce que finalement il se matérialise, rencontre des diffuseurs et des “récepteurs”; et cette fonction éditoriale est difficile à imaginer autrement que réalisée par des humains.[39]

En d’autres termes, si l’on peut imaginer un automate « auteur », on ne peut en tout cas pas imaginer un automate « éditeur » capable sans intervention humaine de porter un projet de conception et réalisation de roman. Même si de nouvelles formes de diffusion apparaissent (voir encadré XX), il faudra toujours un commanditaire, « un maître d’ouvrage » pour définir les principes du cahier des charges, évaluer la qualité, faire les choix et décider du projet éditorial.

Dans quelques décennies, un logiciel comme Romanesque permettra peut-être à l’éditeur de se passer d’auteur, mais, si c’est le cas, il l’obligera à assumer simultanément deux responsabilités, en lui transférant celle des choix incombant d’ordinaire à l’auteur. Ainsi, au mieux, un automate générateur de roman supprimera pour cet éditeur/auteur des tâches fastidieuses comme celle de construire « machinalement » les détails des personnages ou des mises en abyme descriptives ; il le guidera dans sa narration en lui proposant des rebondissements adaptés ou des résolutions de problèmes audacieuses, en lui rappelant de ne pas oublier en route des personnages secondaires. Il pourra même comme Mexica lui  permettre d’évaluer la solution narrative créant la meilleure intensité dramatique, les rythmes les plus accrocheurs…

C’est bien d’ailleurs pour ce rôle qu’Abdel avait créé son logiciel Romanesque, comme un « nègre » pour que Naïma n’ait plus à gérer la part fastidieuse de l’écriture littéraire. Son projet revenait ainsi à faire de Naïma non plus l’auteur de chaque roman, mais une éditrice – directrice de collection ayant à sa disposition un atelier d’écriture capable de lui fournir des morceaux de textes sur mesure et finalement jamais l’œuvre complète, clef en main. Ainsi Romanesque, s’il existait, ne serait bien qu’un nègre, un « ghostwriter », un écrivain fantôme, comme l’appellent les éditeurs anglo-saxons. Mais, l’acte créatif qui met en forme l’œuvre elle-même résidera toujours dans la définition initiale du projet et plus encore dans le « final cut » celui qui revient toujours à l’éditeur.

Encadré 6 : d’autres formes de distribution pour « automatiser » l’éditeur

De nouvelles formes de créations apparaissent, qu’il s’agisse de fiction sous forme de séries de courriels ou de feuilletons blogues mélangeant auteurs réels et textes multimédia aléatoires à la parution plus ou moins irrégulière. Citons par exemple « Den » qui  est un récit de fiction[40] sous la forme d’une correspondance amoureuse entre deux personnes par messagerie informatique. Pour en profiter il vous suffit de télécharger gratuitement un logiciel qui vous permet de lire cette correspondance, comme si vous receviez les courriels (à lire à votre rythme).Un autre exemple de ce nouveau genre de distribution est « La disparition du général Proust », œuvre, titanesque et polymorphe, animée par Jean Pierre Balpe : «  Conçu comme dynamique, il est soumis à des changements constants qui font qu’aucun lecteur ne peut être assuré d’avoir lu une quelconque version définitive qui, par nature, n’existe pas. Enfin l’hyperfiction est aussi une autofiction, autrement dit une autobiographie fictionnelle où la réalité se mélange et se confond parfois avec la fiction. Cet ensemble constitue un jeu de renvois, de reprises en miroir, de variations définissant une approche inédite de l’écrit littéraire. ».

Concrètement, il s’agit d’une Hyperfiction distribuée par le biais de plus de 17 blogues en parallèle, développant chacun des facettes de cette histoire tentaculaire, en expansion perpétuelle et proposant chacun des documents de diverses natures, notamment des photographies et des extraits musicaux.

Plus globalement, l’informatique permet d’expérimenter de nouvelles relations auteur – lecteur en modifiant la répartition des rôles entre éditeurs, diffuseurs et imprimeurs. En se situant sur ce registre « collatéral » à l’acte créatif de l’écriture ; on peut reformuler deux autres intérêts des machines et réseaux informatiques, déjà evoqués plus haut,

 

– s’amuser avec des pseudos-langages en lisant des pseudos histoires

Il est en effet surprenant de se rendre compte qu’un automate peut singer un homme et qu’il n’y a pas une si grande distance entre des “langues de bois” humaines et ce que peut produire un ordinateur, un cadavre exquis ou une armée de singes tapant aléatoirement des mots. C’est le fondement du plaisir que l’on ressent avec des sites comme charabia.net ou karabine.fr.

 

  progresser dans la théorie littéraire et dans la rhétorique

Avec un ordinateur, on peut modéliser comment écrit tel auteur, voire même tenter de singer une de ses œuvres. Derrière ces possibilités, s’ouvrent des opportunités de mieux regarder dans le concret de l’écriture à quoi tient l’endo narratif, l’effet de réel, bref tout ce qui fait l’efficacité d’un romancier[41]. Les travaux utilisant des statistiques textuelles pour réaliser des “analyse stylistique automatique” commencent à se multiplier, permettant de consolider le pont entre les champs universitaires de la linguistique et de la littérature.

9. Identifier le gène de la créativité

Au-delà des trois bénéfices « collatéraux » que nous venons de rappeler, reste toujours à savoir où l’ordinateur pourrait puiser une quelconque capacité de création originale. La chercher, c’est chercher comment rendre une telle machine électronique apte  à sortir des sentiers battus tout en restant porteuse de sens. La clef pourrait venir de l’usage simultané de trois capacités complémentaires des ordinateurs : celle de multiplier l’univers des possibles à l’infini, celle de d’objectiver des indicateurs d’amélioration de tel ou tel critère et celle de réaliser de multiples itérations sans fatigue ou lassitude.

Les ordinateurs peuvent en effet à la fois :

  Multiplier les essais pour maximaliser les choix possibles.  On le comprend bien quand on considère les cadavres exquis ou la métaphore des singes : plus une machine essaye de variantes différentes, plus on augmenta la possibilité de trouver une forme optimum.

Fournir des indicateurs qui permettent de formaliser des qualités d’habitude implicites d’un texte. Parmi une série de brouillons créés au hasard par l’ordinateur, ils lui permettent alors de déterminer la « meilleure » variante au regard de ces critères .

Procéder sans se lasser à une quasi-infinité de relectures, sans être perturbé par des impressions humaines de déjà lu, en restant insensible à la lassitude du romancier qui finit par renoncer à tester d’autres possibles, bien avant d’avant d’avoir tout essayé, tous évalué et tout optimisé.

Reste au programmateur (humain, lui) à ajouter à la cœxistence de ces trois capacités une grande vigilance. Il doit éviter de contaminer l’ordinateur avec toutes les inhibitions ou stéréotypes implicites à notre façon habituelle d’écrire. Bien sûr, il faut lui imposer suffisamment de règles d’assemblage des mots pour qu’il génère du sens. Mais, paradoxalement, en parallèle, il faut le protéger de toutes les habitudes inconscientes qui d’ordinaire interdisent à un auteur humain d’accoler un adjectif sacrilège comme « exquis »au substantif « cadavre ». Une machine ainsi programmée livrera parmi ses multiples combinatoires, certaines variantes qui transcenderont nos limites et nous paraîtront  d’audacieuses créations.

Ce serait donc dans cette capacité d’amélioration par itération que se situerait le germe de la créativité. Si l’on suit cette idée, l’ordinateur pourrait oser des formes créatives parce qu’il bouleverse doublement le rapport de l’auteur à la mémoire. D’une part, il possède toutes les mémoires du monde et peut y stocker toutes les grammaires, tous les lexiques, peut les mélanger dans de multiples combinatoires explorant ainsi des univers des possibles quasi infinis. D’autre part, il peut tout oublier, être libéré des implicites et exonéré de toute lassitude, libéré de la mémoire instantané des lectures précédentes, et, cent fois sur le métier, remettre son ouvrage.

Ce n’est d’ailleurs peut-être pas si nouveau : communiquer avec autrui impose l’usage de codes et lexiques semblables pour tous servant de porteuse à de subtiles variations superficielles que l’on appelle le message. Ecrire consiste donc à doser réminiscence et émancipation, c’est-à-dire encodage et transgression. Si nous arrivons à programmer nos ordinateurs à tout retenir des codes et lexiques et à tout oublier des stéréotypes et du déjà-vu, ils devraient pouvoir en retour nous proposer une écriture créative.

Alors, un ordinateur pourrait-il un jour gagner le prix Goncourt ? Plutôt que de prendre le risque de répondre définitivement à cette question surtout symbolique, il vaut mieux conclure par une autre, davantage dans l’esprit[42] de l’Oulipo et mettant en scène notre million de singes dactylographes : Combien d’années leur faudra-t-il pour taper au moins un roman où le Goncourt serait attribué à un ordinateur ? Et combien de fois plus pour que ce prix soit attribué par un jury composé lui-même de machines équipées de programmes d’évaluation littéraire ?



[1] Raymond Queneau, “Exercices de style”, Paris, Gallimard Folio, 1982 [ed. originale 1947, Gallimard

[2] Raymond Queneau, “Cent milliards de poèmes”, Paris, Galimard, 1961

[3] Borges, « La bibliothèque de Babel », publiée dans Fictions un recueil de nouvelles de Jorge Luis Borges, 1944. Le texte intégral de cette nouvelle écrite en 1941 à Mar del Plata (traduite en français dans la version de Ibarra) est disponible à http://zombre.free.fr/pages_indispensables/bibliotheque_babel.htm (tous les liens cités dans ce texte ou ces notes ont été consultés en ligne le 12 septembre 2007).

[4] Voir par exemple le site de la revue « Formules » consacrée à ce type de littérature http://formules.net

[5] Voir en particulier http://oulipo.net , le site actuel de l’OuLiPo

[6] Emile Borel, « Le hasard », Paris, Alcan, 1913

[7] Arthur C. Clarke, « The nine billions names of Gog”, XXX, 1953, republié en traduction française par Librio n°145 en 1998

[8] Ce néologisme a été inventé par Ted Nelson en 1965 dans son ouvrage « Dream Machines » pour désigner un réseau de documents informatisés liés entre eux. Ils ne sont pas conçus pour une lecture linéaire.

[9] Comme les “livres dont vous êtes le héros” dont l’ordre de narration, voire l’issue, est déterminé par les choix du lecteur à la fin de chaque bloc de texte (Gallimard Jeunesse a ainsi publié une collection de  près de 200 hyper-romans qui se joue avec des dés et qui porte ce titre générique).

[10] Voir en particulier sur internet le portail http://ifiction.free.fr , le « carrefour français de la fiction interactive », entièrement consacré à ce genre.

[11] Il s’agit de http://www.transitoireobs.free.fr créé par Philippe Bootz, Alexandre Gherban et Tibor Papp en 2003. Voir ainsi son manifeste éditorial à http://transitoireobs.free.fr/to/article.php3?id_article=1

[12] [8] Jean-Pierre Balpe, in « Ecriture sans manuscrit, brouillon absent », avril 2002, disponible à http://hypermedia.univ-paris8.fr/Jean-Pierre/articles/manuscrit.pdf (p 7) ou à http://transitoireobs.free.fr/to/article.php3?id_article=40

[13] Pour reprendre l’expression d’Alexendra Saemmer, auteure de l’ouvrage de synthèse « matières textuelles sur support numérique »], Presses universitaires de Saint-Etienne, 2007, qui propose un très intéressant tour d’horizon des hypertextes et hypermédias existants et de leurs caractéristiques.

[14] De fait on trouve sur l’Internet de séduisants outils qui s’inspire de près ou de loin d’une telle méthode pour caricaturer l’actualité en fabriquant de fausses dépêches (http://www.karabine.fr ).

[15] Nous ne parlons plus ici des « simples » générateurs de phrases qui proposent du « cadavre exquis » automatiques, qui sont des gadgets amusants, comme ceux que l’on trouve sur http://ww.charabia.net ou de petits générateurs de haïkus composés de quelques mots, mais bien de logiciels destinés à produire des romans.

[16] Disponible à http://www.phraseo.com/fr/

[17] Diffusé par http://www.vidatech.fr . Voir en particulier http://www.vidatech.fr/fr/

[18] « Mon roman » est diffusé par les éditions Comédia à http://www.ed-comedia.com

[19] Le site de monroman.com précise que « votre roman est traité par notre logiciel qui permet d’automatiser une grande partie du travail. Aussi performant soit-il, il n’est toutefois pas en mesure de traiter l’intégralité des tâches nécessaires à l’écriture de votre roman. S’il est rapide et fiable, il manque cependant de “sensibilité”, de chaleur humaine ! C’est alors qu’interviennent nos rédacteurs et rédactrices, qui sont spécialement formés pour faire passer dans le texte de votre roman la couleur spécifique, l’ambiance qui ressort de votre apport, et donner la teinte unique que vous avez choisi pour votre livre. ».

[20] On pourrait aller les puiser au sein d’univers sémantiques prédéfinis, s’appuyant sur des sélections de mots ou d’expressions que l’on trouve très fréquemment associés afin de minimiser les risques d’incohérence. Aujourd’hui de multiples analyses de données textuelles existent qui fournissent de tels index ou lexiques de ce type. (voir par exemple les travaux publiés par la revue Corpus http://corpus.revues.org/index.html ).

[21] Voir par exemple les travaux de Thomas Beauvisage sur les analyses du roman policier à http://www.revue-texto.net/Inedits/Beauvisage/index.html (publié dans la revue T.A.L. n°43, 2001).

[22] C’est-à-dire faire dialoguer les ordinateurs en français dans le texte.

[23] Voir Rafael Perez y Perez, Employing emotions to drive plot generation in a computer-based storyteller paru dans Cognitive systems research (2007).

[24] Chercheur à l’université de Mexico

[25] Voir un autre article de R. Perez y Perez avec M. Sharples de l’Univ. de Birmingham : MEXICA: a computer model of a cognitive account of creative writing. publié par Journal of Experimental and Theoretical Artificial Intelligence (2001) et disponible en ligne à : http://www.eee.bham.ac.uk/sharplem/Papers/mexica_jetai.pdf

[26] Voir sur ce sujet, des mêmes auteurs: « Three Computer-Based Models of Storytelling : BRUTUS, MINSTREL and MEXICA » disponible à : http://www.nottingham.ac.uk/lsri/msh/Papers/MEXICA%20KBS.pdf A signaler aussi la page http://liquidnarrative.csc.ncsu.edu/developers/bibliography/narrative-generation.html consacrée aux générateurs par le Liquid Narrative Group : http://liquidnarrative.csc.ncsu.edu/ . Sur tous ces sujets, voir aussi http://www.dm.ucf.edu/~rmcdaniel/files/dissertation.pdf.

[27] Ouvroir de Littérature Policière Potentielle.

[28] Subsidia Pataphysica n° 24-25 (1974)

[29] Ce qui ira d’autant plus vite que l’on autorisera le logiciel a aller chercher ses propres informations en ligne sur Internet, comme peut le faire Romanesque 2.0

[30] Voir le n° 8 paru en 1966 de la revue « Communications » sur la combinatoire des intrigues, avec notamment un texte de Barthes sur « l’analyse structurale des récits et un article d’Umberto Eco sur la combinatoire narrative dans les aventures de James Bond  [rééditée au Points Seuil en 1981]; Voir aussi le n°17 de la revue Loxias « littérature à stéréotypes », Odile Gannier [dir.] texte intégral en ligne à http://revel.unice.fr/loxias/sommaire.html?id=1357

[31] Au sens de mettre en chair et donner une personnalité spécifique.

[32] (ou de nombreux romans générés, selon la façon dont on considère la question) comme “Le masque“, “Paysage sans ombre” et surtout “Trajectoires“, “Romans” ou plus récemment « Fictions ».

[33] Sur http://www.olats.org/livresetudes/basiques/litteraturenumerique/11_basiquesLN.php.

[34] Voir Hans-Georg Gadamer et ses écrits sur l’herméneutique : le lecteur lance des projets d’établissement du sens au fur et à mesure de sa lecture . Voir particulièrement “Vérité et Méthode” Paris, Le Seuil, 1996.

[35] Bertrand Gervais in « Lecture de récits et compréhension de l’action », Montréal, revue Vox poetica, 2005.; A lire en ligne à http://www.vox-poetica.org/t/pas/bgervais.html.

[36] On peut même faire varier aléatoirement la profondeur de ces enchâssements de niveaux, par exemple entre 1 et 4 selon les passages du récit. Bien évidement, pour limiter la sensation de stéréotype, on peut alterner une mise en abime d’une description avec une action en cours.

[37] http://transitoireobs.free.fr/to/article.php3?id_article=48 

[38] Il s’agit à notre connaissance du seul roman contemporain autre que Romanesque 2.0 à mettre en scène un logiciel de génération de romans.

[39] Bien évidement on peut imaginer des distributions virales de textes auto générés (comme il est évoqué pour l’envoi de la fatwa virtuelle qui tuera P.A.Q. dans le roman Romanesque 2.0.), mais de tels projets s’apparentent plus au genre éditorial “roman”.

[40] A découvrir à http://www.greatamericannovel.com/ créé en 2004 par http://www.corporate-ave.com/

[41] Voir le logiciel TextArc à http://www.textarc.org/ avec en particulier les travaux sur le texte d’Alice in Wonderland de Lewis Caroll ; voir aussi le logiciel « semato de l’UQUAM à http://fable.ato.uqam.ca/guidexpert-ato/gea.asp ) et enfin la définition des genres policiers par Thomas Beauvisage, (op. cit. en note 21)

[42] Cette conjecture m’a été suggérée par mon ami anthropologue Gérard Gautier.