Histoire de lancer ce carnet et de manière, voici une première analyse – ou tentative d’analyse – d’une oeuvre générée par intelligence artificielle. Vous verrez ici beaucoup d' »oeuvres » (mais est-ce qu’on doit parler d' »oeuvres » ? Est-ce que ça ne suppose pas nécessairement une intention ?) issues du NaNoGenMo, un concours lancé par Darius Kazemi en parallèle du NaNoWriMo. La plupart des oeuvres produites sont sur GitHub, ce qui permet (souvent) d’avoir une explication quant aux techniques de génération textuelles utilisées, mais aussi d’être entraidé par ses pairs et de créer une communauté. Un avantage certain, quand on comprend que la technique influe directement la production…

L’idée du NaNoGenMo est la suivante :

"Spend the month of November writing code that generates a novel 
of 50k+ words. This is in the spirit of National Novel Writing Month's 
interesting definition of a novel as 50,000 words of fiction."

Autrement dit, passer le mois de novembre à écrire un code qui écrira lui-même une oeuvre de fiction. On se rapproche sensiblement de l’idée selon laquelle c’est le code et non l’oeuvre issue du code qui se distingue comme forme d’art. Mais mettons fin ici à notre (trop brève) tentative d’introduction : passons au corps brut de notre étude, celle de Generated Detective. L’analyse sera fourre-tout : génétique, sémiotique, formaliste, structuraliste, mettez-y ce que vous souhaitez. C’est un carnet de recherche, l’idée est de parvenir à construire des pistes possibles pour l’analyses de ces bêbêtes étranges qui commencent à fleurir sur la Toile… Un work-in-progress (écrit tard le soir), pas un article publié et revu.

Lançons-nous donc : Generated Detective est le résultat du code écrit par un certain Greg Borenstein. Il se présente sous la forme d’un comics ; d’après un article d’Anne Magnussen, un comics est « a sequence of images between which some kind of unity of meaning is created », soit « une séquence d’images entre lesquelles est crée une unité de sens ».

http://gregborenstein.com/comics/generated_detective/1/images/08murder_weapon.jpg

Une case issue de Generated Comics. C’était une photo au départ. Quelqu’un a pris ça en photo et l’a posté sur Flickr (débrouillez vous avec ça)

Sur la question de sa génétique, tout d’abord : Berenstein a agi en deux étapes. Il a d’abord constitué une bibliographie issue du projet Gutenberg (sur lequel tout est libre de droit), bibliographie constituée de vieux romans policiers (detective novels) que vous pouvez trouver ici. Les sources sont assez classiques, de Poe à Chesterton, avec des incursions moins qualitatives bien entendu. Berenstein a ensuite rédigé un programme cherchant dans cette base de données des phrases courtes qui utiliseraient les mots suivants :

[:question, :murderer, :witness, :saw, :scene, :killer, :weapon, :clue, :accuse, :reveal]

Les mots qu’il a choisi appartiennent bien sûr au champ lexical classique de ce type de récits. Gardons en tête que ce choix implique déjà un biais… C’est important pour la suite. Berenstein a ensuite travaillé à la main (tout n’est pas encore complètement automatique ici, mais ça s’en vient) pour sélectionner les phrases qui avaient le plus de sens et évacuer le reste. L’étape suivante étant la sélection d’images, il a passé chacune de ses phrases dans la base Flickr et en a extrait les photographies (libres, encore une fois) correspondantes… Photographies ensuite à leur tour passées au filtre, pour leur donner un « style manga » (manga style) selon ses termes.

Voilà pour la génération. La partie automatisée, autonome, est donc assez légère… Mais la lecture devient au bout d’un moment suffisamment fascinante pour interroger le sens de la lecture effectuée. La sensation la plus étrange ressentie est sans doute l’impression d’un rapport direct avec les lectures de romans de détectives classiques. Nous ne sommes pas en présence d’un comics issu de l’imaginaire du hard boiled dick – pas de Philippe Marlowe dans le coin – mais plutôt dans ce que les récits les plus sombres d’Agatha Christie pourraient évoquer.

Il ne manque que la perruque, et on se réfère directement à Psychose.

Certaines cases reflètent donc des choix esthétiques explicables par la génétique du texte, comme celle d’une pleine lune dont le texte mentionne la lune-de-miel (ci-dessous).

Honeymoon = moon, en tout cas pour le programme.

Le choix de l’algorithme Flickr transparait alors derrière mais n’enlève rien de l’intérêt d’une telle image pour l’analyse de Generated Detective. Sans postuler de l’intention d’un quelconque algorithme (et il y a en a ici plusieurs en jeu, celui de Berenstein, celui de Flickr, voire l’algorithme du choix de Berenstein lui-même si on veut en arriver là), une atmosphère clairement surréaliste se dégage. Le programme n’a évidemment pas de surmoi : pas de présence d’une quelconque régulation sociale, d’une norme venue imposer ses contraintes à la façon de penser n’existe ici… Tout du moins, à première vue. Ce serait malheureusement croire au mythe de la neutralité algorithmique, dénoncée à hauts cris par beaucoup de chercheurs (ici Olivier Ertzscheid) et cause de nombreux maux (notamment le maintien des inégalités sociales, voir le livre de Cathy O’Neil) ; le surmoi n’existerait-il d’ailleurs pas déjà dans la base de données, dilué parmi les dizaines d’auteurs utilisés ? Ah. La question ne mérite-t-elle pas d’être posée, alors que l’examen de cette base illustre une représentativité féminine réduite et des auteurs très majoritairement anglo-saxons (l’un n’étant, pour des oeuvres du XIXème et du XXème siècle, pas sans rapport avec l’autre) ?

On sent pointer une question, qui est celle de l’identité véritable du texte généré. Est-ce Berenstein, son algorithme ou bien la totalité des auteurs qui servent de source première au texte ? C’est un cas à part bien entendu, puisque le texte est également servi par des images – il faudrait donc, pour être honnête, ajouter à la liste des auteurs potentiels les photographes Flickr dont les images ont été sélectionnées, mais également les auteurs des algorithmes utilisés pour la modification des photographies… La liste n’en finit plus. Qui est vraiment l’auteur ? Doit-on parler d’oeuvre collaborative ? Et surtout, est-ce qu’il s’agit bien d’un comics ?

Autant de questions qui ne trouveront pas leur réponse tout de suite ici. Des examens plus approfondis de la question auront lieu plus tard… Et dans d’autres objets d’études. Histoire de stimuler la réflexion, une piste peut cependant être apportée : la définition de Magnussen ne pointe pas la question de l’autorité. Si le lecteur peut à lui seul créer le sens, pourquoi le travail issu du code de Berenstein ne serait pas un comics, et donc une oeuvre ? À bon entendeur…


MAGNUSSEN, Anne, « The semiotics of CS Peirce as a theoretical framework for the understanding of comics », dans Comics and culture: Analytical and theoretical approaches to comics, Copenhague, Museum Tusculanum Press, 2000, p. 196.