texte

Ceci est une tentative de créer un logiciel d'assistance à la production d'un roman. Il s'agit donc d'utiliser ici le code comme ouvroir de littérature potentiel, de créer une littérature qui en produit d'autres, aléatoirement ou selon des contraintes fixées dans des algorithmes. Ceci est aussi l'occasion d'apprendre la programmation, en Python dans un premier temps.

Précédents

Infinite Monkey Theorem

Les Cent mille milliards de poèmes de Raymond Queneau avaient été adaptés sous forme informatique par Dmitri Starynkevitch en 1961. Mais la dimension entièrement aléatoire du procédé informatique avait d'abord repoussé les Oulipiens. Une autre adaptation informatique de Cent mille milliards de poèmes dont le générateur était basé sur le nom de la personne qui lançait l'application avait été mieux reconnue par le groupe. Natalie Berkman écrit un article intéressant à ce sujet.

Plutôt que la littérature "potentielle", les algorithmes permettent une forme de littérature "exponentielle", telle qu'évoquée ici. Parmi les exemples concrets et actifs de cette littérature exponentielle algorithmique, il est possible d'évoquer la version robot de dril sur Twitter.

Le développement de programmes de génération langage "naturel" est très lié aux chatbots et interraction commerciales. Après une période exploratoire, je vais essayer de construire ce programme à partir de la bibliothèque spaCy.

Approche

L'idée est d'élaborer un corpus d'environ 15'000 vocables. Ce nombre a été choisi à la louche, en considérant les statistiques de vocables de piliers ronflants de la littérature française. C'est un nombre empiriquement suffisant pour garantir une œuvre si ce programme se mettait à fonctionner un jour. Ce répertoire de vocables est réparti entre des lexiques de différentes fonctions syntaxiques. Les détails sont à voir dans le dépôt, mais je parle ici de verbes, de substantifs, d'adverbes, d'adjectifs, etc. - mais aussi des mots rares, hapax, etc.

Il s'agit ensuite de créer un moteur à générer des phrases - de différentes variétés, avec différentes contraintes, différents rythmes. À ce générateur de phrases, s'ajoute un générateur de chapitres qui répète un certain nombre de fois le générateur de phrases selon certaines contraintes. Par exemple, il générera 1000 phrases différentes avec une moyenne de 5 mots, une variance de x, etc. offrant au lecteur un chapitre de roman.

L'idée derrière ce petit programme est de tenter une approche inversée du processus d'écriture, de considérer l'édition comme le travail central de production d'un roman. L'algorithme génère donc un surplus de texte sur lequel intervient ensuite l'humain, l'éditeur, qui le reforme pour le rendre lisible.

Pistes à développer

Un élément central de ce projet et le peuplement des lexiques - leur champ, leur origine, leur sélection, etc. va déterminer la couleur du texte produit. Dans un second temps, il serait intéressant de mettre au point des outils pour faciliter, voir automatiser le peuplement des lexiques. Le travail d'édition du texte mentionné plus haute se jouerait donc autant dans la relecture du produit généré que dans la relecture des lexiques générés.

Name		Name	Last commit message	Last commit date
Latest commit History 225 Commits
__pycache__		__pycache__
lex		lex
LICENSE		LICENSE
README.md		README.md
chapitre1.py		chapitre1.py
dico.db		dico.db
dicodb		dicodb
spaCy_chapitre.py		spaCy_chapitre.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

texte

Précédents

Approche

Pistes à développer

About

Releases

Packages

Languages

License

poudrenoire/texte

Folders and files

Latest commit

History

Repository files navigation

texte

Précédents

Approche

Pistes à développer

About

Topics

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages