Automatisation rime aujourd’hui avec innovation et gain de temps en termes de rédaction. S’il s’agit du rêve de quelques éditeurs de sites web qui souhaitent économiser des ressources, c’est également un mot qui fait frémir certains professionnels de la production de contenus. Entre la crainte d’une perte d’intérêt pour les concepteurs-rédacteurs et les journalistes, et le manque de confiance envers l’intelligence artificielle, ce sujet a le mérite de nous inviter à prendre du recul sur la définition de la création.
Derrière l’idée d’automatisation, on trouve celle de la systématisation par la mise en place de règles et l’usage de corpus de référence. Alors comment conserver une valeur ajoutée dans un monde qui s’accélère et se robotise ? Comment proposer des contenus singuliers tandis que nous voudrions que tout aille toujours plus vite ?
L’objectif de cet article est de vous proposer un panorama des techniques d’automatisation de la création de contenus. Est-ce réellement possible ? Et si oui, dans quelle mesure ? Peut-on avoir les mêmes exigences avec un robot qu’avec une équipe de rédacteurs formés et immergés dans les besoins d’une marque, d’une entreprise ?
Les techniques de génération de textes
La génération de texte n’a pas attendu l’arrivée de l’intelligence artificielle et des robots conversationnels. L’automatisation peut se faire très simplement et avec des techniques qui ont déjà été largement éprouvées. Même si certaines apparaissent comme étant parfois désuètes, elles n’en demeurent pas moins très présentes.
Le texte à trous
C’est sans aucun doute la technique la plus simple. La création de textes à trous fait partie des exercices que l’on pourra donner à un développeur débutant pour lui permettre de créer des variations d’un même contenu grâce à des variables.
Le texte à trou fonctionne par combinaison. On attribue des éléments variables dans une même phrase.
Exemple de texte à trous :
- Je m’appelle ______ ;
- Je m’appelle Syphaïwong ;
- Je m’appelle Sophie.
Par effet de substitution, une suite de mots dispose ainsi de versions différentes. Il vous suffit de créer une trame principale, puis de demander de remplacer certains mots, ou séquences de mots, par une expression particulière. Dans l’exemple précédent, c’est simplement le prénom qui change.
En raison du niveau de duplication de contenus que peut créer cette méthode, elle est peu utilisée pour des textes longs, et encore moins à grande échelle. Cependant, même si sa cote décroit pour générer des textes sur les sites web, la technique du texte à trous n’a pas quitté les champs du webmarketing. On la retrouve encore dans le cadre de la personnalisation de courriers, newsletters, et dans les annonces Adwords.
En résumé, le texte à trous se présente surtout comme un outil de personnalisation. L’outil Yet Another Mail Merge propose grâce à cette technique un outil de publipostage à utiliser directement grâce à une boîte Gmail et un document Google Spreadsheet. Comme ci-dessous, on configure les variables. Il suffit ensuite de rédiger son mail de la même manière que sur l’image suivante pour générer les courriers et les envoyer en série.
Exemple de configuration d’une base pour préparer un publipostage dans l’outil YAMM.
Exemple d’email (au message marketing capital) dans Gmail pour l’utilisation de l’outil YAMM.
Le texte à trous est par ailleurs la méthode favorite des robots humoristiques que l’on rencontre sur Twitter. Comme on peut le voir dans la capture d’écran suivante, le compte Twitter Ghost Things génère des textes en se servant du dictionnaire de la langue française. Les expressions absurdes générées rencontrent parfois un certain succès.
Extraits de tweets générés par le compte Ghost Things.
Le content spinning
« Spinning » est un verbe qui désigne le fait de tourner quelque chose en anglais. Cette rotation permet la génération de textes en déclinant des termes. Contrairement au texte à trous, on peut même inverser des phrases entre elles, voire même des paragraphes.
Pour faire du content spinning, un rédacteur crée un fichier maître que l’on appelle le « masterspin », qui permettra ensuite de générer des « spuns » grâce à un script. Si la méthode initiale est toujours la même, les différents outils de content spinning proposent des options supplémentaires pour opérer de plus grandes variations. Vous pouvez par exemple combiner la méthode du content spinning avec celle du texte à trous.
Voici un exemple de masterspin simple :
{Bonjour|Hello|Salut}, {je {m’appelle|suis|me prénomme}|mon nom est} {Syphaïwong|Sophie}.
Exemples de spuns générés à partir de ce masterspin :
- Bonjour, je me prénomme Syphaïwong ;
- Hello, je suis Sophie ;
- Salut, je m’appelle Sophie.
Le content spinning s’avère particulièrement performant dans de nombreuses situations. Plus le masterspin est complexe, plus les déclinaisons sont uniques. Cependant, la création d’un masterspin demande une très bonne connaissance de la langue française et de son fonctionnement. Sans ces compétences, le content spinning peut rapidement entraîner des fautes, voire des textes illisibles (et donc irrémédiablement pénalisés par les moteurs de recherche).
L’intelligence artificielle
La génération de texte grâce à l’intelligence artificielle se base sur l’utilisation d'algorithmes qui apprennent et créent des textes en fonction des informations que nous lui apportons. Un corpus, des références et des règles définissent le périmètre dans lequel le robot évolue. Ce dernier apprend également, si nous le lui demandons, pour alimenter de lui-même son vocabulaire.
Ce n’est pas de la science-fiction, et il est possible que vous ayez déjà lu des contenus produits par ces robots écrivains sans le savoir. En 2015, l’entreprise française Syllabs a généré selon Cnetfrance.fr des articles sur Le Monde, Le Parisien et France Bleu au sujet des élections régionales de 2015. Les noms des listes et des candidats sont connus, les résultats sont des informations publiques… à l’algorithme de travailler !
La solution qui a le vent en poupe est GPT-3 ! Développée par l’entreprise américaine OpenAI, elle est disponible depuis juillet 2020. GPT-3 démontre des performances absolument bluffantes.
Un test a été réalisé pour cet article en proposant à l’algorithme trois anecdotes du site FuckMyLife (VieDeMerde.fr en français), dont nous remercions l’équipe pour leur aide. Vous ne trouverez pas en ligne les anecdotes générées sur l’image suivante. Nous pouvons y voir que, très rapidement, GPT-3 a identifié la structure à respecter. « Today » est bien présent en début d’anecdote, de même que « FML » à la fin. Surtout, les histoires proposées par l’algorithme sont tout à fait cohérentes. Nous y reconnaissons la note d’humour caractéristiques de contributions faites sur le site web.
Pour d’autres exemples à tester vous-mêmes, le site ProductHunt recense des projets qui utilisent la technologie d’intelligence artificielle GPT-3.
Test de GPT-3 par OpenAI.
Aujourd’hui, le marché ne manque pas de solutions d’automatisation de la création de contenus qui utilisent l’intelligence artificielle. Même si elles ne sont peut-être pas toutes aussi virtuoses que ce que propose OpenAI, elles n’en sont pas moins intéressantes. Il ne faut cependant pas négliger le temps de configuration et d’apprentissage de ces outils avant d’arriver à des résultats satisfaisants.
La rédaction de contenus et ses exigences
Outre le niveau de qualité que l’on demande à tout texte publié en ligne (orthographe, syntaxe, optimisations sémantiques), la création de contenus doit également répondre à des objectifs éditoriaux.
Il est difficile d’imaginer l’automatisation de la rédaction de contenus éditoriaux originaux, de même que des avis d’experts. Certains domaines sont même très sensibles. C’est le cas des contenus qui font référence, ou qui présentent des professions réglementées. Ils doivent impérativement faire preuve de la plus grande application et pertinence. La moindre mauvaise interprétation pourrait s’avérer désastreuse.
La qualité des rédacteurs réside dans la capacité de s’imprégner du ton d’un commanditaire. Cette voix particulière est transmise dans des textes, même a priori anodins. Un contenu bien écrit reflète l’identité d’une enseigne. Quant à l’optimisation opérée pour le référencement naturel, elle ne se voit pas.
Si nous tenons compte du niveau d’exigence relative à la création de contenus, nous identifions plusieurs freins à la génération automatique :
- Une ligne éditoriale avancée ;
- Le besoin de la mise en place de l’écriture inclusive ;
- Une relecture juridique indispensable ;
- Le besoin de contenus entièrement originaux faisant l’objet d’une éditorialisation et d’un travail de recherche ;
- L’éditorialisation d’interviews.
L’ensemble des contraintes rendent compliqué le fait d’envisager l’automatisation d’un éditorial ayant pour objectif la transmission d’un point de vue. En revanche, pourquoi pas pour la déclinaison de pages dont les objectifs sont clairement définis, et pour lesquelles l’on disposerait d’une base de connaissances structurée ? C’est de cette façon que l’on pourrait continuer la génération de textes pour la publication de résultats électoraux, de bulletins météo, de programmes TV, ou même de contenus pour les sites e-commerce.
Accélérer les process dans les projets de création de contenus
Lorsque l’on découpe les tâches relatives à la création d’un contenu textuel, nous pouvons rapidement distinguer des tâches automatisables, ou du moins, qui peuvent être accélérées en faisant preuve de méthode.
Structurer la prise de briefs et l’identification des besoins
L’idée est de faciliter la prise de brief pour la rédaction des contenus. La mise en place de la meilleure méthode demande une part de psychologie pour déterminer le canal et le support de communication qui conviennent le mieux. Cette phase est d’autant plus importante lorsqu’un contenu doit répondre à plusieurs enjeux à la fois : marque, communication, juridique, acquisition de trafic, conversion, etc.
Parmi les solutions à mettre en place, nous pouvons citer :
- Le formulaire de soumission des besoins avec des questions déterminées par la profession pour obtenir les bonnes informations ;
- Le tableau de collecte d’informations spécifiques liées au métier et produits ;
- Le partage des documents internes et de références validées pour l’accélération des phases de recherche.
Les outils de gestion de projet sont vos amis
Tout ce qui peut accélérer les allers et retours entre les prises de décision et les validations est intéressant. L’organisation de jalons fait partie de points clefs pour accélérer la production. Plus tôt nous identifions les contraintes et les bonnes pratiques, à valider ensemble, plus nous gagnons du temps sur la suite d’un projet éditorial.
De la même manière, choisissez des outils de communication efficaces et accessibles pour qu’ils soient utilisés de façon optimale par vos interlocuteurs. Il ne faut donc pas hésiter à changer de canal de communication pour favoriser les échanges. Cela ne signifie pas d’être connecté en permanence à un chat, mais de ne pas créer de frein qu’il est possible d’éviter simplement grâce à des stratégies plus judicieuses.
L’accélération des projets passe aussi par l’automatisation de tâches mécaniques et répétitives qui ne font pas partie de la réflexion éditoriale. La création de fichiers de livrables, la conversion en HTML, ou la génération de pages sont autant de pistes à explorer pour automatiser des tâches chronophages.
L’écriture collaborative
Les outils de travail collaboratif comme PasteBin.com, Google Documents, Microsoft Teams, Slack, ou Atolia (made in France), sont parmi les nombreux outils permettant d’échanger sur les mêmes documents.
Comment choisir un bon outil collaboratif pour la rédaction de contenus ? Ce dernier doit :
- Proposer le versionning (archive des modifications) ;
- Permettre l’identification des auteurs des contributions ;
- Rendre visibles les besoins et critères récurrents dans un projet éditorial ;
- Proposer la même version de fichier à tous les contributeurs ;
- Être sécurisé, car nous ne sommes jamais trop prudents.
Même si vous disposez d’un cahier des charges éditorial déjà formalisé, nous vous invitons à l’enrichir progressivement de tous les constats réalisés au fur et à mesure de la rédaction des contenus. Prendre note des besoins et les appliquer de façon commune fait partie des bonnes pratiques pour accélérer efficacement la mise en œuvre des projets.
Peut-on automatiser la créativité ?
Dans un contexte tel que la rédaction d’un texte qui a pour but d’être publié sur le Web, nous pouvons considérer que la valeur ajoutée réside dans son niveau de pertinence. La qualité relève de l’exactitude des informations transmises. Cependant, il s’agit également de retrouver une donnée, ou un point de vue, qui fait sens. C’est ainsi qu’un contenu se démarque particulièrement d’un autre.
Or, lorsque plusieurs rédacteurs disposent des mêmes sources, et qu’ils ont entre leurs mains les mêmes références fournies par un commanditaire (client, employeur, ou soi-même pour un projet personnel), comment se distinguer ?
Les idées singulières qui font preuve de créativité sont les fruits d’une culture et d’un travail de recherche synthétisés en quelques idées. C’est ainsi que l’on innove. Or, un auteur a pour particularité d’avoir vécu des expériences et appris des choses qu’il est en mesure d’exploiter. Dans la mesure où l’intelligence artificielle apprend en fonction de l’information que nous lui transmettons, une personne est quant à elle sollicitée pour sa culture et ses connaissances lui permettant de dégager un point de vue unique.
A-t-on besoin de créativité pour des contenus performants ?
La créativité est gage de recherche et d’innovation. Même à petite échelle et sur des contenus d’apparence banale, il est souvent possible d’ajouter la touche qui fait la différence.C’est grâce à elle que nous sommes en mesure de mettre en avant la valeur ajoutée d’un produit ou d’un service. Elle nous permet d’aller plus loin dans nos recherches, et de sortir des sentiers battus. Au-delà de l’idée de pertinence, si nous parlons d’un point de vue SEO, la créativité est un gage d’unicité pour les contenus produits. C’est donc un levier pour acquérir en pertinence.
Par effet boule de neige, nous pouvons considérer qu’un contenu créatif est un outil de fidélisation afin d’encourager une audience à revenir parcourir les pages d’un site. Enfin, une page créée grâce à une suite de réflexion devrait également être celle qui convertit le mieux. N’oublions cependant pas que la conception de contenus satisfaisants ne relève pas uniquement du texte proposé, mais aussi d’une expérience globale. La mise en forme, les images, la prise en considération des profils de son audience… Ne mettons pas de côté ces facteurs !
Un contenu créé par un robot ne peut-il pas être créatif ?
Si nous considérons que l’intelligence artificielle ne fait que reprendre des éléments connus pour les synthétiser et produire un contenu original, n’est-ce pas ce que nous faisons déjà ? C’est un débat connu dans le domaine de la création artistique où l’opinion n’a pas encore tranchée sur la valeur d’une œuvre composée de samplings. Entre la citation et le plagiat, la frontière est souvent mince. L’article « Intelligence artificielle et Créativité : Mythe ou réalité ? » sur DataScientest.com est en ce sens très intéressant.,
La presse en ligne s’est déjà interrogée sur ce sujet. Dès 2014, le Washington Post a publié des articles dont l’auteur était en réalité un robot. Même si nous sommes sans doute encore loin de contenus qui pourraient prétendre au Prix Pulitzer, ce qui est produit n’en est pas moins efficace.
Posons également la question de la responsabilité. La Commission Européenne a proposé des modèles de régulation en 2020 afin de déterminer sur qui pèserait la responsabilité en cas de contenu automatisé. Elle identifie deux cas de figure : la phase de développement, et la phase d’utilisation. Durant cette dernière, les responsabilités de développeurs devraient être limitées selon l'analyse de Cécile Crichton sur Dalloz.fr.
La notion de responsabilité de l’intelligence artificielle attire l’attention sur :
- L’attribution de la création (qui est l’auteur ?) ;
- L’attribution des risques (qui est garant d’un bon fonctionnement ?).
Des dérapages ont déjà fait la Une dans le passé. Tay, l’intelligence artificielle développée par Microsoft pour converser sur Twitter a publié en l’espace de 8 heures 96 000 tweets selon LeMonde. Le chatbot lancé en mars 2016 a suscité l’attention des internautes qui ont testé les limites de ce robot apprenant. En se nourrissant des connaissances que les utilisateurs du réseau social lui proposaient, Tay a fini par énoncer des propos racistes et négationnistes.
Pour éviter ces dérives gênantes et répréhensibles, les développeurs d’intelligence artificielle qui génèrent des contenus sont contraints de poser les limites. Comme pour un brief de rédaction, il faut à la fois définir ce que l’on veut, mais aussi ce que l’on ne veut pas.
Le périmètre est donc défini par le programmeur, ou l’utilisateur, afin de transmettre ses besoins à l’outil de génération de textes. C’est la raison pour laquelle les robots sont également soumis aux biais cognitifs, soit en résumé le fait d’avoir des erreurs de perception qui sont influencées par une culture ou un contexte.
Dans leur article « Une poésie machinique ? Génération automatisée, intelligence artificielle et création littéraire » (Communication et langages, n° 203, 2020), Tom Lebrun et René Audet identifient au sujet d’Alexa et Siri que « les automates langagiers se fondent sur des stratégies leur permettant de passer pour humains en vue de créer de meilleures expériences utilisateurs. Outre des échappatoires dialogales mobilisant un certain humour (laissant entendre la possibilité d’un second degré), le langage y est limité à un usage dénotatif et quotidien ».
Pour éliminer les risques de dérives, les robots conversationnels deviennent politiquement corrects au risque d’être insipides pour garantir un service en accord avec la morale d’une époque.
Automatisation de la rédaction de contenus : trouver le juste milieu
Oui, l’automatisation de la rédaction de contenu est accessible et techniquement possible. Les technologies existent, et libre à chacun de les utiliser.
Choisir entre une création automatisée ou une rédaction manuelle relève du choix stratégique. D’un point de vue gestion, les coûts entre les solutions de génération et de rédaction par des personnes doivent être comparés. Cependant, une prise de décision intelligente demande de mettre en perspective les tarifs proposés en fonction de votre niveau d’exigence. S’il est facile de générer rapidement un grand nombre de mots dans un objectif précis, le gain de temps n’est permis que si vous acceptez de faire confiance au robot. Tout relire pour tout réécrire risque de vous faire perdre beaucoup de temps et d’argent. Entre déléguer la production à un robot et recruter une personne en mesure de transmettre vos besoins à des rédacteurs créatifs, le choix n’est pas si simple !
L’automatisation de la création de contenus est séduisante, mais elle a un prix : recrutement, licence(s) d’outil, temps de formation, configuration, vérification, etc. La bonne pratique consiste souvent à amortir ces dépenses en privilégiant le content spinning ou les outils comme GPT-3 à de grands volumes de production. Une même entreprise peut même choisir de combiner plusieurs méthodologies afin de mieux répondre à ses différents besoins. Même si vous décidez de faire appel à des rédacteurs humains, l’automatisation de certaines phases de vos projets restera une source de gain de temps. C’est également en facilitant le travail des humains avec qui vous collaborez qu’ils seront en mesure d’exprimer toute leur créativité.
Syphaïwong Bay, Consultante Web Éditorial, SEO et Content Marketing Assonance.net.