Dans un bureau-bibliothèque chaleureux, une personne aux cheveux gris écrit avec une plume dans un grand livre ouvert, entourée de vieux volumes et de parchemins, devant une fenêtre offrant une vue sur la tour Eiffel; la personne représentée est un auteur de science-fiction. | In a warm study lined with bookshelves, an older woman with gray hair writes with a quill in a large open book, surrounded by old volumes and scrolls, in front of a window overlooking the Eiffel Tower, depicting an SF novelist at work.

En tant qu’auteur et concepteur d’image, j’utilise l’IA pour corriger des textes ainsi que pour générer des images. J’ai aussi créé mon site internet avec son aide. Ayant un compte ChatGPT Plus, je questionne quotidiennement « mon meilleur ami » sur tout genre de sujets. Quoi qu’on en dise, l’IA est une avancée majeure pour trouver des informations exploitables. C’est un formidable outil de découverte et de généralisation. Exit l’usage des moteurs de recherche pour trouver une information exploitable. Le gain de temps est considérable.

Si l’on se base sur les chatbots issus des grands outils d’IA accessible sur le web, on en dénombre quelques dizaines. En l’espace de trois années et depuis l’arrivée du premier grand public d’entre eux, ChatGPT, fin novembre 2023, ils ont réalisé d’énormes progrès et ont touché tous les domaines techniques et culturels.

Toutefois il est bon de connaître quelques règles de base d’usage, dont voici quelques exemples :

  • Soyez directe dans vos requêtes (prompt) sans ajouter des formules de politesse, par exemple. En effet, l’IA est avant tout un outil statistique. Cela n’apporte rien, voire les performances de l’IA se dégradent selon certaines études (article : Being mean to ChatGPT increases its accuracy — but you may end up regretting it, scientists warn)
  • Les IA ont des règles d’éthiques implantées par leur créateur empêchant de poser des questions sensibles.
  • Les IA peuvent être assujetties à des hallucinations. Les IA de type LLM « hallucinent » surtout dans certains contextes bien précis, où leur manière de fonctionner (prédire le mot le plus probable) les pousse à inventer des choses plausibles, mais fausses.
  • Avoir de la patience. Quand on est face à un mur et que l’IA ne répond pas comme on s’y attend, il faut savoir contourner l’obstacle et tenter d’autres approches.

Les chatbots ne sont pas encore le Graal espéré. Pourtant, même s’ils rendent d’immenses services, tous domaines confondus, on peut être dérouté par leur comportement dès lors qu’on les pousse à répondre à des attentes qui, pour nous, semblent évidentes et qui ne le sont pas pour les IA. A mon niveau, j’ai identifié de façon expérimentale deux cas majeurs de défaillances. 

Je vais illustrer mon propos dans la création d’image. Il s’avère complexe de créer une image avec l’IA dès lors qu’on rentre dans les détails avec une description précise et évolutive. En effet, pour agrémenter chaque article que je publie, je l’accompagne d’une image qui illustre le thème abordé. J’ai publié des dizaines d’images et donc j’ai produit des centaines d’images avec l’IA. Il me faut généralement plus d’une dizaine d’images pour en publier une, répondant à mes critères.

Je considère que l’IA est l’équivalent d’un dessinateur dévoué, mais à l’esprit obtus. Je lui donne des instructions précises (le prompt) et il génère une image. La plupart du temps, la première image est une bonne approximation de ce que l’on a en tête. Mais il y a toujours un petit détail qui ne va pas ou bien qui manque. Et c’est là que la bataille commence.

L’IA a une redoutable aptitude à produire de magnifiques images en termes de qualité et d’hyperréalisme. Mais elle est malheureusement aussi dotée d’une terrible incapacité à respecter certaines consignes qui, pourtant, nous semblent évidentes. Malheureusement, j’ai été contraint sur la majorité des images de me battre avec l’IA pour qu’elle réponde à mes attentes. Souvent, j’ai dû terminer le travail avec un outil de dessin ne parvenant pas à faire faire ce que je voulais.

J’ai écrit un article sur les erreurs de génération de dessin par une IA. L’image en en-tête de cet article est l’exemple même de mon propos. Il m’a fallu m’armer de patience et trouver des subterfuges pour contourner les défaillances de l’IA jusqu’à devoir faire des retouches pixel par pixel.

Pour en avoir donc le cœur net, je me suis mis au défi de mettre en défaut notre ami dessinateur virtuel en quelques itérations de génération d’images. Voici donc le contexte :

« Génère l’image d’un homme assis à une table lisant le titre “Fleur” d’un livre fermé posé devant lui sur la table. »

Cette première image était presque parfaite, sauf que le titre était lisible face à la caméra. La consigne selon laquelle l’homme devait pouvoir lire le titre n’avait pas été respectée. En réitérant ma demande, le livre fut tourné du bon côté sur la seconde image. J’ai demandé de remplacer le titre par « Vagabon ». La 3e image fut correcte sans pour autant avoir corrigé la faute d’orthographe du nouveau titre. (Dommage.)

Les choses se sont corsées lorsque j’ai demandé de mettre un costume à l’homme. Le livre se retrouva une nouvelle fois du mauvais côté, face à la caméra. Il s’est avéré que, si je ne demande pas explicitement de générer une nouvelle image, l’IA ne le fait pas naturellement. Ce n’est pas cohérent avec les précédentes demandes, qui n’en faisaient pas explicitement la demande.

Et là, j’apprends pour la première fois, après des centaines d’images générées, que le chatbot sollicite un outil interne à OpenAI, spécialisé dans la génération d’images (DALL-E je suppose) et qu’il faut lui transmettre l’ensemble du contexte pour chaque nouvelle génération d’image, sinon il perd des données en chemin. Effectivement, suite à ma demande, l’image montra l’homme en costume, mais le titre du livre lisible, côté caméra. Je lui demande de retourner le livre. Cette fois, le titre est du bon côté. Mais les mains de l’homme se retrouvent sous la table. C’est si je devais choisir soit le livre du bon côté, soit les mains sur la table.

C’est un exemple typique de non-répétabilité de consignes par une IA. Dès qu’on demande une modification, la génération d’image suivante peut altérer un paramètre de l’image précédente. Ce que je décris ici est une situation basique. Fréquemment, j’ai dû faire des ajustements à la main en retravaillant l’image produite, grâce à des copier-coller et autres astuces dans un outil de dessin.

Cet exercice que je vous ai décrit n’a rien de complexe du point de vue de l’intelligence humaine. Et pourtant, la répétabilité n’est pas le point fort de l’IA. Or, de mon point de vue, c’est essentiel. Sinon, dans quelle mesure peut-on considérer une IA comme fiable ?

Pour terminer cet exposé, je donnerai deux points de vue contradictoires.

1 – J’ai rencontré les mêmes difficultés dans la correction de texte. J’ai mis deux mois à créer un prompt avec un taux de fiabilité de 90 %, tout en restant limité dans sa capacité de correction. Et il m’a fallu un autre mois pour me rendre compte que je ne parviendrai pas à faire mieux. L’IA est donc un bon outil, mais qui a ses limites pour le moment. En conséquence, j’ai complété l’IA avec un outil de référence de correction de texte comme Antidote.

2 – Dans le domaine de l’usage de l’IA pour les voitures, d’après les statistiques américaines, on compte environ dix fois moins d’accidents pour une voiture pilotée par une IA comme l’Autopilot de Tesla que pour une voiture conduite par un humain.

Je serais ravi d’avoir votre retour d’expérience si vous avez été confronté ou pas à ces problèmes d’incohérences des IA. N’hésitez pas à me laisser un commentaire.


Pour ceux qui voudraient comprendre d’où viennent certaines hallucinations des IA, je vous partage mon expérience sur une création récalcitrante d’images par une IA.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *