Préambule
J'ai toujours tenu à m'assurer que mes produits logiciels sont les plus faciles à utiliser possible. L'interaction homme-machine bénéficie depuis longtemps de la recherche sur l'IA. Nous avons pris pour acquis l'interaction vocale grâce à nos téléphones (Siri, grâce à Luc Julia, existe sur la plate-forme Apple, depuis plus d'une décennie maintenant).
Avec ChatGPT et OpenAI, fin 2022, le public a réalisé que l'IA semblait être capable de comprendre les questions, les instructions et d'exacerber les comportements de type raisonnement. Cela a bluffé tout le monde, y compris moi-même. Jusque-là, interagir avec les chatbots a toujours connu une expérience limitée, à un point tel que les chatbots ont fait l'objet de blagues. Nous sommes tous tombés sur des cas où nous, les humains, avons dû nous adapter aux limites de la technologie. Nous avons tous constaté à quelle vitesse le bot n'était pas capable de saisir certaines questions, tout en y répondant.
Depuis ChatGPT, il semble presque naturel que l'IA soit capable de comprendre et de répondre de manière significative (la plupart du temps), au point même que les gens utilisent des qualités anthropomorphiques lorsqu'ils parlent de leur expérience, comme s'ils ne pouvaient pas dire que l'interaction était avec un humain ou une machine.
C'est donc une évidence pour moi, et pourquoi je place les chatbots au sommet des cas d'utilisation de l'IA générative. Mais avant de parler de cas d'usages, pourquoi parle-t-on d'« IA générative » ?
Définition de l'IA générative
ChatGPT est basé sur l'architecture du modèle Transformer (réseau neuronal qui a d'ailleurs été inventé par Google, pas OpenAI). Ce type de réseau neuronal a émergé des recherches en TAL (Traitement Automatique du Language) pour mieux apprendre le contexte en suivant les relations dans des données séquentielles comme les mots d'une phrase. Il a remplacé les modèles RNN depuis.
Ces modèles sont entrainés sur des ensembles de données gigantesques. L’entrainement consiste à masquer des parties du texte et à faire deviner au modèle la partie manquante et à optimiser les poids du modèle jusqu'à ce que la prédiction soit bonne.
Certains scientifiques simplifient ces modèles car « ils sont juste entrainer à prédire le prochain jeton » (ou mot) et « ils ne sont pas vraiment capable d'intelligence ». J'ai tendance à être d'accord, et en même temps, ces LLMs (Large Language Models) doivent apprendre quelque chose de tout ce contenu. Il y a de la connaissance dans ce que les auteurs écrivent, même si ce n'est pas de l'intelligence ni du bon sens comme celui du cerveau humain.
Cette capacité à générer un jeton, et par extension compléter des phrases, des paragraphes, des essais, ... C'est ce qui a conféré son appellation « générative » à cette technologie.
Ces modèles ont été utilisés sur d'autres données que le texte depuis : image, audio, vidéo, ... L'IA générative est donc bien plus que des chatbots.
Répondre aux questions
Toute organisation de taille dispose de nombreux produits et d'une base de connaissances pour supporter l'utilisation de ces produits par ses clients. L'équipe de support client est en première ligne face à la pression des clients pour obtenir des réponses à leurs questions. Ces employés peuvent désormais interagir avec un « expert virtuel » basé sur l'IA générative dans leur langue. Contrairement à ChatGPT, « l'expert virtuel » a été entrainé avec les documents propriétaires de l'entreprise et peut traiter les demandes spécifiques au domaine de l'entreprise.
Répondre aux questions ne se limite pas au support client. Bloomberg a récemment annoncé avoir créé son propre LLM spécialement entrainé avec des ensembles de données financières pour répondre aux besoins de ses clients dans le secteur de la finance. Ces clients peuvent converser avec BloombergGPT à propos des actualités financières, les transcriptions des conférences auprès des investisseurs, les rapports financiers des entreprises, leurs communiqués de presse.
Tout le monde n'a pas les moyens de créer son propre modèle de type GPT. Il existe maintenant des solutions prêtes à l'emploi permettant aux entreprises d'indexer leurs propres documents et de fournir un chabot à usage interne ou client. Google a récemment annoncé la disponibilité générale de son Duet AI pour Google Workspace, donc discuter avec les documents de votre entreprise va pouvoir très bien fonctionner avec une expérience prête à l'emploi.
Génération d'essais
Des nouvelles du monde entier ont inondé nos flux d'informations alors que des étudiants ont été pris en flagrant délit de tricherie en rendant des devoirs faits avec ChatGPT.
Les équipes marketing sont sous la pression du temps lorsqu'il s'agit de générer du contenu pour les différentes sources d'information qu'elles alimentent. Des outils comme Jasper.ai les aident à importer des documents, des modèles et fournissent des paramètres afin qu'ils puissent générer du contenu beaucoup plus rapidement, tout en conservant leur image de marque (ce que jasper appelle Brand Voice). Les spécialistes du marketing suivront les conseils d'experts incitant à maximiser leur efficacité dans la génération de contenu.
Résumé
La surcharge d'informations est un phénomène bien connu, qui a un impact sur la capacité et la qualité de nos facultés décisionnelles. Avoir un bon outil de synthèse à portée de main vous enlèvera une partie de la pression décourageante de devoir ingérer tout ce contenu. Cela vous aidera à décider si tel ou tel document vaut vraiment la peine et vous aidera à prioriser votre temps de lecture.
Des outils comme Genei.io vous aident à ajouter, organiser et gérer des documents, à résumer automatiquement la lecture de références et à produire des blogs, des articles ou des rapports plus rapidement.
Traduction
Il n'a jamais été aussi facile de rayonner dans le monde entier et de développer son entreprise à l'étranger.
Nous avons maintenant des applications qui gèrent même la traduction en direct d'une langue à l'autre, certaines déjà intégrées à votre plate-forme d'appels vidéo préférée. Des API cloud prennent en charge la création de traduction automatique de contenu textuel évolutif afin que vous puissiez cibler plusieurs pays, en tant que petite / moyenne entreprise et ne pas avoir à vous soucier de tous les tracas de la traduction manuelle. Un humain fera probablement un bien meilleur travail pour générer une traduction de site Web statique, mais l'approche manuelle n'est vraisemblablement pas une solution appropriée si votre contenu évolue plusieurs fois par jour et il sera difficile de passer à l’échelle si vous ciblez un grand nombre de pays / langues. Des API comme DeepL pourront répondre à vos besoins d'internationalisation.
Un example récent, la Commission européenne vient tout juste d'annoncer une traduction automatique des communiqués de presse. La traduction professionnelle humaine poursuivra et remplacera la version automatique « dès que les versions humaines seront disponibles ».
Un autre exemple récent est la vidéo postée par la CEO de Veolia pour s’adresser à tous les clients, partenaires et employés de la société pour son 170ème anniversaire et ceci en Arabe, Chinois, Tchèque, Espagnol, Italien, Français, Anglais, … aujourd'hui, vous pouvez vous adresser au monde entier sans pour autant avoir des talents de polyglotte.
Certains modèles open source comme SeamlessM4T de Meta gèrent toutes les traductions vocales ou textuelles, mais ne sont pas encore disponibles sous licence commerciale.
Une autre forme de traduction est du langage textuel au code applicatif. Lorsqu’un développeur apprend un nouveau langage de programmation ou une nouvelle bibliothèque ou une API, elle/il passe beaucoup de temps à rechercher des exemples de code, à effectuer beaucoup de copier/coller pour assembler le résultat souhaité dans son code d'application. Désormais, les développeurs utilisant GitHub Copilot peuvent fournir une description textuelle de ce qu'ils essaient de créer, et l'outil fourni des suggestions de codage en réponse.
Autres cas d'usages de l'IA Générative
Hub France IA a récemment publie une note de synthèse sur ChatGPT, on y retrouve ces cas d'usages et bien d'autres détails (26 pages que je vous ai résumé avec plaisir).
Le tableau du magazine Actu IA fait aussi un bel état de l'art par domaine d'activité :
Comments