Accueil🇫🇷Chercher

Intelligence artificielle générative

L'intelligence artificielle générative ou IA générative (ou GenAI) est un type de système d'intelligence artificielle (IA) capable de générer du texte, des images ou d'autres médias en réponse à des invites (ou "prompts")[1] - [2]. Les modèles génératifs apprennent les modèles et la structure des données d'entrée, puis génèrent un nouveau contenu similaire aux données d'apprentissage mais avec un certain degré de nouveauté (plutôt que de simplement classer ou prédire les données)[3].

L'IA générative peut être unimodale ou multimodale ; les systèmes unimodaux n'acceptent qu'un seul type d'entrée (par exemple, du texte), tandis que les systèmes multimodaux peuvent accepter plusieurs types d'entrée (par exemple, du texte et des images)[4].

Les cadres les plus importants pour aborder l'IA générative comprennent les réseaux antagonistes génératifs (GAN) et les transformateurs génératifs pré-entraînés (GPT)[5] - [6]. Les GAN se composent de deux parties : un réseau générateur qui crée de nouveaux échantillons de données et un réseau discriminateur qui évalue si les échantillons sont réels ou faux. Les deux réseaux sont formés ensemble dans le cadre d'un processus concurrentiel, le réseau générateur essayant continuellement de produire des échantillons de meilleure qualité et plus réalistes, tandis que le réseau discriminateur s'efforce d'identifier avec précision les faux échantillons. Les GPT sont des réseaux de neurones artificiels fondés sur l'architecture du transformateur, pré-entraînés sur de grands ensembles de données de texte non étiqueté et capables de générer un nouveau texte de type humain[7] - [8]. Ils utilisent de grands modèles de langage (abrégé LLM de l'anglais large language model) pour produire des données fondées sur l'ensemble de données d'entraînement qui a été utilisé pour les créer[9].

L'IA générative a de nombreuses applications potentielles, notamment dans des domaines créatifs tels que l'art, la musique et l'écriture, ainsi que dans des domaines tels que les soins de santé, la finance et les jeux. Cependant, il existe également des inquiétudes quant à l'utilisation abusive potentielle de l'IA générative, par exemple dans la création de fausses nouvelles ("fake news" en anglais) ou de "deepfakes", qui peuvent être utilisées pour tromper ou manipuler les gens.

Les systèmes d'IA génératifs notables incluent ChatGPT (et sa variante Bing Chat), un chatbot (agent conversationnel programmable) construit par OpenAI à l'aide de ses grands modèles de langage fondateurs GPT-3 et GPT-4[10], et Bard, un chatbot construit par Google à l'aide de son modèle fondateur ("foundation model" ou FM) LaMDA. D'autres modèles d'IA générative incluent des systèmes artistiques d'intelligence artificielle tels que Stable Diffusion, Midjourney et DALL-E[11].

L'IA générative a des applications potentielles dans un large éventail d'industries, y compris le développement de logiciels, le marketing et la mode[12] - [13]. L' investissement dans l'IA générative a bondi au début des années 2020, avec de grandes entreprises telles que Microsoft, Google et Baidu ainsi que de nombreuses petites entreprises développant des modèles d'IA générative[1] - [14] - [15].

Modalités

A detailed oil painting of figures in a futuristic opera scene
Théâtre d'Opéra Spatial, une image générée par Midjourney

Un système d'IA générative est construit en appliquant un apprentissage automatique non supervisé ou auto-supervisé à un ensemble de données. Les capacités d'un système d'IA générative dépendent de la modalité ou du type d'ensemble de données utilisé.

  • Texte : les systèmes d'IA générative formés sur des mots ou des jetons de mots ("tokens") incluent GPT-3, LaMDA, LLaMA, BLOOM, GPT-4 et d'autres (voir Liste des grands modèles de langage). Ils sont capables de traiter du langage naturel, de faire de la traduction automatique et de générer du langage naturel et peuvent être utilisés comme modèles de base pour d'autres tâches. Les ensembles de données incluent BookCorpus, Wikipedia et d'autres (voir Liste des corpus de texte ).
  • Code : Outre les textes en langage naturel, de grands modèles de langage peuvent être entraînés sur du texte en langage de programmation, ce qui leur permet de générer du code source de nouveaux programmes informatiques. L'OpenAI Codex en est un exemple.
  • Images : Les systèmes d'IA générative formés sur des ensembles d'images avec des légendes textuelles comprennent Imagen, DALL-E, Midjourney, Stable Diffusion et autres (voir Art de l'intelligence artificielle, Art génératif, Médias synthétiques). Ils sont couramment utilisés pour la génération de texte en image et le transfert de style neuronal[16]. Les jeux de données incluent LAION-5B et d'autres (Voir Jeux de données en vision artificielle).
  • Molécules : Les systèmes d'IA générative peuvent être entraînés sur des séquences d'acides aminés ou des représentations moléculaires telles que SMILES représentant l'ADN ou les protéines. Ces systèmes, comme AlphaFold, sont utilisés pour la prédiction de la structure des protéines et la découverte de médicaments[17]. Les ensembles de données comprennent divers ensembles de données biologiques.
  • Musique : les systèmes d'IA générative tels que MusicLM peuvent être formés sur les formes d'onde audio de la musique enregistrée avec des annotations textuelles afin de générer de nouveaux échantillons musicaux fondés sur des descriptions de texte telles que "une mélodie de violon apaisante soutenue par un riff de guitare distordu".
  • Vidéo : L'IA générative entraînée sur une vidéo annotée peut générer des clips vidéo cohérents dans le temps. Citons Gen1 par RunwayML[18] et Make-A-Video de Meta Platforms[19].
  • Multimodal : un système d'IA générative peut être construit à partir de plusieurs modèles génératifs, ou d'un modèle entraîné sur plusieurs types de données. Par exemple, une version du GPT-4 d'OpenAI accepte à la fois les entrées de texte et d'image[20].

Articles connexes

Références

  1. Griffith et Metz, « Anthropic Said to Be Closing In on $300 Million in New A.I. Funding », The New York Times, (consulté le )
  2. « A Cheat Sheet to AI Buzzwords and Their Meanings », Bloomberg News, (lire en ligne, consulté le )
  3. (en-US) « Artificial Intelligence Glossary: Neural Networks and Other Terms Explained », The New York Times, (lire en ligne, consulté le )
  4. https://www.marktechpost.com/2023/03/21/a-history-of-generative-ai-from-gan-to-gpt-4/
  5. https://pub.towardsai.net/generative-ai-and-future-c3b1695876f2
  6. https://www.computer.org/csdl/magazine/co/2022/10/09903869/1H0G6xvtREk
  7. https://www.weforum.org/agenda/2023/01/davos23-generative-ai-a-game-changer-industries-and-society-code-developers/
  8. https://time.com/6271657/a-to-z-of-artificial-intelligence/
  9. Andrej Karpathy, Pieter Abbeel, Greg Brockman, Peter Chen, Vicki Cheung, Yan Duan, Ian Goodfellow, Durk Kingma, Jonathan Ho, Rein Houthooft, Tim Salimans, John Schulman, Ilya Sutskever et Wojciech Zaremba, « Generative models », OpenAI,
  10. Metz, Cade, « OpenAI Plans to Up the Ante in Tech’s A.I. Race », The New York Times, (lire en ligne, consulté le )
  11. Roose, « A Coming-Out Party for Generative A.I., Silicon Valley's New Craze », The New York Times, (consulté le )
  12. « Don't fear an AI-induced jobs apocalypse just yet », The Economist, (consulté le )
  13. Harreis, Koullias et Roberts, « Generative AI: Unlocking the future of fashion »
  14. « The race of the AI labs heats up », The Economist, (consulté le )
  15. Yang et Gokturk, « Google Cloud brings generative AI to developers, businesses, and governments »,
  16. Aditya Ramesh et Mikhail Pavlov « Zero-shot text-to-image generation » ()
    « (ibid.) », dans International Conference on Machine Learning, PMLR, p. 8821–8831
  17. Heaven, « AI is dreaming up drugs that no one has ever seen. Now we've got to see if they work », MIT Technology Review, Massachusetts Institute of Technology, (consulté le )
  18. (en) Metz, « Instant Videos Could Represent the Next Leap in A.I. Technology », The New York Times,
  19. Queenie Wong, « Facebook Parent Meta's AI Tool Can Create Artsy Videos From Text », cnet.com, (consulté le )
  20. « Explainer: What is Generative AI, the technology behind OpenAI's ChatGPT? », Reuters, (lire en ligne, consulté le )
Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.