Accueil🇫🇷Chercher

GPT-4

GPT-4 (acronyme de Generative Pre-trained Transformer 4) est un modèle de langage multimodal, de type transformeur génératif pré-entraîné, développé par la société OpenAI et sorti le , il succède à GPT-3[1].

GPT-4

Chronologie des versions

Entrainement et capacités

OpenAI annonce, sur son blog, GPT-4 comme étant « plus fiable, créatif et capable de gérer des instructions beaucoup plus nuancées que GPT-3.5 »[2]. L'organisation a produit deux versions de GPT-4 avec des fenêtres contextuelles de 8 192 et 32 768 jetons, une amélioration significative par rapport à GPT-3.5 et GPT-3, qui étaient limités à 4 096 et 2 048 jetons respectivement[3]. Contrairement à son prédécesseur, GPT-4 peut prendre des images ainsi que du texte comme entrées.

OpenAI adopte une approche fermée en ce qui concerne les détails techniques de GPT-4 ; le rapport technique s'est explicitement abstenu de spécifier la taille, l'architecture, le matériel ou la méthode de formation du modèle. Le rapport affirme que « le paysage concurrentiel et les implications sur la sécurité des modèles à grande échelle » sont des facteurs qui ont influencé cette décision. Le nombre précis de paramètres de GPT-4 reste inconnu, mais The Verge cite des rumeurs selon lesquelles GPT-4 augmenterait considérablement le nombre de paramètres de GPT-3 de 175 milliards à 100 000 milliards. Le PDG d'OpenAI, Sam Altman, qualifie ces rumeurs de « conneries complètes ». Un nombre plus fréquemment avancé est celui de 1000 milliards de paramètres[4] - [5].

Les représentants américains Don Beyer et Ted Lieu ont confirmé au New York Times qu'Altman s'était rendu au Congrès des États-Unis en janvier 2023 pour faire la démonstration du GPT-4 et de ses "contrôles de sécurité" améliorés par rapport aux autres modèles d'IA.

En février 2023, Microsoft dote son moteur de recherche Bing d'un agent conversationnel reposant sur la technologie GPT-4. Cet agent répond aux questions de l'utilisateur en effectuant des recherches web. Contrairement à l'application d'Open AI, il cite ses sources, ce qui permet à l'utilisateur de les consulter lui-même[6].

RĂ©ception

Le New York Times a écrit que GPT-4 a montré des améliorations impressionnantes de la précision par rapport à GPT-3.5, avait acquis la capacité de résumer et de commenter des images, était capable de résumer des textes compliqués, a réussi un examen du barreau et plusieurs tests standardisés, mais a quand même montré une tendance à halluciner les réponses[7].

Notes et références

  1. Thomas Coëffé, « OpenAI dévoile GPT-4 : tout savoir sur le nouveau modèle d’IA multimodale », sur BDM, (consulté le )
  2. Wiggers, « OpenAI releases GPT-4, a multimodal AI that it claims is state-of-the-art » [archive du ], TechCrunch, (consulté le )
  3. (en) « OpenAI API », platform.openai.com (consulté le )
  4. https://the-decoder.com/gpt-4-has-a-trillion-parameters/
  5. https://www.semafor.com/article/03/24/2023/the-secret-history-of-elon-musk-sam-altman-and-openai
  6. « Avec Fabric, Microsoft veut unifier et simplifier l'analyse de données - Le Monde Informatique », sur LeMondeInformatique, (consulté le )
  7. (en-US) Cade Metz, « 10 Ways GPT-4 Is Impressive but Still Flawed », The New York Times,‎ (lire en ligne [archive du ], consulté le )

Annexes

Articles connexes

Liens externes

Cet article est issu de wikipedia. Text licence: CC BY-SA 4.0, Des conditions supplémentaires peuvent s’appliquer aux fichiers multimédias.