OpenAI annonce GPT-4, dit battre 90% des humains sur SAT

Sam Altman, PDG d’OpenAI, sort du déjeuner lors de la conférence Allen & Company Sun Valley le 6 juillet 2022 à Sun Valley, Idaho.

Kévin Dietsch | Getty Images Actualités | Getty Images

OpenAI a annoncé mardi la dernière version de son grand modèle de langage principal, GPT-4, qui, selon lui, présente des “performances de niveau humain” sur de nombreux tests professionnels.

ChatGPT-4 est “plus grand” que les versions précédentes, ce qui signifie qu’il a été formé sur plus de données et a plus de poids dans son fichier de modèle, ce qui le rend également plus coûteux à exécuter.

Actuellement, de nombreux chercheurs dans le domaine pensent que bon nombre des progrès récents de l’IA proviennent de l’exécution de modèles toujours plus grands sur des milliers de superordinateurs dans des processus de formation qui peuvent coûter des dizaines de millions de dollars. GPT-4 est un exemple d’approche centrée sur la “mise à l’échelle” pour obtenir de meilleurs résultats.

OpenAI a déclaré qu’il utilisait Microsoft Azure pour former le modèle ; Microsoft a investi des milliards dans la startup. OpenAI n’a pas publié de détails sur la taille spécifique du modèle ou le matériel utilisé pour le former, qui pourraient être utilisés pour recréer le modèle, citant “le paysage concurrentiel”.

Le grand modèle de langage GPT d’OpenAI alimente de nombreuses démos d’intelligence artificielle qui ont séduit les gens de l’industrie technologique au cours des six derniers mois, y compris le chat AI de Bing et ChatGPT, et la dernière version est un aperçu des nouvelles avancées qui pourraient commencer à filtrer jusqu’à produits de consommation comme les chatbots dans les semaines à venir. Le chatbot AI de Bing utilise GPT-4, a déclaré Microsoft mardi.

OpenAI affirme que le nouveau modèle produira moins de réponses factuellement incorrectes, déraillera et discutera moins souvent de sujets interdits, et même mieux que les humains sur de nombreux tests standardisés.

GPT-4 a obtenu le 90e centile lors d’un examen du barreau simulé, le 93e centile lors d’un examen de lecture SAT et le 89e centile lors de l’examen SAT Math, a déclaré OpenAI.

Cependant, OpenAI avertit que le nouveau logiciel n’est pas encore parfait et qu’il est moins capable que les humains dans de nombreux scénarios. Il a toujours un problème majeur avec “l’hallucination”, ou l’invention, et n’est pas fiable sur le plan factuel, a déclaré la société. Il est toujours enclin à insister sur le fait qu’il est correct alors qu’il est faux.

“GPT-4 a encore de nombreuses limitations connues que nous nous efforçons de résoudre, telles que les préjugés sociaux, les hallucinations et les invites contradictoires”, a déclaré la société dans un article de blog.

“Dans une conversation informelle, la distinction entre GPT-3.5 et GPT-4 peut être subtile. La différence apparaît lorsque la complexité de la tâche atteint un seuil suffisant : GPT-4 est plus fiable, créatif et capable de gérer beaucoup plus. instructions nuancées que GPT-3.5”, a écrit OpenAI dans un article de blog.

Le nouveau modèle sera disponible pour les abonnés ChatGPT payants et sera également disponible dans le cadre d’une API qui permet aux programmeurs d’intégrer l’IA dans leurs applications. OpenAI facturera environ 3 cents pour environ 750 mots d’invites et 6 cents pour environ 750 mots de réponse.

Nvidia est passé du jeu à l'IA Maintenant, le gros pari porte ses fruits car ses puces alimentent ChatGPT

Laisser un commentaire