Anthropic a lancé une version améliorée du LLM pour les débutants

Crédits image : anthropique

Anthropic, la startup d’IA co-fondée par d’anciens dirigeants d’OpenAI, a libéré Une version mise à jour du modèle de génération de texte le plus rapide et le moins cher disponible via l’API, Claude Instant.

La version mise à jour de Cloud Instant, Cloud Instant 1.2, intègre les points forts du modèle phare d’Anthropic récemment annoncé, Cloud 2, et montre des gains « significatifs » dans des domaines tels que les mathématiques, le codage, le raisonnement et la sécurité, selon Anthropic. Lors des tests internes, Claude Instant 1.2 a obtenu 58,7% sur le benchmark de codage par rapport à Claude Instant 1.1, qui a obtenu 52,8%, et 86,7% sur un ensemble de questions mathématiques contre 80,9% pour Claude Instant 1.1.

« Instant Cloud produit des réponses plus longues et plus structurées et suit mieux les directives de formatage », a écrit Anthropic dans un article de blog. Instant 1.2 montre également des améliorations dans l’extraction de citations, les capacités multilingues et la réponse aux questions.

Cloud Instant 1.2 est moins susceptible d’halluciner et plus résistant aux tentatives de jailbreak, affirme Anthropic. Dans le contexte de grands modèles de langage tels que Claude, une « hallucination » est l’endroit où un formulaire génère un texte incorrect ou dénué de sens, tandis qu’un jailbreak est une technique qui utilise des invites intelligemment tapées pour contourner les fonctions de sécurité placées sur de grands modèles de langage par leurs créateurs.

Claude Instant 1.2 dispose d’une fenêtre contextuelle de la même taille que celle de Claude 2 – 100 000 icônes. La fenêtre contextuelle indique quel texte le formulaire considère avant de créer du texte supplémentaire, tandis que les jetons représentent du texte brut (par exemple, « cool » serait divisé en jetons « fan », « tas » et « tic »). Claude Instant 1.2 et Claude 2 peuvent analyser environ 75 000 mots, à peu près la longueur de « The Great Gatsby ».

En général, les modèles avec de grandes fenêtres contextuelles sont moins susceptibles « d’oublier » le contenu des conversations récentes.

Comme mentionné précédemment, l’ambition d’Anthropic est de créer un « algorithme d’auto-apprentissage de nouvelle génération pour l’intelligence artificielle », comme il le décrit dans une présentation aux investisseurs. Un algorithme comme celui-ci pourrait être utilisé pour créer des assistants virtuels capables de répondre aux e-mails, de faire des recherches, de créer des illustrations, des livres, etc. – et nous en avons déjà certains avec GPT-4 et d’autres grands modèles de langage.

Mais Cloud Instant n’est pas cet algorithme. Au lieu de cela, il vise à concurrencer les offres d’entrée de gamme similaires d’OpenAI ainsi que des startups comme Cohere et AI21 Labs, qui développent et produisent tous leurs propres systèmes d’IA générant du texte – et dans certains cas des images.

À ce jour, Anthropic, lancé en 2021 et dirigé par l’ancien vice-président de la recherche d’OpenAI, Dario Amodi, a levé 1,45 milliard de dollars à une valorisation à un chiffre de plusieurs milliards. Bien que cela puisse sembler beaucoup, c’est bien moins que ce dont l’entreprise estime avoir besoin – 5 milliards de dollars au cours des deux prochaines années – pour créer le chatbot envisagé.

Anthropic a lancé une version améliorée du LLM pour les débutants

La société d’intelligence artificielle Midjourney présente un produit matériel sous une nouvelle forme

Les principaux sites Web refusent d’utiliser la technologie d’intelligence artificielle d’Apple

Les joueurs se plaignent de la longue recherche de joueurs sur PS5 alors que le nombre de joueurs diminue

La société d’intelligence artificielle Midjourney présente un produit matériel sous une nouvelle forme

Les principaux sites Web refusent d’utiliser la technologie d’intelligence artificielle d’Apple

Top 7 des stations de ski de luxe haut de gamme en France

Quelle est la prochaine grande nouveauté en matière de perte de poids ?

Laisser un commentaire Annuler la réponse

More Stories

La société d’intelligence artificielle Midjourney présente un produit matériel sous une nouvelle forme

Les principaux sites Web refusent d’utiliser la technologie d’intelligence artificielle d’Apple

Les joueurs se plaignent de la longue recherche de joueurs sur PS5 alors que le nombre de joueurs diminue

You may have missed

La société d’intelligence artificielle Midjourney présente un produit matériel sous une nouvelle forme

Les principaux sites Web refusent d’utiliser la technologie d’intelligence artificielle d’Apple

Top 7 des stations de ski de luxe haut de gamme en France

Quelle est la prochaine grande nouveauté en matière de perte de poids ?