Dakarinfo

Obtenez toutes les dernières nouvelles et rapports sur la FRANCE ici Manchettes, politique et culture françaises sur la chaîne d'information

Anthropic a lancé une version améliorée du LLM pour les débutants

Anthropic a lancé une version améliorée du LLM pour les débutants

Crédits image : anthropique

Anthropic, la startup d’IA co-fondée par d’anciens dirigeants d’OpenAI, a libéré Une version mise à jour du modèle de génération de texte le plus rapide et le moins cher disponible via l’API, Claude Instant.

La version mise à jour de Cloud Instant, Cloud Instant 1.2, intègre les points forts du modèle phare d’Anthropic récemment annoncé, Cloud 2, et montre des gains « significatifs » dans des domaines tels que les mathématiques, le codage, le raisonnement et la sécurité, selon Anthropic. Lors des tests internes, Claude Instant 1.2 a obtenu 58,7% sur le benchmark de codage par rapport à Claude Instant 1.1, qui a obtenu 52,8%, et 86,7% sur un ensemble de questions mathématiques contre 80,9% pour Claude Instant 1.1.

« Instant Cloud produit des réponses plus longues et plus structurées et suit mieux les directives de formatage », a écrit Anthropic dans un article de blog. Instant 1.2 montre également des améliorations dans l’extraction de citations, les capacités multilingues et la réponse aux questions.

Cloud Instant 1.2 est moins susceptible d’halluciner et plus résistant aux tentatives de jailbreak, affirme Anthropic. Dans le contexte de grands modèles de langage tels que Claude, une « hallucination » est l’endroit où un formulaire génère un texte incorrect ou dénué de sens, tandis qu’un jailbreak est une technique qui utilise des invites intelligemment tapées pour contourner les fonctions de sécurité placées sur de grands modèles de langage par leurs créateurs.

Claude Instant 1.2 dispose d’une fenêtre contextuelle de la même taille que celle de Claude 2 – 100 000 icônes. La fenêtre contextuelle indique quel texte le formulaire considère avant de créer du texte supplémentaire, tandis que les jetons représentent du texte brut (par exemple, « cool » serait divisé en jetons « fan », « tas » et « tic »). Claude Instant 1.2 et Claude 2 peuvent analyser environ 75 000 mots, à peu près la longueur de « The Great Gatsby ».

En général, les modèles avec de grandes fenêtres contextuelles sont moins susceptibles « d’oublier » le contenu des conversations récentes.

Comme mentionné précédemment, l’ambition d’Anthropic est de créer un « algorithme d’auto-apprentissage de nouvelle génération pour l’intelligence artificielle », comme il le décrit dans une présentation aux investisseurs. Un algorithme comme celui-ci pourrait être utilisé pour créer des assistants virtuels capables de répondre aux e-mails, de faire des recherches, de créer des illustrations, des livres, etc. – et nous en avons déjà certains avec GPT-4 et d’autres grands modèles de langage.

Mais Cloud Instant n’est pas cet algorithme. Au lieu de cela, il vise à concurrencer les offres d’entrée de gamme similaires d’OpenAI ainsi que des startups comme Cohere et AI21 Labs, qui développent et produisent tous leurs propres systèmes d’IA générant du texte – et dans certains cas des images.

À ce jour, Anthropic, lancé en 2021 et dirigé par l’ancien vice-président de la recherche d’OpenAI, Dario Amodi, a levé 1,45 milliard de dollars à une valorisation à un chiffre de plusieurs milliards. Bien que cela puisse sembler beaucoup, c’est bien moins que ce dont l’entreprise estime avoir besoin – 5 milliards de dollars au cours des deux prochaines années – pour créer le chatbot envisagé.

Anthropic prétend avoir actuellement des « milliers » de clients et de partenaires, y compris Quora, qui donnent accès à Claude et Claude Instant via son application Poe basée sur l’IA. Claude gère l’outil DuckAssist récemment lancé par DuckDuckGo, qui répond directement aux requêtes de recherche directe des utilisateurs, ainsi que ChatGPT d’OpenAI. Et sur Notion, Claude fait partie du bagage technique de Notion AI, un assistant d’écriture IA intégré à l’espace de travail Notion.