Mistral lanceert Large 2 met verbeterde codeerkennis

mistral ai

Mistal kondigt zijn grootste LLM tot nu toe aan. Mistral Large 2 heeft zijn codeerkennis aangescherpt en kent tot 80 programmeertalen.

De competitie tussen AI-modellen wordt weer flink aangescherpt. Na gisteren Meta is het vandaag de beurt aan Mistral om zijn nieuwste paradepaardje voor te stellen. Met 123 miljard parameters is Mistral Large 2 het grootste LLM dat tot nu toe uit de stal van het Franse bedrijf is voortgekomen.

Het aantal parameters ligt nog steeds aanzienlijk lager dan andere gekende LLM’s. Het gisteren door Meta voorgestelde LLama 3.1 heeft een versie van bijvoorbeeld 405 miljard parameter. Mistral Large 2 past wel perfect op één Nvidia H100, leren we uit een post op X.

Groot, maar niet de grootste

Het aantal parameters van een model zegt veel, maar ook niet alles over de vaardigheden van het model. Mistral wil dat aantonen met benchmarks die het model afzetten tegen Llama 3.1, GPT-4o en Claude Sonnet 3.5 (Google Gemini mag niet meespelen). Mistral Large 2 kan tot evenveel tokens verwerken als het model van Meta, maximaal 128.000 in één prompt.

lees ook

Mistral AI lanceert Codestral: zijn eerste generatieve AI-model voor codering

Mistral Large 2 heeft grote vooruitgang geboekt in het coderen, beschrijft het bedrijf in een blog. Het eerste Mistral Large-model bleek geen krak te zijn, maar de tweede versie is tot tachtig talen machtig, al verwerkt het de ene programmeertaal natuurlijk beter dan de andere. Mistral claimt dat zijn model de expert in Java is.

mistral large 2 coderen
De codeerbenchmarks van Mistral Large 2. Bron: Mistral

Verder benadrukt Mistral de talenknobbel van Large 2. Het model spreekt onder meer Engels, Frans, Duits, Spaans, Portugees, Italiaans, Arabisch en Koreaans. Over Nederlands wordt niet gesproken. Wat Mistral Large 2 niet heeft, is multimodale capaciteiten waarmee het simultaan beeld en tekst kan verwerken. Dat lijkt de specialisatie van OpenAI te zijn.

Open voor onderzoek

Mistral Large 2 is net zoals Llama 3.1 in essentie opensource, maar is niet voor iedereen vrij te downloaden. Onderzoekers kunnen bij het bedrijf een gratis licentie aanvragen, maar wie het model voor commerciële doeleinden wil inzetten, zal wel een vergoeding moeten betalen. Het model is beschikbaar via Google Vertex, AWS BedRock, Azure AI Studio, IBM watson.x en voor het grote publiek via de chatapplicatie Le Chat.

Mistral is een buitenbeentje in de AI-wereld. Het bedrijf is geboren en getogen in Europa en speelt dat Europese karakter ook graag uit om zich te onderscheiden in een sector die gedomineerd wordt door Amerikaanse grootmachten. Die zitten allemaal wel achter Mistral aan. Microsoft leek Mistral aan de haak te slaan, maar dat ziet de Europese Commissie niet zitten.

lees ook

Meta brengt multimodaal Llama 3-model niet naar Europa wegens ‘onvoorspelbare regelgeving’

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.