AI-startupen Mistral har bekräftat läckan av en språkmodell som är jämförbar i kraft med GPT-4

Av: Bohdan Kaminskyi | Uppdaterad 01.02.2024, 20:48

Den franska AI-startupen Mistral har erkänt att en av deras kunder av misstag publicerade en kraftfull språkmodell med öppen källkod kallad "miqu-1-70b" online. Enligt vissa uppskattningar överträffar denna modell de kostnadsfria modellerna och kommer nära OpenAI:s kommersiella GPT-4.

Det här är vad vi vet

Den 28 januari dök modellen upp på HuggingFace-plattformen och sedan på 4chan imageboard. Mistrals medgrundare Arthur Mensch bekräftade dess äkthet.

Enligt honom är modellen en gammal utveckling av företaget, som omskolades på Llama 2 och distribuerades till vissa kunder. En av dem, "alltför entusiastisk" över tekniken, publicerade dock filerna på HuggingFace.

Mensch klargjorde också att Mistral har gjort betydande framsteg inom utvecklingen av språkmodeller sedan miqu-1-70b släpptes och snart kommer att tillkännage något mer kraftfullt. Experter spekulerar i att vi skulle kunna tala om en fullfjädrad open source-analog till GPT-4.

En överentusiastisk anställd hos en av våra kunder med tidig tillgång läckte en kvantifierad (och vattenmärkt) version av en gammal modell som vi tränat och distribuerat ganska öppet.

För att snabbt börja arbeta med några utvalda kunder, tränade vi om denna modell från Llama 2 så fort vi fick...
- Arthur Mensch (@arthurmensch) 31 januari 2024

Framväxten av en gratismodell av den här kalibern har potential att i grunden förändra landskapet för generativ AI. Det kommer att sätta stor press på OpenAI:s affärsmodell, som bygger på betalda prenumerationer för tillgång till GPT-3 och GPT-4.

Källa: VentureBeat: VentureBeat

Artificiell intelligens