Apple introduceerde, eerder onopvallend, een nieuw open-source Large Language Model (LLM) dat afbeeldingen gebruikt in zoekopdrachten.
In oktober waren op GitHub de eerste signalen zichtbaar van het open-source LLM van Apple genaamd Ferret. Dat trok de aandacht van veel AI-onderzoekers en deed de bal verder rollen. Ferret is een LLM dat afbeeldingen gebruikt voor zoekopdrachten. Dit is niet de eerste nieuwe stap binnen AI voor Apple, maar het bedrijf blijft voor diverse AI-ontwikkelingen onder de radar.
Afbeeldingen als zoekopdracht
Het LLM Ferret van Apple is een multimodaal model dat naar verluidt delen van afbeeldingen als zoekopdrachten gebruikt. Het model kan specifieke gebieden uit een afbeelding onderzoeken, de elementen daarin bepalen die relevant zijn om een antwoord te vormen, om er nadien een kader omheen te tekenen.
Wanneer een gebruiker een afbeelding stuurt naar het model met de vraag wat voor dier het is, kan het LLM dit dier op basis van de afbeelding identificeren. Eventuele bijvragen kunnen ook beantwoord worden op basis van elementen die het model in de afbeelding detecteert.
Open-source model
De lancering van het open-source model kan een positieve impact hebben op Apple. Concurreren met koplopers in AI zoals Microsoft en Google is voor Apple niet evident, aangezien het bedrijf niet beschikt over computerbronnen zoals zijn rivalen. Om toch niet achter te lopen, trekt Apple de kaart van open-source modellen.
Dit is niet de eerste, eerder onopvallende, inspanning van Apple om AI eigen te maken. Recent ontwikkelde Apple een nieuw framework waarmee ontwikkelaars AI-modellen kunnen bouwen op Apple Silicon, en kwam het op de proppen met Apple GPT. Of dit model ervoor zorgt dat Apple een versnelling hoger gaat in de AI-race, moet nog blijken.