Microsoft introduceert drie nieuwe Phi-3.5-modellen

Microsoft maakt drie nieuwe Phi-3.5-modellen beschikbaar op Hugging Face voor ontwikkelaars. De modellen scoren opvallend in de benchmarks naast enkele grote AI-bedrijven.

Microsoft introduceert drie nieuwe Phi-3.5-modellen: Phi-3.5-vision, Phi-3.5-MoE en Phi-3.5-mini. Phi-3.5-mini is geschikt voor veeleisende redeneertaken zoals het samenvatten van lange vergaderingen, terwijl Phi-3.5 Vision dan weer zowel teksten als beelden kan genereren. Het derde model, Phi-3.5-MoE, maakt gebruik van de Mixture of Experts-techniek die in de benchmarks zijn diensten bewijst. Binnen deze techniek worden er meerdere modellen toegevoegd die elk gespecialiseerd zijn in een bepaalde taak.

Ontwikkelaars kunnen elk van deze drie modellen nu downloaden via Hugging Face, onder een MIT-licentie van Microsoft. Alle drie de modellen komen met opvallende state-of-the-art-prestaties in enkele benchmarks. Hier verslaan ze andere AI-giganten waaronder Google’s Gemini 1.5 Flash, Meta’s Llama 3.1 8B en soms zelfs OpenAI’s GPT-4o.

How the hell Phi-3.5 is even possible?

Phi-3.5-3.8B (Mini) somehow beats LLaMA-3.1-8B..
(trained only on 3.4T tokens)

Phi-3.5-16×3.8B (MoE) somehow beats Gemini-Flash
(trained only on 4.9T tokens)

Phi-3.5-V-4.2B (Vision) somehow beats GPT-4o
(trained on 500B tokens)

how? lol pic.twitter.com/97gmx1CsQs
— Yam Peleg (@Yampeleg) August 20, 2024

Phi-3.5 modellen

Microsoft maakte de nieuwe Phi-3.5-modellen beschikbaar op Hugging Face. Phi-3.5-mini is een lichtgewicht AI-model met 3,8 miljard parameters en ondersteunt een tokenlengte van 128.000. Het model is geschikt voor omgevingen met geheugen- of computerbeperkingen, die sterke redeneermogelijkheden vereisen. Het model is ideaal om bijvoorbeeld lange documenten of vergaderingen samen te vatten.

De Phi-3.5 Vision is een geavanceerd multimodaal model dat tekst en beeldverwerkingsmogelijkheden combineert. Het is ontworpen voor taken zoals diagram- en tabelbegrip, videosamenvatting of beeldbegrip. Net als de andere Phi-3.5-modellen ondersteunt het een tokenlengte van 128.000. Microsoft benadrukt wel dat dit model getraind is met een combinatie van synthetische en gefilterde, openbare beschikbare datasets.

Mixture of Experts

Het laatste model Phi-3.5-MoE maakt gebruik van de Mixture of Experts-methode, waarbij een model meerdere verschillende modeltypen in één combineert, die elke gespecialiseerd zijn in verschillende taken. Het is het eerste model in de reeks dat deze techniek toepast, en het bewijst meteen zijn diensten in de benchmarks. Het model maakt gebruik van 42 miljard parameters en ondersteunt een tokenlengte van 128.000. Hierdoor is het geschikt voor diverse veeleisende toepassingen.

Ontwikkelaars kunnen elk van deze drie modellen nu downloaden via Hugging Face, onder een MIT-licentie van Microsoft.

poll

"*" indicates required fields

vacatures

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Phi-3.5 modellen

Mixture of Experts

nieuwsbrief