OpenAI lanceert partnerproject voor nieuwe trainingsdata

openai

AI heeft data nodig om te trainen, veel data. Daarom begint OpenAI met een nieuw project waarbij het bedrijf wil samenwerken met organisaties om toegang te krijgen tot veel meer gegevens om zijn modellen te trainen.

Het Amerikaanse bedrijf OpenAI heeft heel wat gegevens nodig om zijn modellen te trainen. Nieuwe data is ook belangrijk om die trainingsinformatie een beetje actueel te houden. Het is niet altijd eenvoudig om voldoende gegevens te vinden die OpenAI mag gebruiken, onder andere door verstrengde regels. Daarom lanceert het bedrijf nu het partnerproject OpenAI Data Partnerships om daarvoor samen te werken met verschillende organisaties.

It’s all about the data

Met dit project heeft OpenAI zowel publieke als private data op het oog. Het bedrijf benadrukt dat het de artificial general intelligence (AGI) van zijn modellen zo veilig mogelijk wil ontwikkelen. Daarvoor moeten die alle trainingsdata zo goed mogelijk begrijpen en dat vergt zo divers mogelijke gegevens.

Er lopen al een aantal samenwerkingen. Zo heeft OpenAI enkele IJslandse partners om GPT-4 beter te laten werken in het IJslands.

lees ook

Microsoft blokkeerde ChatGPT tijdelijk voor eigen werknemers

Op het verlanglijstje van OpenAI staan vooral data die het bedrijf zelf omschrijft als ‘sets die de menselijke maatschappij weergeven en die niet zomaar publiek online beschikbaar zijn’. In welke vorm die gegevens worden gedeeld, dat doet er minder toe. Het bedrijf heeft de middelen om de meeste formaten om te zetten in iets bruikbaars.

Hoewel dat in de toekomst nog kan uitbreiden, zijn er nu twee manieren om in OpenAI Data Partnerships te stappen:

  • Met opensource archieven
  • Delen van private datasets

Intussen zit OpenAI natuurlijk niet stil. De nieuwste versie van GPT-4 kan in één enkel gesprek nu bijvoorbeeld multitasken dat het geen naam heeft.

nieuwsbrief

Abonneer je gratis op ITdaily !

  • This field is for validation purposes and should be left unchanged.