Nieuwe methode IBM-MIT traint deep learning-modellen efficiënter

IBM en onderzoekers van het Massachusetts Institute of Technology (MIT) hebben een â€‹â€‹nieuwe methode ontwikkeld voor het efficiënter trainen van deep learning modelen voor videoherkenning.

Een onderzoeksteam onder leiding van Song Han, universitair docent aan de afdeling Elektrotechniek en Computerwetenschappen van het MIT, ontwikkelde een nieuwe techniek. Deze vermindert aanzienlijk de grootte van videoherkenningsmodellen. Hierdoor worden trainingstijden versneld en prestaties op mobiele apparaten verbeterd, aldus Silicon Angle.

Toegankelijkheid

“Ons doel is om artificiële intelligentie (AI) toegankelijk te maken voor iedereen met een apparaat met laag vermogen. Om dat te doen, moeten we efficiënte AI-modellen ontwerpen, die minder energie gebruiken en soepel kunnen werken op geavanceerde apparaten waar veel AI in beweging is”, zegt Han.

Deep learning is een tak van machine learning die probeert na te bootsen hoe het menselijk brein problemen oplost. Deze innovatieve techniek leidde inmiddels al tot grote doorbraken op gebieden als taalvertaling en beeld- en stemherkenning. Voor wat betreft videoherkenning mag je stellen dat dit vergelijkbaar is met beeldclassificatie. Het deep learning-model probeert in feite te identificeren wat gaande is in een video, inclusief de aanwezige objecten, mensen en acties die plaatsvinden.

Videoherkenning en beeldclassificatie

Het belangrijkste verschil tussen videoherkenning en beeldclassificatie is dat video’s meer bewegende delen hebben dan een eenvoudig, statisch beeld. Met voldoende voorbeelden kunnen modellen voor videoherkenning leren mensen, objecten en hun onderlinge relatie te herkennen. Classificatiemodellen voor afbeeldingen werken door te zoeken naar patronen in de pixels van een afbeelding, om zo een â€‹â€‹weergave op te bouwen van wat ze zien.

Het trainen van deep learning-modellen voor videoherkenning kost dus veel meer tijd en moeite. De onderzoekers schatten dat het trainen van een videoherkenningsmodel tot 50 keer meer gegevens en acht keer meer verwerkingskracht kost, dan het trainen van een beeldclassificatiemodel.

Temporal shift module

Han en zijn team ontworpen iets wat ze een temporal shift module noemen. Dit module verplaatst de functiekaarten van een geselecteerd videoframe naar de aangrenzende frames. Door ruimtelijke representaties van verleden, heden en toekomst te vermengen, krijgt het model een gevoel van voorbijgaande tijd zonder het expliciet weer te geven.

Het ontwikkelde model kan drie keer sneller worden getraind dan bestaande modellen op de zogeheten Something-Something-videodataset. Dat is een verzameling dicht gelabelde videoclips, die laten zien dat mensen vooraf gedefinieerde basisacties uitvoeren met alledaagse objecten.

Bovendien begrijpt het model bewegingen van mensen in realtime en is het extreem energiezuinig. Zo kon een single-board computer gelinkt aan een videocamera worden gebruikt om direct handgebaren te classificeren.

Lokaal gebruik AI-applicaties

IBM en MIT beweren dat hun nieuwe videoherkenningsmodel op veel verschillende gebieden nuttig kan zijn. Zo kan het bijvoorbeeld worden gebruikt om catalogusvideo’s op YouTube of een vergelijkbare service sneller te helpen.

Bovendien stelt het model ziekenhuizen in staat AI-applicaties lokaal te gebruiken in plaats van in de cloud, waardoor veiligheid gewaarborgd blijft voor vertrouwelijke gegevens.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Nieuwe methode IBM-MIT traint deep learning-modellen efficiënter

Toegankelijkheid

Videoherkenning en beeldclassificatie

Temporal shift module

Lokaal gebruik AI-applicaties

gerelateerd nieuws

nieuwsbrief