Microsoft werkt aan toegewijd LLM voor spreadsheets

Onderzoekers van Microsoft ontwikkelde een nieuw LLM dat gemaakt is om AI beter toe te passen in spreadsheets zoals Excel en Google Sheets.

Onderzoekers van Microsoft publiceerde een onderzoekspaper waarin ze een experimentele LLM voorstellen dat speciaal ontworpen is voor spreadsheets onder de originele naam: SpreadsheetLLM. Bestaande LLM’s zijn niet in staat om de gestructureerde data te begrijpen, ook vanwege de tokenlimiet. Het experimentele SpreadsheetLLM hanteert een nieuw coderingsmechanisme waarbij de inhoud van een spreadsheet in een nieuw format wordt geplaatst dat beter leesbaar is voor het LLM. Het model zit nog in de experimentele fase maar de eerste resultaten zijn positief.

LLM-vriendelijke manier

Spreadsheets worden breed toegepast in de bedrijfswereld: van eenvoudige formules tot complexe financiële modellen. Bestaande LLM’s zijn echter niet in staat om de aard van deze gegevens en complexe formules te begrijpen. Om een oplossing te bieden voor deze uitdaging, ontwikkelde onderzoekers van Microsoft een toegewijd LLM voor spreadsheets.

Om ervoor te zorgen dat LLM’s de gestructureerde aard van de gegevens in spreadsheets beter kunnen begrijpen, bedachten de onderzoekers een nieuw coderingsmechanisme genaamd ‘SheetCompressor’. Data worden bij deze methode op een LLM-vriendelijke manier gecodeerd en tegelijkertijd worden de structuur en relaties van de gegevens behouden.

Naast SheetCompressor belichtten de onderzoekers een ander kenmerk, namelijk ‘structurele ankerextractie’, die de belangrijkste rijen en kolommen identificeert die tabelstructuren definiëren. Verder wordt de ‘inverted-index translation’-methode toegepast die de celinhoud en adressen efficiënt codeert om redundantie te minimaliseren.

Potentieel

Uit de experimenten bleek dat SpreadsheetLLM positieve resultaten behaalde in de spreadsheettabeldetectietest, waarbij de bestaande methoden 12,3 procent beter presteerden. SpreadsheetLLM werd toegepast op verschillende bekende LLM’s, zoals GPT-3.5, GPT-4 en Llama 2. De onderzoekers ontdekten dat het vermogen van deze modellen om spreadsheets te begrijpen werd verbeterd, waarbij GPT-4 een tafeldetectiescore van 78,9 procent behaalde.

Microsoft Copilot: een hulp of een last?

De onderzoekers geloven sterk in het potentieel van dit model, al zijn er momenteel nog beperkingen rond complexere spreadsheetformaten. SpreadsheetLLM zou geautomatiseerde taken kunnen uitvoeren of spreadsheets toegankelijker kunnen maken voor mensen die hier moeilijk mee overweg kunnen.

SpreadsheetLLM is momenteel een onderzoeksproject. Er zijn door Microsoft nog geen plannen bekendgemaakt om dit model de wereld in te sturen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_ga	2 years	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
_gid	1 day	Dit is een basis cookie van Google Analytics, om gebruikers te identificeren op onze website. We gebruiken standaard een gelimiteerde versie van Google Analytics voordat cookies zijn geaccepteerd. Hierbij is data geanonimiseerd en marketingfuncties uitgeschakeld.
cli_user_preference	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
CONSENT	2 years	YouTube plaatst deze cookie via ingesloten YouTube-video's en registreert anonieme statistische gegevens.
cookielawinfo*	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
itdaily_lang	1 year	Deze cookie is nodig om de landnotificatie te verbergen. De landnotificatie wordt getoond als je vanuit een land de website bezoekt, waardoor we ook een specifieke Techzine-editie aanbieden. Die melding kan je verbergen middels deze cookie.
itdaily_theme	1 year	Deze cookie slaat op of je de darkmode of de normale versie wilt inschakelen.
PHPSESSID	1 day	Deze cookie komt vooruit uit standaard PHP-applicaties. De cookie wordt gebruikt om een gebruikerssessie op te slaan en te identiiceren. Het is een sessiecookie die direct wordt gewist bij het sluiten van de browser.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
viewed_cookie_policy	1 year	Deze cookie zorgt ervoor dat onze cookiemelding goed functioneert. Je voorkeuren worden opgeslagen in een cookie, zodat we dat ook weten bij je volgende bezoek.
wordpress_*	30 days	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.
wp-*	1 day	Wordpress gebruikt meerdere cookies om de website goed te laten functioneren, bijvoorbeeld om het redactioneel team te laten inloggen.

Cookie	Duration	Description
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
itdaily_views	1 hour	Dit is een basis cookie om bezoekersaantallen per artikel te berekenen.

Cookie	Duration	Description
__gads	1 year 24 days	De __gads-cookie, ingesteld door Google, wordt opgeslagen onder het DoubleClick-domein en houdt bij hoe vaak gebruikers een advertentie zien, meet het succes van de campagne en berekent de inkomsten. Deze cookie kan alleen worden gelezen vanaf het domein waarop hij is ingesteld en zal geen gegevens traceren tijdens het surfen op andere sites.
_li_id.*	2 years	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
_li_ses.*	30 minutes	Deze cookie wordt gebruikt door het Leadinfo platform, dit wordt gebruikt door ITdaily voor het versturen en opbouwen van de nieuwsbrief en personalisatie diensten.
IDE	1 year 24 days	Google DoubleClick IDE-cookies worden gebruikt om informatie op te slaan over de manier waarop de gebruiker de website gebruikt om hem relevante advertenties te presenteren en volgens het gebruikersprofiel.
test_cookie	15 minutes	De test_cookie wordt ingesteld door doubleclick.net en wordt gebruikt om te bepalen of de browser van de gebruiker cookies ondersteunt.
VISITOR_INFO1_LIVE	5 months 27 days	Een cookie dat door YouTube wordt geplaatst om de bandbreedte te meten en dat bepaalt of de gebruiker de nieuwe of de oude spelersinterface krijgt.
YSC	session	YSC-cookie wordt ingesteld door YouTube en wordt gebruikt om de weergaven van ingesloten video's op YouTube-pagina's bij te houden.

Microsoft werkt aan toegewijd LLM voor spreadsheets

LLM-vriendelijke manier

Potentieel

Microsoft Copilot: een hulp of een last?

gerelateerd nieuws

nieuwsbrief