Amazon Comprehend scant nu ook Word- en PDF-bestanden

Amazon Comprehend is een natural-language processing (NLP)-service die machine learning gebruikt om details uit teksten te begrijpen. De service was eerder niet in staat om tekstbestanden met een specifieke opmaak te lezen, maar daar heeft AWS verandering in gebracht. Vanaf nu kan je ook Word- en PDF-bestanden toevoegen.

AWS lanceert nieuwe functies in zijn Amazon Comprehend-service waardoor teksten met specifieke lay-out ook ingelezen kunnen worden, zoals Word- en PDF-bestanden.

Informatie herkennen en categoriseren

Dankzij de nieuwe tools kan de dienst persoonlijke informatie, specifieke entiteiten zoals merknamen, locaties of bedragen (entity extraction) en subjectieve info (sentiment analysis of emotion AI) uit de tekst halen. Daarnaast worden documenten ook in bepaalde categorieën opgedeeld.

Op die manier is het voor lezers mogelijk om inzichten uit ongestructureerde documenten zoals e-mails of social media-feeds te halen.

Comprehend Custom

Comprehend Custom zal naar eigen zeggen entity extraction en de classificatie van documenten die zakelijk of domeinspecifiek zijn, op maat uitvoeren. Volgens AWS gaven klanten het voorbereiden van documenten zonder opmaak namelijk aan als pijnpunt van de service.

Vanaf nu verlies je echter geen tijd meer met het converteren van tekstbestanden. Amazon Comprehend onderscheidt makkelijk specifieke entiteiten en is in staat om compact geschreven tekst en lijstjes te scannen. Denk hierbij aan de uitgebreide opmaakopties die je kan toevoegen aan Word- en PDF-bestanden.

Restricties

Toch zijn er enkele restricties. Je kan namelijk niet maar één document scannen. De dienst start pas met het begrijpen van een bepaalde lay-out wanneer 250 documenten en 100 aantekeningen de revue passeren. De service doet ook beroep op Amazon Textract om specifieke entiteiten te herkennen, waardoor je voor beide diensten betaalt.

In een blogpost geven Anant Patel en Andrea Morton-Youmans van AWS aan dat deze nieuwe functies een pluspunt zijn voor het verwerken van documenten in verticale markten zoals verzekeringen, hypotheken en financiën. “De complexiteit van deze documenten maakt het namelijk moeilijk om er exact uit te halen wat je nodig hebt.”

Andere voordelen

Er zijn nog andere voordelen aan de update verbonden. Denk maar aan het inzetten van machine learning om specifieke entiteiten uit teksten te halen, door maar één model en API-verzoeken te gebruiken.

“Specifieke informatie uit documenten kan van groot belang zijn voor bedrijven. Dankzij AI kan het proces van extractie nu geautomatiseerd worden. Zo gaat de productiviteit omhoog en krijgen klanten sneller antwoord”, voegt Morton-Youmans er nog aan toe in een andere blogpost.

nieuwsbrief

Abonneer je gratis op ITdaily !
  • This field is for validation purposes and should be left unchanged.
terug naar home