Goeiemorgen zei Robocop, en hij ging aan tafel zitten

Heb je Siri of Alexa wel eens om een verkeersinformatie gevraagd voor je ochtendlijke woon-werkverkeer en je verbaasd over zowel de nauwkeurigheid van het antwoord als over de welbespraaktheid waarmee het werd gegeven? Dankzij de kracht van natuurlijke taalverwerking (NLP) en automatische spraakherkenning (ASR) kunnen deze digitale assistenten je vraag analyseren en begrijpen, je bedoeling ontcijferen, een antwoord genereren, en dat aan je bezorgen. Nu kun je vertragingen vermijden en je dag op koers houden.

Digitale assistenten zijn maar één alledaagse toepassing van NLP, een technologie die de manier verandert waarop mensen met machines communiceren. In dit artikel duiken we in de boeiende wereld van NLP, met uitleg over wat het is, hoe het werkt, en hoe het het meest gebruikt wordt. Laten we er eens induiken.

Wat is Natuurlijke taalverwerking (NLP)?

Natuurlijke taalverwerking (NLP) is een deelverzameling van kunstmatige intelligentie (AI) die computers het vermogen geeft om menselijke taal zoals die gesproken en geschreven wordt te lezen en te begrijpen. Door de gecombineerde kracht van computerwetenschap en taalkunde aan te wenden, kunnen wetenschappers systemen creëren die in staat zijn betekenis uit tekst en spraak te verwerken, te analyseren en te extraheren.

Aangedreven door machinaal leren en verfijnde diep-lerende algoritmen, hebben deze systemen talloze toepassingen in de echte wereld, van automatische tekstvertaling tot spraakgestuurde GPS technologie en chatbots voor de klantenservice.

Geloof het of niet, NLP bestaat al sinds het begin van de jaren 1950, toen Georgetown University en IBM voor het eerst een poging deden om meer dan 60 Russische zinnen volledig automatisch, door een machine gegenereerd, naar het Engels te vertalen. NLP heeft in de decennia daarna een lange weg afgelegd. Dankzij moderne rekenkracht, vooruitgang in de gegevenswetenschap, en toegang tot grote hoeveelheden gegevens, worden NLP modellen met de dag nauwkeuriger. In feite is NLP technologie zo wijdverbreid in de moderne maatschappij dat we ze vaak als vanzelfsprekend beschouwen. Maar als je verder kijkt dan digitale assistenten en e-mail filters, is het een opmerkelijke wetenschap – en een opmerkelijk ingewikkelde ook.

Hoe werkt natuurlijke taalverwerking?

NLP wordt aangedreven door machinaal leren dat spraak- en tekstgegevens verwerkt net zoals het dat met elke andere soort gegevens zou doen. Deze systemen voor machinaal leren worden gevoed met uren en uren van trainingsgegevens, zodat ze automatisch verschillende stukken spraak of tekst kunnen extraheren, classificeren en labelen, om voorspellingen te doen over wat daarna komt. Hoe meer gegevens deze NLP algoritmen ontvangen, hoe nauwkeuriger hun analyse en output zal zijn.

In het algemeen scheiden NLP taken taal in kortere, fundamentele stukken. Basistaken zijn o.a.:

Tokenization

Tokenisatie is de eerste stap in natuurlijke taalverwerking. Het houdt in dat een reeks woorden wordt opgedeeld in kleinere eenheden die “tokens” worden genoemd.

Hier is een voorbeeld: Ik hou echt van dit liedje! = “Ik” “hou” “echt” “van” “dit” “liedje” “!”

Part-of-Speech Tagging

Part-of-speech tagging is het proces waarbij aan elk token een part-of-speech categorie (zelfstandig naamwoord, werkwoord, bijvoeglijk naamwoord, voegwoord, enz.) wordt toegekend.

Het uitsplitsen van de zin en het toekennen van een tag helpt de machine de relaties tussen afzonderlijke woorden te begrijpen en stelt haar in staat aannames te doen over de semantiek.

Het lijkt me wel wat, een robot die weet waarover je het hebt, wie weet is onze Telefoonbeantwoording binnenkort volledig op AI overgeschakeld!

Fijne werkdag!
Florentijn van den Bos – ADD::Flex4you
Chief Flexwork Officer

Terug naar overzicht

Geplaatst op: 28 april 2022