Friday, March 20, 2020

ITL #7 - Knowing a Language Part 4: Sentences and Nonsentences

In eerdere blogs hebben we gekeken naar de onderdelen en eigenschappen van een taal die je kent als je de taal beheerst. Dat zijn dus de klanken, de woorden en het gegeven dat deze met een beetje menselijke creativiteit gecombineerd kunnen worden om een oneindig aantal nieuwe zinnen te vormen. Maar als je de taal kent, ben je je ook bewust van welke zinnen mogelijk zijn en welke niet.

Kijk maar eens naar de volgende zinnen. Ze zijn allemaal gebaseerd op een eerdere blogpost. Een aantal van deze zinnen zijn rechtstreeks gecopy-pastet (yup, dat is blijkbaar hoe je het schrijft) vanuit de oorspronkelijke tekst. De rest van de zinnen is gevormd door een Markov Chain text generator.
- Ging het in een vervolg op lijken ze in Google geplukt en toch wat onderscheid weet.
- Elke taal bezig bent sommigen ook correct is het niet herkennen wanneer iemand de zinnen en.
- Over te begrijpen waar het monsterlijke resultaat de woorden snel vaak zijn vrij simpel andere meer.
- Luister hier naar het monsterlijke resultaat.
- Taal dus wil ik bedoel de zinnen in dat vooral de juiste klank van Google Translate.
- Aantal klanken tenminste je detect language als een leuk nieuw woord ook correct is voor sommigen.
- Als je ‘Detect language’ klikt, klinkt het nog verbazingwekkend goed.
- Heeft vandaag gaan we snel vaak dan lig je in Google de nieuwbedachte woorden snel genoeg.
- Vaak zijn het dan ook juist de nieuwbedachte woorden die ‘woord van het jaar’ worden.
Als het goed is, heb je een vrij helder idee van welke zinnen ‘kloppen’ en welke niet. Maar hoe werkt dat dan? Waarom zeggen we dat sommige van deze zinnen niet mogelijk zijn en anderen wel?

We weten dat een zin oneindig veel woorden kan hebben (zie #7 - Knowing a Language Part 3: Creativity) en dat het aantal mogelijke zinnen oneindig is. En hoe slim je ook bent, je hersenen hebben hun beperkingen. Je zou dus nooit een soort database kunnen hebben van alle mogelijke zinnen. Bovendien zou je dan ook niet kunnen bepalen of een nieuwe zin, die je nog niet eerder gezien hebt, goed is. Blijkbaar zijn er dus bepaalde regels voor het vormen van zinnen die ons in staat stellen om nieuwe zinnen te vormen en te interpreteren. Deze regels moet je al op jonge leeftijd leren. Gelukkig is het leerproces grotendeels onbewust en gaat het dus eigenlijk automatisch!

Ten slotte nog een leuk voorbeeld van mijn 3-jarige zoontje die zichzelf midden in dit leerproces hardop verbetert (wij zeiden verder niets):
I want to not wait until the sun is up.
I wanna not wait until the sun is up.
I don’t want to wait until the sun is up.
Ik: "Heeey, well done!"

No comments: