FYI.

This story is over 5 years old.

IBM's Watson bestrijdt kanker, maakt recepten en leert Japans, maar wat is het?

De 'cognitieve technologie' van Watson verzint recepten, helpt kanker behandelen en wordt geïntegreerd in speelgoed. Maar wat de fuck is het?
2.7.15

Toen IBM's computerprogramma Watson in 2011 tijdens Amerikaanse televisieprogramma Jeopardy! van de andere kandidaten won, verbaasde dat de wereld. Een computer die de – soms zeer cryptische en meestal best moeilijke – vragen kon begrijpen en ook nog eens goed beantwoorden, was een ongelofelijk staaltje computertechnologie.

IBM en verbluffende computertechnologie zijn historisch gezien geen vreemden van elkaar. In 1997 versloeg IBM's schaakcomputer Deep Blue tot grote verbazing van de wereld de grootmeester Garry Kasparov. Maar daarna bleef het lang stil rond revolutionaire staaltjes computeren bij het bedrijf. Tot 2004, toen Charles Lickel, researchmanager bij IBM in het programma Jeopardy! een nieuwe uitdaging zag.

Vanaf 2005 werkten computerwetenschappers aan het verfijnen van Watson, tot in februari 2011 het televisieprogramma werd uitgezonden. Watson vermorzelde zijn twee tegenstanders, beiden voormalig winnaars van het programma. Het was IBM weer gelukt om de wereld te verbazen over de mogelijkheden van computers.

Vier jaar later is Watson verbeterd en uitgebreid, om nu ook recepten te maken, te helpen bij kankerbehandeling en klantenservice, en is de kunstmatige intelligentie van Watson zelfs geïntegreerd in kinderspeelgoed.

Maar wat is Watson precies? Is het een soort turbocomputer die alle kennis op aarde verzamelt om mensen voorbij te streven? Hoe kan eenzelfde programma nu helpen bij kankerbehandeling én menselijke spelers verslaan in domme televisieprogramma's? Alle nieuwe, spannende ontwikkelingen komen toch van startups en niet van logge miljardencorporaties? Om deze vragen beantwoord te krijgen ging ik langs bij de beige blokkendoos waarin het hoofdkantoor van IBM Nederland huist, om te praten met Nicky Hekster, 'Watson-ambassadeur.'

De wachtruimte van IBM reflecteert het beeld van wat ik van het bedrijf had, nu ze Watson hadden gemaakt: een vaalbeige jaren-zeventigruimte, met daarin een paar strakwitte touchscreendemonstraties van ICT-producten die als een oude, logge steenkolencentrale met hypermoderne windturbines bij de receptie stonden.

In een bruine meetingroom vertelt Hekster dat "Watson is ontwikkeld om de explosief toenemende hoeveelheid data het hoofd te bieden, vooral de grote hoeveelheid ongestructureerde data – tweets, foto's, video's – die alleen maar toeneemt."

Computers zijn namelijk altijd al best goed geweest met het verwerken van gestructureerde data zoals spreadsheets, berekeningen en datasets, maar ongestructureerde data zoals natuurlijke taal, is altijd een uitdaging geweest. Het was IBM's doel om een algoritme te ontwikkelen dat niet alleen al die ongestructureerde data kan begrijpen, maar ook inzichtelijk kan maken voor mensen. Om dat voor elkaar te krijgen, moest het algoritme een zeer diepgaand begrip hebben van vragen – zowel het stellen als het antwoorden ervan.

Watson is een zogenaamd 'question answering' (QA) systeem, waarbij het begrip van de vraag een sleutelrol speelt. Aan de hand van dit begrip kan het systeem namelijk hypotheses gaan opstellen over een antwoord, en vervolgens in de data kijken of deze hypotheses vanuit verschillende kanten ondersteund worden. Hiervoor kan het systeem ook wedervragen opstellen aan de oorspronkelijke vragensteller. De hypothese die overblijft en ondersteund wordt door het meeste bewijs, vormt uiteindelijk het antwoord.

Dit systeem lijkt heel erg op hoe wij mensen ook denken, alleen kan Watson ook nog met data werken waar het menselijke brein slecht in is, zoals jaren aan tweets of enorme spreadsheets aan getallen. Dit is bijvoorbeeld handig voor oncologen. Wanneer een dokter de symptomen van een patiënt opnoemt kan Watson alle data van alle onderzoeken naar een specifiek soort kanker doorspitten, inclusief alle nieuwe onderzoeken die de dokter wellicht nog niet gelezen heeft. Door een paar wedervragen te stellen, kan Watson vervolgens een behandeling die bij andere patiënten bleek te werken, voorstellen, en zijn keuze onderbouwen met bewijsmateriaal uit de literatuur.

Dit lijkt allemaal heel erg op hoe Skynet werkt, maar het is niet hetzelfde. Watson is geen supercomputer die zijn informatie en data op aanvraag van het internet plukt. Het is niet dezelfde entiteit, die gestoorde recepten verzint en helpt tegen kanker. Het zijn allemaal verschillende Watsons.

Stel: ik ben directeur van een ziekenhuis, en ik wil graag mijn oncologen helpen met behulp van advies van een supercomputer, dan kan ik mijn eigen Watson-entiteit laten aanmaken bij IBM. Deze persoonlijke Watson moet ik vervolgens data voeren, zoals medische journals, radiologische beelden, (anonieme) patiëntendata die door de jaren heen verzameld is en behandelingen die gegeven zijn. De Watson wordt vervolgens getraind door doktoren om die data allemaal een plekje en een relatie tot elkaar te geven en daar weer zinnige conclusies uit te trekken. Iedere Watson is dus een taak-specifieke, vraag-beantwoordende instantie, die niet in verbinding staat met andere Watsons of het web.

Teleurstellend genoeg doet Watson ook niet zelf ontdekkingen. De technologie beantwoordt alleen vragen. Het is dus niet zo dat als het algoritme bij het doorspitten van data een verband vindt dat daarvoor onbekend was, deze zal opperen, tenzij iemand Watson actief vraagt of het verband bestaat. Er is dus een wezenlijk verschil tussen Watson en bijvoorbeeld het zelflerende algoritme dat ontdekte hoe een platworm blijft leven als deze doormidden gesneden wordt [link]. "Watson doet niets ongevraagd," benadrukt Hekster.

Mensen hebben altijd gezocht naar manieren om data beter te ordenen waarmee begrip en conclusies aan elkaar kunnen worden verbonden. Maar nu we naar een wereld toegaan waarin de hoeveelheid data niet meer door mensen te ordenen is, en voor mensen niet meer te bevatten wordt, is het nodig om slimmere manieren te hebben om dat te doen. Programma's als Watson geven niet alleen de mogelijkheid om verschillende soorten data samen te brengen, maar ook om op een menselijke manier vragen erover te stellen. Toch is er bij Watson nog een flink nadeel: als je niet weet wát je moet vragen, kan het programma je geen antwoorden geven. Tot dat opgelost is, blijft de onmetelijke kennis die te halen is uit big data beperkt door één factor: de sukkelige mens.