Het bovenstaande is mijn vrije vertaling van het zojuist verschenen boek everybody lies van Seth Stephens-Davidowitz.
Zijn boek beschrijft onderzoeken die hij heeft gedaan aan de hand van vooral datgene wat mensen in Google Search intypen.
Want – zo stelt Davidowitz – mensen liegen een stuk minder als ze zich onbespied wanen, alleen achter hun computer op Internet, dan wanneer ze bijvoorbeeld vragen in een onderzoek invullen. Dan wil de behoefte om politiek correcte of sociaal wenselijke antwoorden te geven nog al eens de overhand hebben.
Wat mij zo inneemt voor Davidowitz is het feit dat deze specialist in Big Data wel zijn enthousiasme voor een goed gebruik van Big Data wil overbrengen zonder een goeroe voor dezelfde Big Data te worden. Hij blijft het hele boek lang het belang van intuïtie, menselijk inzicht en small data benadrukken en waarschuwen voor de gevaren van Big Data, te beginnen met het feit dat het niet draait om zo veel mogelijk data maar om de mogelijkheid de juiste data te gebruiken vooral op gebieden waar de bestaande onderzoeksmethoden duidelijk niet optimaal zijn en veel ruimte voor verbetering toestaan.
De belangrijkste gevaren van menselijke intuïtie benoemt hij ook: wel hebben de neiging het belang van onze eigen ervaring te overdrijven (en wat weet niet zelf hebben meegemaakt, negeren wel, zo waarschuwt Kahneman ons); en wat weinig dramatisch is maakt minder indruk.
Davidowitz waarschuwt ook voor wat hij the curse of dimensionality noemt: Wanneer je met Big Data gaat werken neemt het aantal variabelen exponentieel toe. En het gevaar van te veel variabelen is dat er altijd wel een correlatie te vinden is die we niet met causaliteit moeten verwarren. Helaas de verleiding daartoe is groot.
Davidowitz illustreert dit fenomeen met het verhaal van coin nummer 391. Voor wie hier meer over wil weten: op bladzijde 246 en 247.
Waar Davidowitz ook voor waarschuwt is meetobsessie. Hij doet ons realiseren dat we zelden in precieze cijfers kunnen vangen wat we echt belangrijk vinden. Met multiple choice kunnen we moeilijk meten hoe kritisch iemand kan denken of hoe nieuwsgierig of integer iemand is. En….met wat we veel meten “dwingen” we bedoeld of onbedoeld, bewust of onbewust mensen om veel tijd en aandacht te besteden te besteden aan het goed kunnen wat gemeten gaat worden. Dat gaat dan vervolgens vaak ten koste van datgene wat wellicht veel belangrijker is maar onmeetbaar.
Kortom ook hier is het Engelse gezegde van toepassing: “Don’t put all your eggs in one basket : vergeet niet de Big Data te mengen met menselijke kennis, ervaring en inzicht en…”small data”. Zelfs Facebook is tot dit inzicht gekomen en handelt ernaar.
Davidowitz gaat zelfs zo ver dat hij stelt dat bij een juist gebruik van Big Data sociale wetenschappers wel eens de “harde” wetenschappers van de 21ste eeuw zouden kunnen worden, zeker nu de “harde” wetenschappers in de natuurkunde er maar niet in lijken te slagen relativietstheorie en quantummechanica met elkaar te verenigen. Als voorbeelden van “harde” sociologische feiten die hij uit Big Data heeft weten aan te tonen geeft hij de vraag of films vol geweld zorgen voor toename of afname van geweld of de leeftijd waarop kinderen in de VS “gewonnen worden voor een baseball team.
Davidowitz komt met een interessante verklaring waarom het zo lang heeft geduurd voor psychologie en sociologie hun “harde”, wetenschappelijke kant konden vinden. Hij volgt daarin Marvin Minsky. In wetenschappen als natuurkunde is de kunst het vinden van relatief simpele formules die altijd en overal waar zijn. Psychologie en sociologie bestuderen alles wat te maken heeft met de menselijke brein en wellicht is het zo dat er voor de menselijke brein geen simpele formules te vinden zijn die altijd en overal waar zijn. Een brein is waarschijnlijk een complex systeem waarin continu van alles uitgeprobeerd wordt en het ene deel fouten in het andere corrigeert, hetzelfde geldt waarschijnlijk voor het economische en politieke systeem. Zo een systeem is niet te vangen in een simpele formule, hooguit kun je het langzamerhand beter gaan begrijpen door veel verschillende studies uit te voeren.
Ik ben op zoek naar onderzoekers in Nederland die al met de methoden van Davidowitz werken of geïnteresseerd zijn om dat te gaan doen.