Analyses met Big Data zetten je makkelijk op het verkeerde been. Dat concluderen wetenschappers na het afserveren van één van de 'showcases' van Big Data: het grieponderzoek van Google. Uitgangspunt van Googles Flu Trends is dat er een correlatie bestaat tussen het aantal zoekopdrachten met griepgerelateerde termen en het aantal personen dat griep heeft. Daardoor kan Google een actueler beeld geven van de verspreiding van griep, en ook inzicht geven in het aantal mensen dat griep heeft in landen waar geen goede registratie bestaat. Dat is althans de claim.
Een viertal wetenschappers heeft die claim aan een nadere analyse onderworpen. De conclusie, Google Flu Trends zat er in de Verenigde Staten zowel in de griepseizoenen 2011-2012 als in 2012-2013 behoorlijk naast. In 100 van de 108 weken overschatte de analyse van Google het feitelijke aantal griepgevallen op enig moment zelfs bijna met een factor 2.
...Het beste tegengif tegen de missers die daaruit kunnen ontstaan is, Big Data te combineren met traditionele vormen van informatieverzameling en -analyse met kleinere datasets, zeggen de wetenschappers.
Alles bij de bron; AutomGids