blog

Big Data: ‘veul data’ en nerds vereist

Supply chain

Big Data is het nieuwe toverwoord en om teleurstellingen te voorkomen, geef ik een bijsluiter. Het lijkt allemaal zo mooi en dat is het vaak ook. Maar onoordeelkundig gebruik leidt ook hier weer tot grote teleurstellingen. Ik geef een aantal cases ‘ter lering ende vermaeck’. Big Data zijn eigenlijk ‘veul data’ en daarom neem ik de lezer mee naar het begin van de jaren 80 naar Veghel.

Big Data: ‘veul data’ en nerds vereist

Casus 1 De Mars-case

In Veghel studeerde ik bij Mars, met als onderwerp:  forecasting om de capaciteit van de chocolade machines en verpakkingsmachines zo optimaal mogelijk te benutten. Mars beschikte over een schat aan verkoopdata (heeel veul data) en dat stelde mij met de Operations Research afdeling in staat een afgrijselijk ingewikkeld forecast-model te gebruiken (voor de liefhebbers Box-Jenkins+). Elke week hetzelfde scenario: de nieuwe verkoopdata werden ingeponst (ja, ingeponst), het afgrijselijke model deed zijn werk en produceerde een lap papier van 80 centimeter bij 3 meter. Een lange grafiek met sterretjes, dubbele punten en komma’s omdat presentatie van data toen nog op een laag pitje stond. Vervolgens stonden we met een aantal experts naar het papier kijken waarbij altijd de vraag ‘En nou?’ naar voren kwam en soms de opmerking ‘Kanniewaarzijn’. Na een half uurtje kijken en discussiëren kwamen we tot een voorspelling. Maar dat was zelden: de volgende week gaan we 24.000 dozen Mars-Mini’s verkopen. Het was meer: de kans op minstens 24.000 dozen is zo ongeveer 95,2 procent. Met een ander model vonden we dat er minstens 23.500 dozen verkochte werden met een kans van 94,5 procent. En daar stonden we weer: ‘En nou?’

Casus 2 Veul data en het weer

Een tweede voorbeeld van huidige big data: het voorspellen van het weer. Dat is tegenwoordig echt ‘veul data’, maar het principe is hetzelfde als mijn probleem bij Mars. De getallen gaan in een grote computer, een afgrijselijk model doet zijn werk en er verschijnt iets op het scherm waar weer een aantal experts naar kijkt. En ik kan u verzekeren dat ze ook weer elke keer tegen elkaar zeggen: ‘en nou?’. Vervolgens proberen de Piet Paulusma’s, het KNMI en ik weet niet hoeveel mensen op basis van de uitkomsten iets over het weer te zeggen. Dat kan gigantisch moeilijk zijn gegeven de code rood die geen code rood was of andere zwaar weer waarschuwingen. Helaas geven de pakketten geen eenduidige voorspellingen. Ze zijn een hulpmiddel ter interpretatie voor experts. Degene die wel eens kijken naar het programma Stormchasers kunnen het voor de geest halen: gigantisch veel data maar weinig opnamen van een tornado dichtbij. Wie het beste kan interpreteren, heeft de meest spectaculaire opnamen.

Casus 3 De Formule 1

Het derde voorbeeld: de F1-races. Data over motormanagement en bandenslijtage vormen voor de crew een indicatie wat er gebeuren moet. Op de TV is het mooi te zien: een aantal hoog gekwalificeerde ingenieurs tuurt naar beeldschermen waar ‘veul data’ over heen flitsen. Die data zijn al eerst weer door een afgrijselijk model gehaald maar dan nog. Enkele mensen moeten hier hun ei  over leggen voordat de crew aan de rijder doorgeeft wat hij moet doen. Dan nog kan het fout gaan en staat de rijder een halve ronde voor de pits stil; geen brandstof. En dat is echt niet omdat de crew niet goed opgelet heeft; ik denk dat de interpretatie van de data een bepaalde gok rechtvaardigde.

‘En nou?’

Al deze voorbeelden hebben iets gemeen: data moeten voorhanden zijn, hetgeen over het algemeen in deze moderne tijd geen probleem meer hoeft te zijn. Vervolgens moeten de data door een stuk hoogwaardige software gehaald worden om van de data echte informatie te maken. En hier kan het al fout gaan. Niet vanwege de software, die deze grote aantallen normaliter goed aankan. Maar wát gaan we de software eigenlijk vragen om te doen? En wié gaat dat vragen? In de voorafgaande casussen waren dat een aantal experts maar heeft u die expertise in huis? Iedereen kan tegenwoordig een Ferrari F1 kopen, maar heeft u ook een goede coureur? Anders komt de auto nooit van zijn plaats of door de eerste bocht. En dan het belangrijkste: wie gaat de uitkomsten beoordelen? Het KNMI heeft daar een aantal deskundigen voor in huis, hooggekwalificeerde mensen en bij de F1 staan bij Red Bull misschien wel 100 mensen paraat om de data te analyseren. Hoeveel heeft uw bedrijf er? U heeft expertise nodig, data analisten van het ergste soort. Mensen die hun ziel en zaligheid verkocht hebben om data te mogen analyseren. Oneerbiedig gezegd: u heeft nerds nodig. En ja, in meervoud!

Neem nerds aan

Dus in theorie hebben ‘veul data veul potentie. De data zijn er en de software is er. Nu de mensen nog. Bedenk hierbij dat je beter een Toyota Prius (om maar iets te noemen) met een bestuurder met een rijbewijs kunt hebben, dan een Ferrari en een bestuurder zonder rijbewijs. In het laatste geval gaan de ‘veule data’ zich als een boemerang gedragen en dat zou zó zonde zijn. Dus bedrijfsleven: neem een nerd (m/v) aan. Of nog beter twee. Of drie. Ze zijn het dubbel en dwars waard!


Lees hier meer artikelen over Big Data.

Reageer op dit artikel