blog

Het belang van juiste data

Home

Veel onderzoek gebeurt op basis van zogenaamde secundaire data. Dat wil zeggen, data die niet door de onderzoekers zelf verzameld worden, maar ontleend zijn aan een database. Diverse organisaties leggen zulke databases aan (denk aan CBS, branche-organisaties en sommige adviesbureaus). Soms worden de data ook verkocht.

Artikel oorspronkelijk gepubliceerd in Logistiek op 23 januari 2009.

Een paar jaar geleden werd ik geprikkeld door een wetenschappelijk artikel waarin de prestaties van verschillende containerterminals onderling werd vergeleken. Helaas scoorde Rotterdam (ECT) minder dan verschillende terminals in Antwerpen.

Bij verdere bestudering van de literatuur bleek er een zee te zijn aan wetenschappelijke artikelen, waarin containerterminals werden gebenchmarkt.
 

Echter, de onderlinge rangorde van de terminals was in elk artikel weer anders. Bij nader onderzoek bleken alle onderzoekers gebruik te maken van drie commerciële databases, waarvan de data onderling grote tegenstrijdigheden vertoonden. Verschillen waren soms enorm, in de orde van honderden procenten. De fouten bleken meerdere oorzaken te hebben: typefouten, maar ook gebrek aan interesse bij de dataverstrekkers. 
 

Helaas zijn benchmarkresultaten veelal sterk gevoelig voor onnauwkeurigheden in de data. Het zal dus niet verbazen, dat de conclusies van de meeste artikelen rechtstreeks de prullenbak in konden. De referenten hadden dit punt blijkbaar gemist. Ik ben daarom bij de presentatie van onderzoek, gebaseerd op statistieken, geneigd sceptisch te zijn zolang niet precies duidelijk gemaakt is hoe de data verkregen zijn.

We hebben overigens het bench–markonderzoek overgedaan met primaire data en die op meerdere manieren gevalideerd. Daarbij bleken beide grote Rotterdamse terminals (APM en ECT) beter te scoren dan twee grote Antwerpse terminals.

Reageer op dit artikel