In de afgelopen decennia gingen maandelijks meer dan 100 interviewers van het CBS op pad om de prijzen van producten in 7 000 winkels te noteren. In de afgelopen jaren zijn die werkzaamheden langzaam afgebouwd. Met ingang van 1 januari 2020 is de handmatige prijswaarneming in de winkels zelfs definitief verleden tijd. Het CBS verzamelt de prijzen nu op een innovatieve manier: met scannerdata en webscrapers. Deze mijlpaal bereikt het CBS als eerste statistische bureau in de eurozone.
Het CBS verzamelt maandelijks prijzen van een groot aantal producten en diensten. Daarmee berekent het de consumentenprijsindex (CPI), een belangrijke indicator van de inflatie. Sinds jaar en dag werden de gegevens daarvoor door het hele land verzameld door de interviewers van het CBS. Zij gingen met een boodschappenlijstje met representatieve producten de winkels in om prijzen te noteren. Dat was een arbeidsintensief proces, dat echter in de afgelopen jaren langzaam werd afgebouwd. Jos van Linden weet er alles van. Ze werkt al 20 jaar als interviewer voor het CBS en bezocht twee decennialang elke maand een aantal winkels. ‘Dat heb ik altijd een leuke klus gevonden. Bij sommige winkels kwam ik zelfs 10 jaar achter elkaar. Dan bouw je wel een band op met de winkeliers.’
Mooie klus
Hoe ging de interviewer te werk? ‘Ik meldde me bij de winkelier en maakte een rondje door de zaak. Ik noteerde doorgaans de prijzen van gemiddeld 20 tot 25 producten. We hebben altijd geprobeerd de winkeliers zo min mogelijk te belasten met ons werk. Zo gingen klanten natuurlijk altijd vóór en zochten we de meest gunstige tijdstippen uit om de winkels te bezoeken, bijvoorbeeld woensdag- of donderdagochtend.’ In de afgelopen jaren zag Van Linden haar werk wel veranderen. ‘We wisten dat steeds meer winkels niet meer bezocht hoefden te worden, omdat het CBS rechtstreeks scannerdata van die winkels kreeg. Dat is een mooie ontwikkeling voor de winkeliers. Ik vind het wel jammer, want het was voor ons als interviewers altijd een mooie klus en respons was gegarandeerd.’
De geschiedenis van de ontwikkeling van het CPI cijfer kunt u in deze video bekijken.
Grote stap
Op 13 december 2019 gingen de interviewers van het CBS voor de allerlaatste keer op stap om de prijzen in de winkels voor de Nederlandse CPI te noteren. Voor het CBS is het stoppen met de handmatige winkelwaarneming een grote stap. Dat de prijzen nu via scannerdata en webscrapers binnengehaald worden, zorgt voor een kwalitatief nóg betere consumentenprijsindex en het bespaart kosten. Ook de lasten voor de winkeliers zijn er nu niet meer. Van Linden: ‘Wat voorlopig wel nog doorgaat, is het in april en november bezoeken van kleding- en meubelzaken, supermarkten, restaurants en cafés in een aantal grote steden om de Europese prijsniveaumeting samen te stellen (een verplichting vanuit het Europese statistiekbureau, red.). Maar ook hier zie je dat het aantal waar te nemen producten afneemt. Maar gelukkig heeft het CBS voldoende andere onderzoeken waarvoor face-to-face interviews nodig blijven, bijvoorbeeld de enquêtes over gezondheid, veranderingen in Nederland, leefstijl, etc.’
Scannerdata en webscrapers
Koen Link, statistisch onderzoeker bij het CBS vertelt dat het statistiekbureau met scannerdata en webscrapers nu alle benodigde informatie over prijzen in de winkels op een efficiënte manier kan binnenhalen. Link: ‘In 2003 nam het CBS de eerste scannerdata van supermarkten in gebruik. Dat zijn kassagegevens met de verkochte aantallen en de omzet per product. Op basis daarvan bepalen we een prijs per barcode. Het gebruik van deze scannerdata is in de afgelopen jaren sterk toegenomen. Daarnaast gebruikt het CBS zogenoemde webscrapers en robottools. We laten computerprogramma’s de informatie die we nodig hebben van de sites van de kledingwinkels halen. Vanaf 1 januari 2020 gebeurt dat ook bij schoenen- en meubelwinkels. Voor zaken als kappers zetten we een robottool in die een signaal geeft als de prijzen op de website veranderen. Ook steeds meer kleinere winkels hebben een website. Naar de enkele winkel die we missen maar toch echt nodig hebben, sturen we een vragenlijst.’
Nieuwe statistische methoden
Om de scanner- en onlinedata goed te verwerken zijn speciale statistische methoden en nieuwe werkwijzen ontwikkeld. Het gebruik van webscrapers levert bijvoorbeeld enorme databestanden op. Het is belangrijk dat de data goed geclassificeerd worden. Link: ‘Bij kleding willen wij een onderscheid kunnen maken tussen jurken, rokken, korte mouwen, lange mouwen et cetera. Dat doet het CBS door gebruik te maken van naamfilters en door te kijken naar namen van productgroepen in plaats van individuele producten. Daardoor kunnen we producten beter in categorieën indelen. Het voordeel van de nieuwe manier van werken is dat een veel nauwkeuriger cijfer ontstaat omdat we nu alle data meenemen en niet alleen een selectie van de artikelen die via een steekproef in het winkelmandje van de interviewers terecht kwamen.’
Ontwikkelen en innoveren
In 2019 werd nog slechts in 420 winkels per maand waargenomen, vooral schoenen- en meubelwinkels en kleinere speciaalzaken. Nu is ook dat dus voorbij. Link: ‘Omdat we de inzet van scannerdata en webscrapers uitbreiden, is de waarneming in winkels helemaal niet meer nodig. We zijn daarmee het eerste statistische bureau in de eurozone dat helemaal stopt met winkelwaarneming. Een mijlpaal. Op den duur willen we dat het indelen van producten in categorieën met machine learning wordt gedaan. Daar zijn we nu mee bezig. We blijven ontwikkelen en innoveren.’
Bron: CBS