Floridata publiceert de export cijfers voor de sierteeltsector. Hierbij borduren wij voort op de cijfers van HBAG. Bij het HBAG was er een aanleverplicht en daarmee nagenoeg 100% van de exportcijfers van bedrijven. Floridata is een initiatief waar op basis van vrijwilligheid aan wordt deelgenomen. Stel dat 50% of 75% van de sector deelneemt in hoeverre zijn we dan in staat om betrouwbare marktcijfers te publiceren? Om dit te kunnen bepalen hebben we de hulp ingeroepen van dr. Marcel Kornelis van de Wageningen UR (University & Research centre).
Kun je kort uitleggen wie je bent en op welk vakgebied je actief bent?
Mijn naam is Marcel Kornelis en ik werk op de WUR, bij het LEI. In Groningen heb ik econometrie gestudeerd. Daarna ben ik in 2002 in de economische wetenschappen gepromoveerd. Mijn proefschrift gaat over een marktresponse-analyse van de Nederlandse reclamemarkt. Na mijn promotie ben ik voor de WUR/LEI gaan werken als marketing modelbouwer, met als expertise marktreponse-analyse. Kort gezegd komt mijn werk erop neer dat ik marktgegevens modelleer (zoals exportcijfers en prijsontwikkelingen) om vervolgens diagnoses over die markt te stellen, en dan met name diagnoses over de aanwezige reactiepatronen. Voorbeelden zijn: hoe hebben Nederlandse adverteerders gereageerd op de komst van commerciële televisie? Hoe hebben consumenten gereageerd op de uitbraak van de BSE crisis? Hoe hebben consumenten gereageerd op de introductie van het ik-kies-bewust logo? Wat is het effect van Maria-Tenhemelopneming voor de snijbloemenexport naar Polen en Oostenrijk? Wat is het effect van de supermarktoorlog op de verkoop van suikervrije yoghurt?
Wanneer je marktreactiepatronen goed kunt inschatten en je een onderscheid kunt maken tussen de korte- en de langetermijneffecten, dan kun je daar in je marktvoorspelling je voordeel mee doen. Ik doe dit werk al meer dan twaalf jaar voor het bedrijfsleven en de overheid, waarbij ik steeds de brug tussen de wetenschap en de praktijk sla.
Hoe heb je dit vraagstuk aangepakt?
Op het moment dat ik werd gevraagd, was de deelname aan Floridata 70% van de exportcijfers van bedrijven (inmiddels ligt dit getal alweer wat hoger). De historische gegevens van de HBAG database stelde me in staat om de dynamiek in de loop van de tijd van de 100% te vergelijken met de 70% en de resterende 30% (want Floridata weet welke bedrijven meedoen en welke niet). Ik kon dus, zeg maar, drie exportreeksen modelleren (100%, 70% en 30% van de markt).. Vervolgens konden twee operationele vragen gesteld worden: (i) hoe betrouwbaar is een voorspelling voor de gehele markt (100%) op basis van de historische gegevens van die gehele markt (100%-exportreeks) en (ii) hoe betrouwbaar is een voorspelling voor de gehele markt op basis van 70% en 30% van die gehele markt. (dus de optelling van de voorspellingen van de 70% en 30% exportreeksen). Om deze twee vragen goed te kunnen beantwoorden waren meerdere analyses nodig die tijd vergden en daarom werd ervoor gekozen om voor de gehele wereld en de top 15 van landen (met betrekking tot snijbloemen en potplanten) de diagnose te stellen.
In je conclusies geef je aan dat de 70% deelnemers zich uitstekend lenen om de 100% betrouwbaar te kunnen voorspellen. Hoe komt dat? Was dat mazzel?
Tja, ik had dat niet verwacht. Ik had verwacht dat de voorspelfout op basis van 70% en 30% van de markt groter zou zijn dan voor 100% van de markt. In het eerste geval tel je namelijk twee voorspellingen bij elkaar op (70% en 30%) en dus ook twee potentiele voorspelfouten. Een mogelijke verklaring is dat de marktresponses waar exportbedrijven mee te maken hebben steeds in dezelfde lijn liggen, waardoor fluctuaties in de 70% en 30% groep elkaar niet uitschakelen. Een andere mogelijke verklaring is de groeiontwikkeling: als die 70% groep groeit ten opzichte van de die 30% groep, dan wordt die 70% groep steeds belangrijker voor het totaal en dus ook voor de voorspelling van die gehele markt.
Welke elementen worden in het model gebruikt om de ontbrekende 30% te bepalen?
Ja, dat is een goede vraag. Van die ontbrekende 30% hebben we dus alleen de historische HBAG gegevens. Zoals gezegd is die groep gemodelleerd en die modelschattingen kunnen we nu bij de toekomstige 70% groep voegen om tot een 100% marktvoorspelling te komen. Die 30% modellen zijn dus nogal belangrijk. Voor ieder top15 land heb ik vastgesteld of die 30%-groep groeit, krimpt, een baseline-export heeft, en wat de seizoensfluctuaties binnen zo’n land zijn. Die elementen zitten dus in al die modellen.
Bestaat de correctie uit één getal die wordt toegepast op alle cijfers om van 70% naar 100% te komen?
Nee, de correctie bestaat uit meerdere getallen. Dit komt omdat bijvoorbeeld een groei of een krimp twee kengetallen nodig heeft (namelijk een (i) zogeheten intercept en een (ii) zogeheten richtingscoëfficiënt) en omdat de modellen maandmodellen zijn, heeft ook iedere maand heeft zijn eigen maandcorrectie. Zo kom je op meerdere getallen. Als een exportmarkt niet groeit of krimpt en ook geen maandfluctuaties vertoont, ja in zo’n geval, heb je maar een correctiegetal nodig, maar zulke markten bestaan eigenlijk niet.
Welke perioden worden gebruikt in het model? Is het met name dezelfde maand in het vorige jaar?
Op dit moment wordt voor de inschatting van de seizoenspatronen dezelfde maanden in de periode van januari 2009 t/m juni 2013 betrokken (dat zijn dus bijvoorbeeld vijf januari’s (2009, 2010, 2011, 2012, 2013) voor de berekening van het januari effect in 2014). Maar uit een extra analyse, die in eerste instantie was uitgevoerd, kon afgeleid worden dat ook de drie voorafgaande maanden informatie over de huidige maand bevatten. Dit is een ingewikkelde manier om te zeggen dat bijvoorbeeld de export in januari 2014 voor een deel verklaard kan worden door de export in de maanden december, november en oktober 2013. Dit heet, in het vakjargon, seriële correlatie. Er wordt nog gekeken of deze extra informatie op een verantwoorde wijze geïmplementeerd kan worden.
Kan Floridata op basis van een 70% deelname marktcijfers betrouwbaar weergeven?
Ja, dat wil zeggen: voor de bestudeerde top vijftien van landen en de wereld.
Ondertussen doet al ruim 75% mee en gaat het deelname naar 80%. Is dat aanleiding om het model te herzien om de correctie op basis van 80% te baseren?
Nou, iedere maand genereert Floridata nieuwe informatie en natuurlijk is het verstandig om op basis van nieuwe informatie oude modellen te herijken. Maar in dit specifieke project bleek dat die 70%-groep al een adequate inschatting te kunnen geven voor de top15 landenmarkten en dan moet je je afvragen of de kosten van het modelleren van een steeds kleiner wordende groep wel opwegen tegen de baten.
Eigenlijk zou je van te voren een soort grensafspraak moeten maken. Als, bij wijze van spreken, 90% van de exportgegevens voor handen zijn, wie is er dan nog geïnteresseerd in die resterende 10%? Als niemand zijn hand opsteekt, zou je de grens bij 90% kunnen leggen. Hoe de kaarten er bij 80% van de markt voor staan weet ik niet, dat is denk ik, aan de deelnemende bedrijven.
Hoe lang zijn de schattingen betrouwbaar?
Dat hangt van het land af. Het ene land vertoonde veel meer fluctuaties en groei of krimpontwikkelingen dan andere landen. In het algemeen geldt: hoe stabieler een markt hoe betrouwbaarder de voorspellingen.
Wat is u tijdens uw onderzoek opgevallen. Of: wat vond u de leukste bijvangst tijdens de analyse?
Het leukste onderdeel vind ik altijd het combineren van de onderzoeksresultaten, omdat je van tevoren niet weet hoe die onderzoeksresultaten zullen uitpakken. Dat was ook hier het geval. Door, na afloop van analyses de 70%groep tegen de 30% groep van een land uit te zetten, kreeg je meteen een enorm goed gevoel over de dynamiek van zo’n land. Bij sommige landen was het zaak om de competitie met andere exportlanden in de gaten te gaan houden, bij andere landen leek iedereen te kunnen meegroeien met de markt. Al deze informatie zit in de datasets verborgen en dat is een intrigerende gedachte.