Data skills
Data-wijsheid uit zich gelukkig in diverse vormen. Wees dus gerust: je hoeft voorlopig geen data science te leren (al zou dat zeker van pas komen), maar je zult je vocabulaire zeker moeten uitbreiden. In het HBR-artikel ‘Data science and the art of persuasion’ deelt redacteur en zelfverklaard data-viz geek Scott Berinato de belangrijkste data-vaardigheden op in zes handige categorieën:
- Data wrangling
- Data-analyse
- Data & business
- Data & design
- Data & storytelling
- Project management (nu even buiten beschouwing gelaten)
Deze categorieën staan niet gelijk aan functies! Door de overlap tussen de categorieën is het namelijk prima mogelijk dat een breed onderlegde (“T-vormige”) professional meerdere vaardigheden in zijn repertoire heeft.
Een belangrijk onderscheid binnen het spectrum van vaardigheden is de mate waarin er wel of niet ‘technisch’ over data wordt gecommuniceerd. Aan de technische kant van het spectrum gaat het over databases, algoritmes, statistiek en de zuiverheid van data; aan het andere uiteinde gaat het over context, zakelijke doelen en betekenis.
Data wrangling
type communicatie: technisch
Data wrangling is een diepe duik in de data. Een wrangler bekommert zich 100% om de technische kant van data en databases. Dat wil in dit geval zeggen dat hij verantwoordelijk is voor het verzamelen, opschonen en structureren van data. Vervolgens beschikt een wrangler over het inzicht om de juiste statistische algoritmes te ontwikkelen en toe te passen. Hij heeft dus verstand van
machine learning
, coderen, statistiek en database-architectuur.
Data-analyse
type communicatie: grotendeels technisch, vertaling naar non-technisch
Data-analyse vergt algoritmische basiskennis, maar legt vooral de nadruk op een statistische en wetenschappelijke aanpak. Die aanpak is gericht op het ontwikkelen en testen van hypotheses op basis van data om patronen en trends te herkennen en bedrijfsbeslissingen te informeren. De analytische woordenschat is daarom niet geheel technisch. De analist moet in staat zijn om haar analyse in een bredere context te plaatsen en de uitslag van hypotheses op die manier betekenis te geven. Het is daarbij essentieel om niet alleen in technische termen te spreken, maar ook in business-taal.
Data & business
type communicatie: zo min mogelijk technisch, voornamelijk non-technisch
Business-expertise geeft data context, een betekenis en een doel. Grondige data-analyse is veel werk en vooral afhankelijk van heldere vraagstellingen: vragen die op hun beurt afhangen van een doelstelling. Het is dus cruciaal dat iemand waardeert hoe de wetenschappelijke methode om te leren van data kan bijdragen aan strategische bedrijfsdoelstellingen en daar scherpe en kritische vragen bij formuleert. Besef wel dat data binnen het bedrijfskader zijn technische aard ontstijgt. Data-structuren, statistiek en algoritmes zijn hier dus allesbehalve dagelijkse kost.
Data & design
type communicatie: non-technisch, visueel
Data & design heeft betrekking op datavisualisatie in de breedste vorm van het woord en richt zich daarmee op het ontwerp van pure informatie. Het gaat hier niet alleen om communiceren over data, maar nog meer om het communiceren met data. Dat kan gewoon een platte PowerPoint-grafiek zijn, maar een vleugje creativiteit hoeft echt niet te ontbreken om het juiste verhaal te vertellen (zie data & storytelling). Hoewel het nodig is om de betekenis en context van data te begrijpen om het te visualiseren, is technische kennis over algoritmes en statistische analyse geen noodzaak.
Data & storytelling
type communicatie: non-technisch, overtuigend
Uiteindelijk moeten het algoritme, de analyse en de visualisatie nieuwe acties kunnen definiëren in het kader van de bedrijfsdoelstelling. Overtuigingskracht is daarvoor essentieel en daar komt storytelling bij kijken. De verhalende kant van data is de tegenpool van wrangling: je gebruikt het woord algoritme omdat het mooi klinkt, niet omdat je van plan bent om de werking ervan uit te leggen. Datavisualisatie en storytelling worden gebruikt om presentaties te bouwen en rapporten te maken. Ze zijn nodig om mensen te overtuigen en te sturen; ze zijn onmisbaar voor de data-gedreven organisatie.