Generic

De opkomst van de data scientist

Share this post:

In de film Moneyball wordt Billy Beane manager van de Oakland Athletics, een honkbalteam uit Californië. Vanwege de geldproblemen van de club gebruikt hij een wel heel onorthodoxe manier om resultaten te halen.

door: Marc Teerlink, Global Strategist & Chief Data Scientist bij IBM en Olav Laudy, Worldwide Predictive Analytics Solutions Leader bij IBM

Marc Teerlink,  Global Strategist & Chief Data Scientist bij IBM - marc.teerlink@nl.ibm.com

Marc Teerlink,
Global Strategist & Chief Data Scientist bij IBM – marc.teerlink@nl.ibm.com

Dankzij een compleet door computers gegenereerde analyse vindt hij potentiële nieuwe spelers en stelt hij een team samen voor de World Series. Tijdens de Amerikaanse verkiezingen van 2012 werd Obama´s campagne gerund als het politieke equivalent van Moneyball. Aan iedere beslissing van de campagne ging een cijfermatige analyse vooraf door een klein team, geleid door datawetenschapper Harper Reed. Een ander voorbeeld van voorspellingen op basis van data, zijn die van Nate Silver, een statisticus die in Amerika beroemd werd door zijn accurate voorspellingen voor de presidentsverkiezingen van 2008 en 2012. Silver startte in 2008 zijn datablog FiveThirtyEight waarop hij voorspellingen deed die met algoritmes werden onderbouwd. Ervaren in Moneyball-achtige sportstatistiek voorspelde Silver op basis van de zogenoemde Big Data accuraat de verkiezingsuitkomst van 49 van de 50 staten en 35 van de 2008 ‘senaat races’.

Wat is Big Data?

Het begrip Big Data staat in eerste instantie voor ‘veel’. Door de omvang en snelheid waarmee data gegenereerd worden, zijn ze niet meer met de traditionele technologieën te verwerken. Big Data staat ook voor een veranderlijke snelheid, waarheidsgetrouwheid en variatie. Verder komen data voor in verschillende vormen en formaten, variërend van het merk tandpasta dat je kocht tot de locatie vanwaar je naar kantoor belde. Er zijn ook andere soorten data dan de gebruikelijke lijstjes, formulieren en databases. Denk hierbij aan data die een andere structuur hebben, afkomstig zijn uit sensoren, boeken en documenten, beeld, geluid, gps-locaties of die verkregen zijn door zelf gedane fysieke metingen.

Data scientist: de meest sexy job

Toen de Harvard Business Review in 2012 verklaarde dat de functie van data scientist de meest sexy job van de 21ste eeuw is, werd Twitter gevuld met het gejuich van econometristen, operations-researchprofessionals, actuarissen en statistici. Maar wat doet zo iemand eigenlijk? Dat zal de komende jaren snel duidelijker worden. Steeds meer bedrijven willen de vruchten van Big Data plukken, zodat de taakomschrijving nauwkeuriger wordt ingevuld. Eerder onderzoek toonde aan dat data-analisten een belangrijke en essentiële rol spelen bij de meer succesvolle ondernemingen en verwacht wordt dat deze rol zal toenemen. Helaas is tijdens de besluitvorming niet altijd de boodschap uit die data bruikbaar gemaakt. Niet alleen heeft de data scientist de taak om data te analyseren; hij moet de organisatie ook opleiden om datagebaseerd te denken.

Tekort aan data scientists

De grote uitdaging is dat volgens een McKinsey Studie alleen al in de VS een tekort is van 140.000 tot 190.000 mensen met analytische expertise en 1,5 miljoen managers en analisten met de vaardigheden om beslissingen te nemen op basis van de analyse van Big Data. Het komende tekort aan ervaren Big Data talent bleek ook uit een survey van InformationWeek: 40 procent van de respondenten stelde dat hun personeel in Big Data en analytics in het komende jaar zou uitbreiden. De vraag die uiteraard gesteld wordt: waar is dat talent? En kan een bedrijf zijn bestaande businessanalisten ‘zomaar’ laten doorgroeien tot data scientist?

Data delen is het nieuwe hebben

Businessanalisten zijn vaak niet in staat om te bieden wat het besluitvormingsproces het meeste nodig heeft: inzicht en niet alleen cijfers. Data scientists moeten nieuwsgierig zijn, lang en goed naar data kijken en trends oppikken. De data scientist moet voor alles belangstelling hebben en een organisatie willen veranderen. Hij moet dienen als schakel tussen business en data. Wat vertelt Big Data ons over onze processen? Hoe kunnen wij beter en sneller functioneren? De data scientist moet meer doen dan alleen maar data analyseren of een model creëren. Hij dient ook de data te visualiseren waardoor de analyse van Big Data inzichtelijk gemaakt kan worden, en daarmee voorspellend wordt in plaats van reactief.

How to become a data scientist? Where to start?

How to become a data scientist? Where to start?

Tips voor de beginnende data scientist

1. Begin met de vraag, niet met de Big Data, en beantwoord de juiste vraag

Met Big Data kan het verleidelijk zijn om antwoorden op allerlei interessante vragen na te jagen. Maar als na al het analysewerk blijkt dat de focus ligt op vragen die niemand anders in de organisatie stelde, zul je delen aan het verhaal moeten toevoegen óf je moeten richten op de vragen die belangrijk zijn voor beslissers. Eigenlijk is het je eerste taak om mensen te helpen betere vragen te formuleren.

2. Vertel het verhaal; spreek de taal van je bedrijf

Data scientists houden van hun data. Maar als je wilt worden gehoord, moet je je bevindingen vertalen in de taal die je beoogd publiek spreekt. Begin met het antwoord op de so what-vraag, in plaats van met een uitleg van de methodologie, en gebruik dynamische visualisaties om Big Data tot leven te brengen.

3. Wees bescheiden en valideer samen met businesscollega’s

De meeste data-masseurs trappen soms in de valkuil dat data de werkelijkheid zijn. We worstelen ons door de data en komen dan met een solide, fascinerende, controversiële conclusie. Ons instinct is om dan naar de dichtstbijzijnde beslisser te lopen en te zeggen: ‘Kijk! Je moet het bedrijf veranderen!’ Maar het is heel goed mogelijk dat we niet het volledige beeld hebben. Een of twee keer vals alarm kan gemakkelijk de geloofwaardigheid van Big Data analytics ondermijnen. Het is dus essentieel om eerst een aantal aannames en conclusies te valideren met degenen die een goed inzicht hebben in het bedrijf. Laat hen delen in het spel en de erkenning. Luister naar hen. Het is een win-winsituatie.

Conclusie

Met de huidige technologie is het verzamelen en ontsluiten van Big Data eenvoudig geworden. Moeilijker wordt het om met echt inzicht te komen. De hoofdprijs komt pas bij het effectief communiceren van deze inzichten. Hoe meer nederigheid we kunnen opbrengen over ons vermogen om voorspellingen te doen, des te meer succes we zullen hebben in het plannen voor de toekomst.

 

More stories

Is regulation enabling or hindering innovation in the financial services industry?

Anne Leslie, Cloud Risk & Controls Leader Europe, IBM Cloud for Financial Services Europe’s financial services sector is in the throes of wide scale digital transformation – a transition being accelerated by the growing adoption of digital solutions and services to help keep up with the demands of digitally savvy consumers. While there can be […]

Continue reading

The Digital Operational Resilience Act for Financial Services: Harmonised rules, broader scope of application

The Digital Operational Resilience Act – what and why As part of the European Commission’s Digital Finance Package, the new Digital Operational Resilience Act, or in short DORA, will come into force in the coming period. The aim of DORA is to establish uniform requirements across the EU that improve the cybersecurity and operational resilience […]

Continue reading

Banking on empathy

Suppose you’re owning a small boutique wine shop and have gone through two difficult years because of the Covid-19 pandemic. As the pandemic seems to be on its way back, it is time to revitalize the shop. And this causes direct a huge challenge: the wine stock needs to be replenished but you have used […]

Continue reading