Datajournalistiek: verhalen die ontstaan uit gegevens
Toen de Britse verpleegkundige Florence Nightingale in 1858 een methode ontwikkelde om kwantitatieve statistieken te visualiseren, om zo de situatie rondom gewonde soldaten in Britse ziekenhuizen doortastender weer te kunnen geven, sprak nog niemand van datajournalistiek. Nu, in het tijdperk van Big Data en Wikileaks, is het onderwerp echter actueler dan ooit.
Toen de Britse verpleegkundige Florence Nightingale in 1858 een methode ontwikkelde om kwantitatieve statistieken te visualiseren, om zo de situatie rondom gewonde soldaten in Britse ziekenhuizen doortastender weer te kunnen geven, sprak nog niemand van datajournalistiek. Nu, in het tijdperk van Big Data en Wikileaks, is het onderwerp echter actueler dan ooit.
Achter de cijfertjes van statistieken kunnen zich vaak interessante verhalen verschuilen. Gerenommeerde media, waaronder de Britse krant The Guardian en The New York Times, weten dit al langere tijd en hebben dan ook een meerkoppig team voor datajournalistiek samengesteld. Maar wat is datajournalistiek precies? En wat betekent ‘Data DrivenJournalism’ voor de auteurs van vandaag?
Florence Nightingales diagram over sterfgevallen binnen het Britse leger
Bron: http://www.theguardian.com/news/datablog/2010/aug/13/florence-nightingale-graphics#
Gedemocratiseerde gegevens
Gegevens staan vandaag de dag niet langer alleen in boeken. Via het internet worden we elke dag overspoeld met grote hoeveelheden data. De bekende namen Wikileaks en Offshore-Leaks zijn bekende voorbeelden van hoe het internet data publiekelijk toegankelijk maakt en democratiseert.
Echter, ook de meest interessante gegevens hebben geen echte waarde totdat iemand de moeite neemt aan het licht te brengen wat achter de cijfers schuilgaat. Dit is het werk van de datajournalist. Zij worstelen zich door grote hoeveelheden Excel-tabellen en statistieken, altijd weer op zoek naar een nieuw verhaal.
Gegevens als uitgangspunt
Natuurlijk zijn statistieken altijd al een onderdeel van journalistiek onderzoek geweest. Binnen klassieke journalistiek dienen statistieken echter vooral ter ondersteuning van argumenten en feiten. Bij datajournalistiek dienen deze cijfers echter als uitgangspunt voor nieuwe verhalen. Uit data verhalen ontwikkelen en de ontdekte feitelijkheden voor het publiek logisch uiteenzetten; zo kan men datajournalistiek definiëren.
“Meestal proberen we een brug te slaan tussen data en de personen die werkelijk willen begrijpen waar het in een verhaal om gaat”. Zo beschrijft Simon Rogers, oprichter van de datablog van The Guardian, de rol van een datajournalist. Kortgezegd gaat het dus om mensen die de opdracht hebben grote hoeveelheden data te analyseren, begrijpen en uit te leggen aan het publiek.
Echt speurwerk
Maar hoe kan men uit ‘droge’ gegevens als cijfers spannende verhalen halen? Het gaat vooral daarom dat een datajournalist als een journalist denkt, en niet als een statisticus, schrijft Rogers over zijn vakgebied. De belangrijkste vragen zijn dan ook: “Wat is interessant aan deze getallen?”, “Wat is nieuw en verassend hieraan” en “Wat gebeurt er als ik deze gegevens samenvoeg met andere gegevens?”.
De verhalen achter statistische gegevens blootleggen is vaak waar speurwerk. Professionele datajournalisten gebruiken dan ook vaak technieken als datamining en webscraping, maar ook zonder deze tools kan men interessante gegevens ontdekken in spreadsheets en databanken – zolang men een paar zaken in het achterhoofd houdt.
Hoe interpreteert men data goed?
Ongeacht of het om schoolverlaters of inbrekers gaat: het interpreteren van grote hoeveelheden data wordt gemakkelijk doormiddel van visualiseren. Programma’s als Excel en OpenOffice Calc maken uit gecompliceerde tabellen gemakkelijke diagrammen. Hierdoor kan men de gegevens vaak in een oogopslag begrijpen.
- Als blijkt dat er afwijkingen of onregelmatigheden in de gegevens voorkomen, kunnen deze belangrijke aanknopingspunten vormen voor een interessant verhaal.
- Hetzelfde geldt voor de uitzonderingen: het bestuderen van de middenmoot is meestal niet interessant, maar de uitzonderingsgevallen kunnen voor een goed verhaal zorgen.
- Om gegevens goed te begrijpen is het vaak handig ze te beschouwen vanuit een groter perspectief. Welke conclusies kunnen bijvoorbeeld getrokken worden uit de gemiddelde schuld van de burgers van een stad? Hoe heeft deze schuld zich in de loop der jaren ontwikkeld? In hoeverre wijkt deze schuld af van het landelijk gemiddelde? Diegene die zich intensief met dergelijke vragen bezighoudt, merkt al snel of er wel of niet een interessant verhaal in de gegevens schuilgaat.
Oriënteren in een jungle met gegevens
Alleen met behulp van goede bronnen kan succesvol datajournalistiek worden bedreven. Het is daarom belangrijk dat een datajournalist alleen gebruikmaakt van betrouwbare bronnen. Maar al te vaak zweven op internet ongecontroleerde gegevens rond. Datajournalisten moeten echter zorgen dat geloofwaardige websites de basis vormen voor het onderzoek. Hierbij kan worden gedacht aan websites van de overheid en onderzoeksinstellingen. Uiteraard is het Centraal Bureau voor de Statistiek (CBS) een goed uitgangspunt.
Ook via minder bekende wegen kan betrouwbare informatie worden gevonden. Voorbeelden daarvan zijn de volgende websites:
- Nationmaster: Of het nu gaat om het gebruik van internet in IJsland of zwaarlijvige mensen in het Midden-Oosten: Nationmaster kent de gegevens. De website heeft uitgebreide mogelijkheden om landen en bevolkingsgroepen vanuit vele criteria te vergelijken.
- Eurostat: Zaken als leefomstandigheden en koopkracht, ze worden op deze website door de Europese Commissie gepubliceerd.
- World Factbook der CIA: De CIA weet meer dan dat wij weten. Een deel van deze informatie komt echter weer online te staan, hetgeen een indrukwekkend resultaat heeft. Wanneer men een specifiek land wil onderzoeken, is deze bron onmisbaar.
- Google Public Data Explorer: Openbare gegevens van een groot aantal organisaties, zoals de Wereldbank en de OESO, zijn hier beschikbaar.
- Google Zeitgeist: Waarnaar heeft de wereldbevolking in 2013 het meest gezocht online? Deze website biedt gegevens met betrekking tot alle zoekopdrachten op Google.
De juiste visualisering: grafisch, interactief en multimediaal
Grote hoeveelheden data zijn alleen toegankelijk als je deze grafisch weergeeft, bijvoorbeeld als tijdsverloop, kaart of diagram. Digitale media bieden daarbij nieuwe mogelijkheden. Grafieken kunnen vandaag de dag bijvoorbeeld 3D zijn, wat voor de komst van de computer niet mogelijk was.
Zo verwerkte de Duitse datajournalist Gregor Aisch de gegevens van de kernramp in het Japanse Fukushima visueel, waarbij hij weergaf hoeveel mensen in Duitsland bij een vergelijkbaar ongeluk gered moeten worden. Een ander voorbeeld is hoe de New York Times een manier vond om tekst, video, foto’s en grafieken te verbinden in hun multimediale weergave ‘SnowFall’. Vergelijkbaar was hoe de krant in ‘Climbing the Income Ladder’visueel de samenhang illustreerde tussen geboorteplaats en inkomen in Amerika.
“In Climbing Income Ladder, Location Matters”
Bron: http://www.nytimes.com/2013/07/22/business/in-climbing-income-ladder-location-matters.html?_r=0
Andere inspirerende voorbeelden van succesvolle visualisatie biedt de datablog van de Guardian: informationisbeautiful.net. Tip: gegevens kunnen gemakkelijk gevisualiseerd worden met behulp van de gratis software Datawrapper.
Getallen als woorden
Ook bij datajournalistiek gaat het om één ding: goede verhalen vertellen op de best mogelijke manier. Dat kan tekst zijn, maar ook zeker als cijfers. Net als voorheen, blijft voor goede journalistiek hard werken noodzakelijk. Het correcte kunnen analyseren van gegevens wordt hierbij steeds belangrijker. Daarbij helpt het kritisch naar gegevens te kijken: wellicht zit er een goed verhaal in verscholen.
geen reacties beschikbaar