Data ‘Beter is nog niet goed’

Aanwijzingen voor het gebruik van de dataset ‘Beter is nog niet goed’
Versie 1.0, juli 2022

Licentie
Het gebruik van deze dataset is toegestaan onder de Creative Commons licentie CC BY-NC-SA 4.0.

Doel
Deze data zijn verzameld ten behoeve van het onderzoek Beter is nog niet goed. Doel van dit onderzoek was de verhoudingen tussen het aandeel van vrouwen en mannen in de Nederlandse film- en televisiesector in de periode 2011-2020 in kaart te brengen. Het onderzoek richt zich daarmee op de structurele ongelijkheid tussen vrouwen en mannen en niet op specifieke individuen. We moedigen hergebruik van de data voor soortgelijke doelen aan.

Afbakening van het onderzoek

Vrouwen en mannen
Er is gekozen voor een indeling in vrouwen en mannen. Hoewel dit een problematische vereenvoudiging is van hoe betrokkenen hun genderidentiteit kunnen zien, zou het bij elk betrokken individu navragen van de gewenste genderaanduiding het onderzoek praktisch onuitvoerbaar maken.
Voor het huidige onderzoek is er geen reden om aan te nemen dat het aantal professionals dat zich als niet binair vrouw of man identificeert zo groot is, dat het identificeren van deze groep verregaande consequenties zou hebben voor de uitkomsten. Er is geen aanleiding aan te nemen dat er bij een van de twee, mannen of vrouwen, meer sprake zou zijn van een niet binaire identiteit dan bij de ander. Het onderscheiden van vrouwen, mannen en non-binaire professionals zou daardoor met betrekking tot vrouwen en mannen geen wezenlijk andere resultaten opleveren dan die in het huidige onderzoek.
Desalniettemin zijn aangepaste onderzoeksmethoden, die aan niet binaire identiteiten ruimte geven, voor de nabije toekomst wenselijk, zeker bij kwalitatief onderzoek.

We zijn ons ervan bewust dat ongelijkheid ook wordt veroorzaakt en versterkt door intersectionele aspecten. We moedigen hergebruik van de data met aandacht voor vraagstukken van intersectionaliteit aan.

Periode
Het onderzoek omvat de periode 2011-2020. Deze periode biedt enerzijds ruimte om ontwikkelingen in kaart te brengen en is anderzijds beperkt genoeg om de hoeveelheid data te verwerken.

Dataverzameling
Het Nederlands Film Festival (NFF) en International Documentary Filmfestival Amsterdam (IDFA) hebben data geleverd over de door hun geselecteerde producties. Deze data zijn aangevuld met Fact and Figures van het Nederlands Filmfonds over onder andere budgetten, betrokken distributeurs en omroepen. De NPO leverde overzichten van titels met jaartal en omroep voor fictie en voor documentaire voor de periode 2010-2020.

Verder zijn de data aangevuld met titels en gegevens van o.a. IMDB, websites van producenten, Wikipedia, het NPO fonds, het Cobo-fonds, filmvandaag.nl, tvserieskijken.nl en websites van RTL, Videoland, SBS, en Talpa. Ook is geput uit eigen kennis van de sector. Tot slot zijn de archiefstukken van het Mediafonds (voorheen Stimuleringsfonds Nederlandse Culturele Omroepproducties) geraadpleegd, voor zover digitaal beschikbaar via de website van het Nationaal Archief.

Tijdens dit onderzoek bleek dat veel productiegegevens over lengte, budget, betrokken omroep, distributeur en genre niet openbaar beschikbaar zijn, wat grondig onderzoek naar genderverdeling in relatie tot productiekenmerken bemoeilijkt. De data voor deze variabelen zijn dan ook niet compleet.

Variabelen
Na overleg met de festivals over welke gegevens meegenomen zouden worden in het onderzoek, is besloten het aantal functies uit te breiden ten opzichte van de pilotstudie uit 2020. De gegevens van de volgende functies zijn in de bestanden meegenomen: titel, jaar, genre, producent, regie, scenario, camera, editor, sound design, setgeluid, production design, research (voor documentaire), hoofdrol, bijrol, distributie, omroep, budget, lengte, festivalvertoning en internationale vertoning (NFF, ja/nee).

Databewerking
Aangezien de festivals voor de geselecteerde films de gegevens nauwkeurig hebben gecontroleerd, hebben de onderzoekers zich vooral gericht op het prepareren van de data voor de analyses.
Deze databewerking bestond uit drie onderdelen: formatteren, aanvullen en berekenen. Bij het formatteren gaat het om het vormgeven van de data zodat deze gemakkelijk in het programma SPSS kan worden overgenomen voor de verschillende statistische analyses. Bij het aanvullen gaat het vooral om het zoeken van nog missende gegevens over distributeurs, omroepen en budgetten.

Daarnaast zijn alle producties voorzien van een van de volgende zes ‘typen’: speelfilm, korte film, serie, single play, lange documentaire, korte documentaire. De keuze voor een label is gebaseerd op (soms verschillende) informatie over genres en programma-onderdelen.

Na afronding van deze werkzaamheden hebben de onderzoeksleider en opdrachtgever de data nog aangevuld met missende gegevens en missende producties. Deze laatste betrof met name producties van commerciële zenders. Daarna heeft de onderzoeksleider een aantal controles uitgevoerd, waaronder op dubbele titels en extreme waarden, alvorens met de analyses te beginnen. Waar nodig zijn correcties uitgevoerd.

De data zijn aanvankelijk aangeleverd en bewerkt in Microsoft Excel. Daarna is de dataset geïmporteerd in IBM SPSS. Tot slot zijn alle velden waar geen informatie over bekend was in SPSS gemarkeerd als ‘missing value’ in de vorm van het getal 999.

Voor vragen en meer informatie kunt u zich wenden tot Willemien Sanders via w.sanders@uu.nl.

De dataset
De dataset is beschikbaar als Excel-bestand en als SPSS-bestand. De dataset bevat de gegevens van 2469 Nederlandse film- en televisieproducties uit de periode 2011-2020.

De dataset in excel is hier te downloaden
De dataset in SPSS is op te vragen via info[a]vrouweninbeeld.nl